Microexon ID Ha_6:37045237-37045245:-
Species Helianthus annuus
Coordinates 6:37045237..37045245
Microexon Cluster ID MEP22
Size 9
Phase 1
Pfam Domain Motif Glyco_hydro_32N
Structure of Microexon-tag (flanking exon, microexon, flanking exon sizes) 49,9,50
Microexon location in the Microexon-tag 2
Microexon-tag DNA Seq YSKYAMMGRACYGSYTWYCAYTTYCARCCYSMCAARAAYTGGATGAAYGATCCYAAYGGTCCAATGTWYTACAAGGGATKGTACCAYYTSTTCTAYCARTACAAYCCV
Logo of Microexon-tag DNA Seq NT60 Logo
Alignment of exons MSA
Microexon DNA seq ACCCGAATG
Microexon Amino Acid seq DPNA
Microexon-tag DNA Seq CTTTACAGAACTGGTTACCACTTTCAACCTAAACAGAATTGGATTAATGACCCGAATGCTCCTATGTACTATAAGGGATACTATCACTTATTCTACCAATATAACCCA
Microexon-tag Amino Acid Seq LYRTGYHFQPKQNWINDPNAPMYYKGYYHLFYQYNP
Microexon-tag spanning region37045065-37047259
Microexon-tag prediction score0.9388
Overlapped with the annotated transcript (%) 100
New Transcript ID OTG22863x
Reference Transcript ID OTG22863
Gene ID HannXRQ_Chr06g0176101
Gene Name INV1
Transcript ID OTG22863
Protein ID OTG22863
Gene ID HannXRQ_Chr06g0176101
Gene Name INV1
Pfam domain motif Glyco_hydro_32N
Motif E-value 4.9e-104
Motif start 58
Motif end 377
Protein seq >OTG22863
MMRVFTKMFWVIALVCLFPLLDNINGGGGGVMAFHKEYIHYQLTTTNNVDQLYRTGYHFQPKQNWINDPNAPMYYKGYYH
LFYQYNPKGAVWGNIVWAHSVSKDMINWIPLEPAIVPSKPFDKYGCWSGSTTILPGNKPVILYTGIIDLKPAPGHQVQNY
AIPANYSDPLLREWIKPDDNPIVKPTSENVSSFRDPTTAWFNNGHWKMTVGSKHNKRGIVYLYRSRDFVKWTKAKHTLHD
KKDTGMWECPDFFPVSTQGTNGVETSALMGGIKHVLKVSLDVTRFEYYTIGTYNTMKDKYYPDSTSVDGWAGLRYDYGNF
YASKTFFDPVQKRRILWGWANESSTTAEDVAKGWAGIQLIPRMVWLDPSGKQLVQWPIHELKTLRGEKVHRRNVKLNKGD
IVEVKGITAAQADVEASFKFSSLDEAETFDPKWSKLPAENLALEICGITGTKQGGLGPFGFLTLASNKLEEHTPVFFRIF
KTTDNKHKILMCSDAKPSSLNKGTYRPSFAGFVDVDLSKKKLSLKSLIDHSVVESFGEGGKTVITSRVYPTLAVGKHAHL
YLFNNGTETVTVDRLDAWSMKNPLLMN*
CDS seq >OTG22863
ATGATGAGGGTTTTCACTAAAATGTTCTGGGTGATTGCATTGGTGTGTTTGTTTCCATTGTTGGATAATATCAATGGCGG
AGGAGGAGGAGTTATGGCTTTTCACAAGGAATATATCCACTATCAACTGACCACTACAAACAACGTCGATCAACTTTACA
GAACTGGTTACCACTTTCAACCTAAACAGAATTGGATTAATGACCCGAATGCTCCTATGTACTATAAGGGATACTATCAC
TTATTCTACCAATATAACCCAAAGGGTGCAGTTTGGGGTAATATTGTATGGGCACACTCGGTTTCAAAGGACATGATCAA
CTGGATTCCCTTAGAACCAGCAATCGTACCATCAAAACCTTTTGATAAATACGGTTGTTGGTCTGGCTCGACCACTATCC
TTCCAGGAAACAAACCTGTTATTTTGTACACTGGAATTATTGACCTAAAGCCCGCACCAGGCCACCAAGTTCAAAACTAT
GCAATACCAGCAAACTATTCAGACCCACTTCTAAGAGAGTGGATCAAGCCTGATGATAATCCAATAGTAAAACCAACTTC
AGAGAACGTGTCGTCTTTTCGTGACCCAACAACTGCTTGGTTCAATAATGGTCACTGGAAAATGACCGTAGGCAGTAAGC
ATAACAAACGAGGTATCGTTTACTTGTACAGGAGCCGAGATTTTGTCAAGTGGACTAAGGCCAAGCATACACTTCATGAC
AAAAAGGATACGGGTATGTGGGAATGTCCCGACTTTTTCCCTGTATCAACCCAAGGAACGAACGGAGTGGAAACCTCCGC
GCTAATGGGAGGAATTAAACATGTGCTTAAGGTTAGCCTTGATGTGACTAGGTTCGAGTATTACACGATTGGGACATATA
ACACAATGAAGGATAAATATTACCCTGATAGCACTTCTGTTGATGGTTGGGCTGGTTTAAGATATGATTATGGAAATTTT
TATGCATCAAAGACTTTCTTTGATCCTGTTCAAAAACGAAGGATTCTATGGGGTTGGGCTAATGAATCTAGCACCACCGC
GGAAGATGTCGCAAAGGGTTGGGCTGGAATTCAGTTGATTCCACGTATGGTGTGGTTGGACCCTAGTGGAAAGCAATTAG
TACAATGGCCAATTCATGAATTGAAAACGTTAAGAGGTGAGAAGGTGCACCGGCGTAATGTGAAGCTCAACAAGGGTGAC
ATTGTTGAGGTCAAAGGAATTACCGCTGCGCAGGCGGATGTGGAAGCAAGCTTTAAATTTTCGAGCTTGGATGAAGCTGA
GACATTTGATCCTAAATGGTCTAAGTTACCCGCGGAAAATCTTGCGTTGGAGATATGTGGTATCACGGGTACTAAACAAG
GGGGCTTGGGTCCATTCGGGTTTTTAACTTTGGCCTCGAACAAATTGGAAGAGCACACTCCTGTATTTTTCAGGATTTTC
AAGACCACTGACAACAAGCATAAGATTCTTATGTGTTCCGACGCTAAACCTTCCTCATTGAACAAGGGTACGTATAGGCC
ATCATTTGCGGGCTTCGTGGATGTTGATCTATCCAAAAAGAAGCTATCCCTCAAGAGTTTGATTGATCACTCGGTTGTAG
AGAGCTTTGGAGAGGGTGGAAAGACGGTTATAACTTCCAGAGTTTATCCGACGCTAGCAGTGGGCAAACATGCACATTTG
TATCTATTTAACAACGGTACTGAGACTGTTACTGTTGATAGATTGGATGCTTGGTCAATGAAGAATCCTCTTCTGATGAA
TTAA
Microexon DNA seq ACCCGAATG
Microexon Amino Acid seq DPNA
Microexon-tag DNA Seq CTTTACAGAACTGGTTACCACTTTCAACCTAAACAGAATTGGATTAATGACCCGAATGCTCCTATGTACTATAAGGGATACTATCACTTATTCTACCAATATAACCCA
Microexon-tag Amino Acid seq LYRTGYHFQPKQNWINDPNAPMYYKGYYHLFYQYNP
Transcript ID OTG22863
Gene ID Ha.48171
Gene Name INV1
Pfam domain motif Glyco_hydro_32N
Motif E-value 4.9e-104
Motif start 58
Motif end 377
Protein seq >OTG22863
MMRVFTKMFWVIALVCLFPLLDNINGGGGGVMAFHKEYIHYQLTTTNNVDQLYRTGYHFQPKQNWINDPNAPMYYKGYYH
LFYQYNPKGAVWGNIVWAHSVSKDMINWIPLEPAIVPSKPFDKYGCWSGSTTILPGNKPVILYTGIIDLKPAPGHQVQNY
AIPANYSDPLLREWIKPDDNPIVKPTSENVSSFRDPTTAWFNNGHWKMTVGSKHNKRGIVYLYRSRDFVKWTKAKHTLHD
KKDTGMWECPDFFPVSTQGTNGVETSALMGGIKHVLKVSLDVTRFEYYTIGTYNTMKDKYYPDSTSVDGWAGLRYDYGNF
YASKTFFDPVQKRRILWGWANESSTTAEDVAKGWAGIQLIPRMVWLDPSGKQLVQWPIHELKTLRGEKVHRRNVKLNKGD
IVEVKGITAAQADVEASFKFSSLDEAETFDPKWSKLPAENLALEICGITGTKQGGLGPFGFLTLASNKLEEHTPVFFRIF
KTTDNKHKILMCSDAKPSSLNKGTYRPSFAGFVDVDLSKKKLSLKSLIDHSVVESFGEGGKTVITSRVYPTLAVGKHAHL
YLFNNGTETVTVDRLDAWSMKNPLLMN*
CDS seq >OTG22863
ATGATGAGGGTTTTCACTAAAATGTTCTGGGTGATTGCATTGGTGTGTTTGTTTCCATTGTTGGATAATATCAATGGCGG
AGGAGGAGGAGTTATGGCTTTTCACAAGGAATATATCCACTATCAACTGACCACTACAAACAACGTCGATCAACTTTACA
GAACTGGTTACCACTTTCAACCTAAACAGAATTGGATTAATGACCCGAATGCTCCTATGTACTATAAGGGATACTATCAC
TTATTCTACCAATATAACCCAAAGGGTGCAGTTTGGGGTAATATTGTATGGGCACACTCGGTTTCAAAGGACATGATCAA
CTGGATTCCCTTAGAACCAGCAATCGTACCATCAAAACCTTTTGATAAATACGGTTGTTGGTCTGGCTCGACCACTATCC
TTCCAGGAAACAAACCTGTTATTTTGTACACTGGAATTATTGACCTAAAGCCCGCACCAGGCCACCAAGTTCAAAACTAT
GCAATACCAGCAAACTATTCAGACCCACTTCTAAGAGAGTGGATCAAGCCTGATGATAATCCAATAGTAAAACCAACTTC
AGAGAACGTGTCGTCTTTTCGTGACCCAACAACTGCTTGGTTCAATAATGGTCACTGGAAAATGACCGTAGGCAGTAAGC
ATAACAAACGAGGTATCGTTTACTTGTACAGGAGCCGAGATTTTGTCAAGTGGACTAAGGCCAAGCATACACTTCATGAC
AAAAAGGATACGGGTATGTGGGAATGTCCCGACTTTTTCCCTGTATCAACCCAAGGAACGAACGGAGTGGAAACCTCCGC
GCTAATGGGAGGAATTAAACATGTGCTTAAGGTTAGCCTTGATGTGACTAGGTTCGAGTATTACACGATTGGGACATATA
ACACAATGAAGGATAAATATTACCCTGATAGCACTTCTGTTGATGGTTGGGCTGGTTTAAGATATGATTATGGAAATTTT
TATGCATCAAAGACTTTCTTTGATCCTGTTCAAAAACGAAGGATTCTATGGGGTTGGGCTAATGAATCTAGCACCACCGC
GGAAGATGTCGCAAAGGGTTGGGCTGGAATTCAGTTGATTCCACGTATGGTGTGGTTGGACCCTAGTGGAAAGCAATTAG
TACAATGGCCAATTCATGAATTGAAAACGTTAAGAGGTGAGAAGGTGCACCGGCGTAATGTGAAGCTCAACAAGGGTGAC
ATTGTTGAGGTCAAAGGAATTACCGCTGCGCAGGCGGATGTGGAAGCAAGCTTTAAATTTTCGAGCTTGGATGAAGCTGA
GACATTTGATCCTAAATGGTCTAAGTTACCCGCGGAAAATCTTGCGTTGGAGATATGTGGTATCACGGGTACTAAACAAG
GGGGCTTGGGTCCATTCGGGTTTTTAACTTTGGCCTCGAACAAATTGGAAGAGCACACTCCTGTATTTTTCAGGATTTTC
AAGACCACTGACAACAAGCATAAGATTCTTATGTGTTCCGACGCTAAACCTTCCTCATTGAACAAGGGTACGTATAGGCC
ATCATTTGCGGGCTTCGTGGATGTTGATCTATCCAAAAAGAAGCTATCCCTCAAGAGTTTGATTGATCACTCGGTTGTAG
AGAGCTTTGGAGAGGGTGGAAAGACGGTTATAACTTCCAGAGTTTATCCGACGCTAGCAGTGGGCAAACATGCACATTTG
TATCTATTTAACAACGGTACTGAGACTGTTACTGTTGATAGATTGGATGCTTGGTCAATGAAGAATCCTCTTCTGATGAA
TTAA