Database of MicroExons in Plants - microexon

Microexon ID	Ps_NC_039364.1:43922208-43922216:-
Species	Papaver somniferum
Coordinates	NC_039364.1:43922208..43922216
Microexon Cluster ID	MEP22
Size	9
Phase	1
Pfam Domain Motif	Glyco_hydro_32N
Structure of Microexon-tag (flanking exon, microexon, flanking exon sizes)	49,9,50
Microexon location in the Microexon-tag	2
Microexon-tag DNA Seq	YSKYAMMGRACYGSYTWYCAYTTYCARCCYSMCAARAAYTGGATGAAYGATCCYAAYGGTCCAATGTWYTACAAGGGATKGTACCAYYTSTTCTAYCARTACAAYCCV
Logo of Microexon-tag DNA Seq
Alignment of exons

Microexon DNA seq	ATCCTAATG
Microexon Amino Acid seq	DPNG
Microexon-tag DNA Seq	TGGCAAAGAACATCTTATCATTTCCAACCTCAACGAAATTGGATGAATGATCCTAATGGTCCATTGTATTACAAAGGATGGTATCATTTCTTCTATCAGTACAATCCG
Microexon-tag Amino Acid Seq	WQRTSYHFQPQRNWMNDPNGPLYYKGWYHFFYQYNP
Microexon-tag spanning region	43920669-43922420
Microexon-tag prediction score	0.958
Overlapped with the annotated transcript (%)	100
New Transcript ID	XM_026545547.1x
Reference Transcript ID	XM_026545547.1
Gene ID	NA
Gene Name	NA

Transcript ID	XM_026545547.1
Protein ID	XP_026401332.1
Gene ID	LOC113297137
Gene Name	NA
Pfam domain motif	Glyco_hydro_32N
Motif E-value	3e-108
Motif start	127
Motif end	446
Protein seq	>XP_026401332.1 MDSTSRITDLESAVNECSYTTLPDHHTPSEDSSSVNGFKPLKSFAYTFSIVLFICSTVLVLVGDHQRSEILYSILPPISK ITPSVVVPSRGVSEGVSEKSNANNLFAASNPFPWTNNMLSWQRTSYHFQPQRNWMNDPNGPLYYKGWYHFFYQYNPEGAV WGNIVWGHAVSKDLIHWQYLPIAMVPDKWYDSNGVWTGSATILPDGSLVMLYTGSTNESVQVQNVAYPADPNDPLLVEWV KYENNPVLLPPPGIGSKDFRDPTTAWRTPNGNWKITIGSRLNTTLGMAVVYETPDFINYKLKEGLLHAVPGTGMWECVDL YPVSTVDENGLDTSVNGPHVKHVLKASLDDDKKDYYALGVYDEAKDVWTPDNPEIDVGIGLKYDYGHFYASKTFYDQHKE RRILWGWIGETDSERADVEKGWSSVQAVPREVTFDKKTKTNLIQWPVEEVEDLRLSSKKFEDVKVETGSVLHLDVDTATQ VDITAEFEIDEKALEGVMEADVGYNCTTSGGAAGRGALGPFGLLVLADGSRTEQTAIYFYIAKGVDGNLNTFFCTDQSRS SKASDVNKQIYGSTVPVLKGEKLSMRLLVDHSIVEAFAQGGRTCITSRVYPTEAIYGASRVFLFNNATGVSVTAKKVKIW EMNSAFLHPYHFSAASVSHVTSLYVLAMILFSGLINMFIF*
CDS seq	>XM_026545547.1 ATGGACAGCACCAGTAGAATTACAGATCTCGAAAGTGCTGTAAATGAATGTTCTTACACTACTTTACCAGATCATCATAC TCCATCAGAAGATTCTTCTTCTGTAAATGGATTTAAACCATTAAAGAGTTTTGCTTATACTTTTTCGATCGTTTTGTTTA TTTGTTCTACTGTTTTGGTTTTAGTCGGAGATCACCAAAGATCTGAAATTCTTTATTCAATTTTACCACCAATCAGTAAA ATCACTCCGTCCGTAGTAGTACCGTCAAGAGGTGTTTCTGAAGGTGTTTCAGAAAAATCTAATGCCAATAATTTGTTCGC TGCTTCAAACCCATTTCCATGGACTAATAATATGCTGTCCTGGCAAAGAACATCTTATCATTTCCAACCTCAACGAAATT GGATGAATGATCCTAATGGTCCATTGTATTACAAAGGATGGTATCATTTCTTCTATCAGTACAATCCGGAAGGCGCAGTA TGGGGCAACATCGTTTGGGGTCATGCAGTATCAAAAGATCTAATTCACTGGCAATACCTACCTATAGCCATGGTACCTGA TAAATGGTATGACAGCAACGGTGTTTGGACTGGCTCAGCAACAATTTTACCGGACGGCTCACTCGTAATGCTCTACACTG GATCCACAAACGAATCCGTGCAAGTTCAAAACGTAGCATACCCAGCTGATCCAAATGATCCTCTCCTTGTTGAATGGGTT AAATATGAAAACAATCCGGTTTTGTTACCACCACCTGGAATCGGTTCCAAAGATTTCCGTGATCCAACCACTGCTTGGAG GACACCAAATGGAAATTGGAAGATAACAATCGGGTCGAGATTGAACACAACATTAGGCATGGCGGTTGTTTACGAAACAC CCGATTTTATCAACTACAAATTGAAAGAAGGATTATTGCATGCAGTTCCCGGTACTGGTATGTGGGAATGTGTTGATCTG TACCCAGTTTCTACTGTCGATGAAAATGGACTCGATACATCTGTTAACGGACCTCATGTCAAACATGTTTTGAAAGCTAG TCTTGACGATGATAAAAAGGATTATTATGCACTTGGGGTTTATGATGAGGCTAAGGATGTTTGGACCCCAGATAACCCTG AAATAGATGTTGGGATTGGACTGAAGTATGATTATGGTCATTTCTATGCGTCAAAGACATTCTACGATCAGCATAAAGAA AGAAGGATTTTGTGGGGTTGGATTGGTGAGACCGACAGCGAACGAGCTGACGTAGAGAAAGGATGGTCCTCTGTGCAGGC TGTTCCAAGAGAAGTGACATTTGATAAGAAAACCAAGACCAATTTGATTCAATGGCCTGTGGAGGAAGTTGAGGATTTGA GATTATCCAGTAAGAAATTCGAGGATGTTAAGGTTGAAACTGGATCCGTCCTTCACCTTGATGTTGATACAGCTACACAG GTAGATATAACCGCAGAATTTGAAATTGATGAGAAGGCTTTGGAGGGAGTAATGGAAGCAGACGTGGGTTACAATTGTAC AACTAGTGGAGGTGCTGCAGGAAGAGGTGCATTGGGACCATTCGGATTGTTGGTGCTTGCAGACGGCAGTCGAACAGAGC AAACAGCCATCTATTTTTACATTGCAAAGGGTGTAGATGGAAATCTCAACACTTTCTTCTGCACTGATCAATCTAGATCT TCTAAGGCAAGTGATGTCAATAAACAGATTTATGGTAGCACAGTTCCTGTACTAAAAGGCGAAAAACTTTCAATGAGGCT ATTGGTGGATCATTCAATAGTTGAAGCTTTTGCTCAAGGAGGAAGGACTTGTATAACATCTCGAGTCTATCCAACAGAAG CGATATATGGAGCATCAAGAGTTTTCCTATTCAACAATGCAACTGGGGTGAGTGTCACTGCCAAAAAGGTCAAGATATGG GAAATGAATTCTGCTTTTCTTCATCCTTACCATTTCTCAGCAGCATCAGTATCACATGTAACTAGTCTATATGTTCTTGC TATGATATTATTTTCCGGTCTCATCAATATGTTCATCTTTTAG

Microexon DNA seq	ATCCTAATG
Microexon Amino Acid seq	DPNG
Microexon-tag DNA Seq	TGGCAAAGAACATCTTATCATTTCCAACCTCAACGAAATTGGATGAATGATCCTAATGGTCCATTGTATTACAAAGGATGGTATCATTTCTTCTATCAGTACAATCCG
Microexon-tag Amino Acid seq	WQRTSYHFQPQRNWMNDPNGPLYYKGWYHFFYQYNP
Transcript ID	XM_026545547.1
Gene ID	Ps.41601
Gene Name	NA
Pfam domain motif	Glyco_hydro_32N
Motif E-value	3e-108
Motif start	127
Motif end	446
Protein seq	>XM_026545547.1 MDSTSRITDLESAVNECSYTTLPDHHTPSEDSSSVNGFKPLKSFAYTFSIVLFICSTVLVLVGDHQRSEILYSILPPISK ITPSVVVPSRGVSEGVSEKSNANNLFAASNPFPWTNNMLSWQRTSYHFQPQRNWMNDPNGPLYYKGWYHFFYQYNPEGAV WGNIVWGHAVSKDLIHWQYLPIAMVPDKWYDSNGVWTGSATILPDGSLVMLYTGSTNESVQVQNVAYPADPNDPLLVEWV KYENNPVLLPPPGIGSKDFRDPTTAWRTPNGNWKITIGSRLNTTLGMAVVYETPDFINYKLKEGLLHAVPGTGMWECVDL YPVSTVDENGLDTSVNGPHVKHVLKASLDDDKKDYYALGVYDEAKDVWTPDNPEIDVGIGLKYDYGHFYASKTFYDQHKE RRILWGWIGETDSERADVEKGWSSVQAVPREVTFDKKTKTNLIQWPVEEVEDLRLSSKKFEDVKVETGSVLHLDVDTATQ VDITAEFEIDEKALEGVMEADVGYNCTTSGGAAGRGALGPFGLLVLADGSRTEQTAIYFYIAKGVDGNLNTFFCTDQSRS SKASDVNKQIYGSTVPVLKGEKLSMRLLVDHSIVEAFAQGGRTCITSRVYPTEAIYGASRVFLFNNATGVSVTAKKVKIW EMNSAFLHPYHFSAASVSHVTSLYVLAMILFSGLINMFIF*
CDS seq	>XM_026545547.1 ATGGACAGCACCAGTAGAATTACAGATCTCGAAAGTGCTGTAAATGAATGTTCTTACACTACTTTACCAGATCATCATAC TCCATCAGAAGATTCTTCTTCTGTAAATGGATTTAAACCATTAAAGAGTTTTGCTTATACTTTTTCGATCGTTTTGTTTA TTTGTTCTACTGTTTTGGTTTTAGTCGGAGATCACCAAAGATCTGAAATTCTTTATTCAATTTTACCACCAATCAGTAAA ATCACTCCGTCCGTAGTAGTACCGTCAAGAGGTGTTTCTGAAGGTGTTTCAGAAAAATCTAATGCCAATAATTTGTTCGC TGCTTCAAACCCATTTCCATGGACTAATAATATGCTGTCCTGGCAAAGAACATCTTATCATTTCCAACCTCAACGAAATT GGATGAATGATCCTAATGGTCCATTGTATTACAAAGGATGGTATCATTTCTTCTATCAGTACAATCCGGAAGGCGCAGTA TGGGGCAACATCGTTTGGGGTCATGCAGTATCAAAAGATCTAATTCACTGGCAATACCTACCTATAGCCATGGTACCTGA TAAATGGTATGACAGCAACGGTGTTTGGACTGGCTCAGCAACAATTTTACCGGACGGCTCACTCGTAATGCTCTACACTG GATCCACAAACGAATCCGTGCAAGTTCAAAACGTAGCATACCCAGCTGATCCAAATGATCCTCTCCTTGTTGAATGGGTT AAATATGAAAACAATCCGGTTTTGTTACCACCACCTGGAATCGGTTCCAAAGATTTCCGTGATCCAACCACTGCTTGGAG GACACCAAATGGAAATTGGAAGATAACAATCGGGTCGAGATTGAACACAACATTAGGCATGGCGGTTGTTTACGAAACAC CCGATTTTATCAACTACAAATTGAAAGAAGGATTATTGCATGCAGTTCCCGGTACTGGTATGTGGGAATGTGTTGATCTG TACCCAGTTTCTACTGTCGATGAAAATGGACTCGATACATCTGTTAACGGACCTCATGTCAAACATGTTTTGAAAGCTAG TCTTGACGATGATAAAAAGGATTATTATGCACTTGGGGTTTATGATGAGGCTAAGGATGTTTGGACCCCAGATAACCCTG AAATAGATGTTGGGATTGGACTGAAGTATGATTATGGTCATTTCTATGCGTCAAAGACATTCTACGATCAGCATAAAGAA AGAAGGATTTTGTGGGGTTGGATTGGTGAGACCGACAGCGAACGAGCTGACGTAGAGAAAGGATGGTCCTCTGTGCAGGC TGTTCCAAGAGAAGTGACATTTGATAAGAAAACCAAGACCAATTTGATTCAATGGCCTGTGGAGGAAGTTGAGGATTTGA GATTATCCAGTAAGAAATTCGAGGATGTTAAGGTTGAAACTGGATCCGTCCTTCACCTTGATGTTGATACAGCTACACAG GTAGATATAACCGCAGAATTTGAAATTGATGAGAAGGCTTTGGAGGGAGTAATGGAAGCAGACGTGGGTTACAATTGTAC AACTAGTGGAGGTGCTGCAGGAAGAGGTGCATTGGGACCATTCGGATTGTTGGTGCTTGCAGACGGCAGTCGAACAGAGC AAACAGCCATCTATTTTTACATTGCAAAGGGTGTAGATGGAAATCTCAACACTTTCTTCTGCACTGATCAATCTAGATCT TCTAAGGCAAGTGATGTCAATAAACAGATTTATGGTAGCACAGTTCCTGTACTAAAAGGCGAAAAACTTTCAATGAGGCT ATTGGTGGATCATTCAATAGTTGAAGCTTTTGCTCAAGGAGGAAGGACTTGTATAACATCTCGAGTCTATCCAACAGAAG CGATATATGGAGCATCAAGAGTTTTCCTATTCAACAATGCAACTGGGGTGAGTGTCACTGCCAAAAAGGTCAAGATATGG GAAATGAATTCTGCTTTTCTTCATCCTTACCATTTCTCAGCAGCATCAGTATCACATGTAACTAGTCTATATGTTCTTGC TATGATATTATTTTCCGGTCTCATCAATATGTTCATCTTTTAG