Database of MicroExons in Plants - microexon

Microexon ID	Ps_NC_039364.1:102111603-102111611:+
Species	Papaver somniferum
Coordinates	NC_039364.1:102111603..102111611
Microexon Cluster ID	MEP21
Size	9
Phase	1
Pfam Domain Motif	AP2
Structure of Microexon-tag (flanking exon, microexon, flanking exon sizes)	49,9,50
Microexon location in the Microexon-tag	2
Microexon-tag DNA Seq	TGGGAYAAYAGYWSYWGRARWGARRGYCARAVYARGAARGGAARRCAAGTTTAYYTRGGKGSWTATGAYRAKGARGARRMWGCWGCWMGRGCWTATGAYYTDGCWGCW
Logo of Microexon-tag DNA Seq
Alignment of exons

Microexon DNA seq	TGTTTTTAG
Microexon Amino Acid seq	VFLG
Microexon-tag DNA Seq	TGGGATAACAGCTACATAAGAGAAGGTCATAGACGTAAAGGCAAGCAAGTGTTTTTAGGTCAATATGACAATGAGGAGAAAGCAGCGCAGTCTTATGACCTTGTAGCT
Microexon-tag Amino Acid Seq	WDNSYIREGHRRKGKQVFLGQYDNEEKAAQSYDLVA
Microexon-tag spanning region	102110168-102111772
Microexon-tag prediction score	0.8998
Overlapped with the annotated transcript (%)	100
New Transcript ID	XM_026546619.1x
Reference Transcript ID	XM_026546619.1
Gene ID	NA
Gene Name	NA

Transcript ID	XM_026546619.1
Protein ID	XP_026402404.1
Gene ID	LOC113297994
Gene Name	NA
Pfam domain motif	AP2
Motif E-value	9.9e-10
Motif start	203
Motif end	262
Protein seq	>XP_026402404.1 MAFMNLLDERSSLDDEGHFNTNIFIKLQDSDEGCFESSFLENAQSTVPFIVVNEKPSDYMVSLVNPTVNENCDGPPSDDT ELEPHPSLADEQAPELLRIQAVGQEVYGVCRSTNTESKSLSRSENEKILEREDVSLSTNSCHEENAESQNSQSVLVSGTA MFLNLEHADDLVCSDEEKNLGEFVPPEVSTPIKSIQKVDHRTSKYHGVTRHFWTGKFEAHLWDNSYIREGHRRKGKQVFL GQYDNEEKAAQSYDLVALKYWGLHASTRLNFPISTYKKQLEEMKEMSKEEFVMYIRRNSCFKKGSSVYRGVTRHGDGRWQ ARISGIPGRRGLHLGTFSSEEEAAKAYDIASIRYRGMKAFTNFDVSNYSPLDLKESEEQLPEPKKLKKDVNLSESTIVIA KSDPRQDVRTQTV*
CDS seq	>XM_026546619.1 ATGGCATTTATGAATCTACTAGATGAGCGTTCCAGTTTGGACGATGAGGGGCATTTTAATACCAATATATTCATTAAACT TCAAGATTCTGATGAGGGATGTTTTGAATCTTCATTCCTGGAAAATGCGCAATCAACAGTTCCTTTTATAGTAGTTAATG AGAAACCTTCAGATTATATGGTATCACTTGTAAATCCAACTGTGAACGAAAATTGTGATGGCCCACCTTCAGATGATACT GAATTAGAACCTCATCCCAGCTTGGCAGATGAACAAGCGCCAGAGCTTTTAAGAATACAGGCGGTGGGCCAGGAAGTATA CGGGGTTTGTAGATCAACTAACACTGAGTCTAAGTCTCTTTCGAGATCAGAGAATGAGAAAATCCTAGAGAGGGAAGACG TTTCTCTTAGTACCAATTCATGTCATGAGGAAAATGCTGAGTCACAGAATTCTCAGTCTGTTCTGGTTTCAGGCACCGCG ATGTTCTTGAATTTAGAACATGCTGACGACCTTGTTTGCAGTGATGAGGAAAAGAACCTTGGGGAGTTCGTTCCTCCCGA AGTTTCTACTCCAATAAAATCAATTCAGAAGGTTGACCACCGAACATCAAAATACCATGGAGTTACTAGACACTTTTGGA CTGGAAAATTTGAAGCACACCTTTGGGATAACAGCTACATAAGAGAAGGTCATAGACGTAAAGGCAAGCAAGTGTTTTTA GGTCAATATGACAATGAGGAGAAAGCAGCGCAGTCTTATGACCTTGTAGCTCTCAAATACTGGGGTCTTCATGCAAGTAC CAGATTAAATTTCCCTATTTCTACTTACAAGAAACAACTCGAAGAGATGAAGGAAATGTCAAAAGAGGAGTTTGTCATGT ACATTAGGAGGAATAGTTGCTTCAAAAAAGGATCTTCTGTTTATAGAGGCGTGACAAGACATGGAGATGGCCGGTGGCAA GCTCGAATAAGTGGAATACCTGGAAGAAGGGGACTTCACCTTGGGACATTCAGTAGTGAGGAAGAGGCTGCTAAAGCTTA CGATATCGCTTCTATCAGATATAGAGGCATGAAGGCTTTCACAAATTTTGATGTCAGTAACTATTCTCCGCTGGATTTAA AAGAATCAGAGGAACAACTACCTGAACCAAAAAAACTAAAGAAGGATGTTAATCTTAGTGAGTCTACAATTGTTATTGCT AAGTCAGATCCTCGCCAGGATGTTAGAACTCAGACAGTATGA

Microexon DNA seq	TGTTTTTAG
Microexon Amino Acid seq	VFLG
Microexon-tag DNA Seq	TGGGATAACAGCTACATAAGAGAAGGTCATAGACGTAAAGGCAAGCAAGTGTTTTTAGGTCAATATGACAATGAGGAGAAAGCAGCGCAGTCTTATGACCTTGTAGCT
Microexon-tag Amino Acid seq	WDNSYIREGHRRKGKQVFLGQYDNEEKAAQSYDLVA
Transcript ID	XM_026546619.1
Gene ID	Ps.43004
Gene Name	NA
Pfam domain motif	AP2
Motif E-value	9.9e-10
Motif start	203
Motif end	262
Protein seq	>XM_026546619.1 MAFMNLLDERSSLDDEGHFNTNIFIKLQDSDEGCFESSFLENAQSTVPFIVVNEKPSDYMVSLVNPTVNENCDGPPSDDT ELEPHPSLADEQAPELLRIQAVGQEVYGVCRSTNTESKSLSRSENEKILEREDVSLSTNSCHEENAESQNSQSVLVSGTA MFLNLEHADDLVCSDEEKNLGEFVPPEVSTPIKSIQKVDHRTSKYHGVTRHFWTGKFEAHLWDNSYIREGHRRKGKQVFL GQYDNEEKAAQSYDLVALKYWGLHASTRLNFPISTYKKQLEEMKEMSKEEFVMYIRRNSCFKKGSSVYRGVTRHGDGRWQ ARISGIPGRRGLHLGTFSSEEEAAKAYDIASIRYRGMKAFTNFDVSNYSPLDLKESEEQLPEPKKLKKDVNLSESTIVIA KSDPRQDVRTQTV*
CDS seq	>XM_026546619.1 ATGGCATTTATGAATCTACTAGATGAGCGTTCCAGTTTGGACGATGAGGGGCATTTTAATACCAATATATTCATTAAACT TCAAGATTCTGATGAGGGATGTTTTGAATCTTCATTCCTGGAAAATGCGCAATCAACAGTTCCTTTTATAGTAGTTAATG AGAAACCTTCAGATTATATGGTATCACTTGTAAATCCAACTGTGAACGAAAATTGTGATGGCCCACCTTCAGATGATACT GAATTAGAACCTCATCCCAGCTTGGCAGATGAACAAGCGCCAGAGCTTTTAAGAATACAGGCGGTGGGCCAGGAAGTATA CGGGGTTTGTAGATCAACTAACACTGAGTCTAAGTCTCTTTCGAGATCAGAGAATGAGAAAATCCTAGAGAGGGAAGACG TTTCTCTTAGTACCAATTCATGTCATGAGGAAAATGCTGAGTCACAGAATTCTCAGTCTGTTCTGGTTTCAGGCACCGCG ATGTTCTTGAATTTAGAACATGCTGACGACCTTGTTTGCAGTGATGAGGAAAAGAACCTTGGGGAGTTCGTTCCTCCCGA AGTTTCTACTCCAATAAAATCAATTCAGAAGGTTGACCACCGAACATCAAAATACCATGGAGTTACTAGACACTTTTGGA CTGGAAAATTTGAAGCACACCTTTGGGATAACAGCTACATAAGAGAAGGTCATAGACGTAAAGGCAAGCAAGTGTTTTTA GGTCAATATGACAATGAGGAGAAAGCAGCGCAGTCTTATGACCTTGTAGCTCTCAAATACTGGGGTCTTCATGCAAGTAC CAGATTAAATTTCCCTATTTCTACTTACAAGAAACAACTCGAAGAGATGAAGGAAATGTCAAAAGAGGAGTTTGTCATGT ACATTAGGAGGAATAGTTGCTTCAAAAAAGGATCTTCTGTTTATAGAGGCGTGACAAGACATGGAGATGGCCGGTGGCAA GCTCGAATAAGTGGAATACCTGGAAGAAGGGGACTTCACCTTGGGACATTCAGTAGTGAGGAAGAGGCTGCTAAAGCTTA CGATATCGCTTCTATCAGATATAGAGGCATGAAGGCTTTCACAAATTTTGATGTCAGTAACTATTCTCCGCTGGATTTAA AAGAATCAGAGGAACAACTACCTGAACCAAAAAAACTAAAGAAGGATGTTAATCTTAGTGAGTCTACAATTGTTATTGCT AAGTCAGATCCTCGCCAGGATGTTAGAACTCAGACAGTATGA