Database of MicroExons in Plants - microexon

Microexon ID	Ps_NC_039360.1:85456577-85456585:-
Species	Papaver somniferum
Coordinates	NC_039360.1:85456577..85456585
Microexon Cluster ID	MEP21
Size	9
Phase	1
Pfam Domain Motif	AP2
Structure of Microexon-tag (flanking exon, microexon, flanking exon sizes)	49,9,50
Microexon location in the Microexon-tag	2
Microexon-tag DNA Seq	TGGGAYAAYAGYWSYWGRARWGARRGYCARAVYARGAARGGAARRCAAGTTTAYYTRGGKGSWTATGAYRAKGARGARRMWGCWGCWMGRGCWTATGAYYTDGCWGCW
Logo of Microexon-tag DNA Seq
Alignment of exons

Microexon DNA seq	TTTATCTTG
Microexon Amino Acid seq	VYLG
Microexon-tag DNA Seq	TGGGATAATAGTTGCAAAAAGGAAGGACAGACTAGGAAGGGAAGGCAAGTTTATCTTGGTGGATATGATATGGAAGAAAAAGCTGCTAGAGCTTATGATTTAGCAGCA
Microexon-tag Amino Acid Seq	WDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAA
Microexon-tag spanning region	85456444-85456803
Microexon-tag prediction score	0.9787
Overlapped with the annotated transcript (%)	100
New Transcript ID	XM_026599928.1x
Reference Transcript ID	XM_026599928.1
Gene ID	NA
Gene Name	NA

Transcript ID	XM_026599928.1
Protein ID	XP_026455713.1
Gene ID	LOC113356718
Gene Name	NA
Pfam domain motif	AP2
Motif E-value	1.7e-13
Motif start	344
Motif end	402
Protein seq	>XP_026455713.1 MKSMSNDSNSNNNSSSNNNNWLGFSLSPHMTMEVPSESHHTHTHNQQHHHQTSSTAAVSNNTVPTSFFLSPPHMNNSEIC YGVGTCHENSGYYSHLSVMPLKSDGSLCIMEALSRSQSEGMVPTSSPKLENFLGSGAMGNPHHYGNSERETMALSLDSMY YHQNTETQNNRQQPQQHSLNFLQQPQDHHIQVQQHTYYSGLTGHEIYQTSLEEENKGTHLSNSSLQLPPMGEDGISGLKN WVARHYPTNNSSMEQKMNTAGCLTNDGSGSGSVNAMGYGDLQSLSLSMSPGSQSSCITASQQISPTGTAECVAMETNKRG SSKMGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAALKY WGPSTHINFPLENYQDELEEMKNMSRQEYVAHLRRKSSGFSRGASMYRGVTRSHRHHQHGRWQARIGRVAGNKDLYLGTF STQEEAAEAYDIAAIKFRGVNAVTNFDITRYDVERISASNTLLAGELAKRHKDVEPVVEVVEQHSSVQNGGEGNLPEENA AGPDWKMVRNHSQQQQQQLQQQQQQQTASVENLEHKPFETNNYRNLPFSMSLHDLMGIDAMNSNQQGLEDSNRSSAHLSN TSSLVTSLSSSREGSPEKNGLFGGQSSTSNKFSPSSANSWIPSAQLKPTAITMAHLPMFAAWTDA*
CDS seq	>XM_026599928.1 ATGAAGTCCATGAGTAATGATAGCAACAGCAACAACAACAGCAGCAGCAACAACAACAACTGGTTGGGTTTTTCACTTTC ACCTCACATGACCATGGAAGTTCCTTCAGAATCTCATCATACCCATACTCATAATCAACAACACCATCATCAAACTTCTT CTACTGCTGCAGTTTCAAATAACACTGTTCCAACAAGCTTCTTTCTCTCTCCACCTCATATGAATAACTCTGAAATCTGT TATGGAGTAGGAACTTGTCATGAAAACAGTGGATATTATTCTCATTTGAGTGTAATGCCACTAAAGTCTGATGGGTCTCT TTGTATCATGGAAGCTCTCAGTAGATCACAATCAGAAGGAATGGTGCCAACTTCATCCCCAAAACTGGAAAATTTCTTAG GAAGTGGAGCAATGGGGAATCCTCATCACTATGGAAACAGTGAAAGAGAAACCATGGCTCTTAGTTTAGACAGCATGTAT TACCACCAAAACACTGAAACTCAAAATAATAGACAACAACCACAACAGCATTCTCTTAACTTTCTTCAACAACCACAAGA TCATCATATTCAAGTCCAACAACACACATATTACTCTGGATTAACTGGTCATGAGATTTATCAAACTTCATTAGAAGAAG AAAACAAAGGAACACATCTTTCAAATTCTAGTCTTCAACTTCCTCCAATGGGAGAAGATGGTATTTCAGGTTTGAAAAAC TGGGTAGCTAGACACTATCCTACTAATAACTCATCCATGGAACAAAAAATGAATACTGCTGGTTGTTTAACTAATGATGG AAGTGGGTCTGGTTCTGTTAATGCAATGGGTTATGGAGATTTACAGTCTCTGAGCTTGTCAATGAGTCCTGGTTCACAAT CAAGCTGTATTACAGCATCGCAACAGATCTCACCAACTGGTACTGCTGAATGTGTAGCCATGGAAACAAACAAGAGAGGG TCTTCAAAAATGGGTCAGAAACAACCTGTCCATAGGAAGTCCATTGACACATTTGGGCAGAGAACTTCACAATACAGAGG TGTCACAAGGCATAGGTGGACTGGAAGATATGAAGCTCATCTATGGGATAATAGTTGCAAAAAGGAAGGACAGACTAGGA AGGGAAGGCAAGTTTATCTTGGTGGATATGATATGGAAGAAAAAGCTGCTAGAGCTTATGATTTAGCAGCACTGAAGTAT TGGGGACCTTCAACCCACATCAACTTTCCGTTGGAAAATTATCAAGATGAGCTTGAAGAAATGAAGAACATGAGTAGGCA AGAATATGTTGCCCACTTGAGAAGGAAAAGCAGTGGGTTTTCAAGAGGAGCTTCAATGTACAGAGGAGTAACAAGGTCTC ACAGACATCATCAGCATGGTAGATGGCAGGCAAGGATCGGACGAGTCGCCGGAAACAAAGACCTTTATCTTGGCACATTC AGTACCCAAGAAGAAGCAGCTGAAGCTTATGACATTGCTGCAATCAAATTTCGTGGTGTAAATGCTGTTACTAACTTTGA CATAACAAGATACGACGTTGAACGCATCTCAGCCAGTAATACCTTACTTGCCGGAGAACTTGCCAAGAGGCACAAGGATG TAGAACCTGTTGTCGAAGTTGTCGAGCAACATTCCTCTGTTCAAAATGGAGGAGAAGGTAACTTGCCCGAGGAAAATGCT GCTGGGCCTGACTGGAAGATGGTTCGTAATCATTCGCAACAACAACAACAGCAGCTGCAACAGCAACAACAGCAGCAGAC TGCATCAGTTGAAAACCTTGAGCACAAACCATTTGAGACAAACAATTACCGGAACCTCCCATTTTCGATGTCATTACATG ATCTAATGGGTATTGATGCAATGAACTCAAACCAACAAGGATTAGAAGATTCTAACAGGTCGAGTGCTCATTTATCGAAC ACGTCATCATTGGTTACAAGCTTAAGCAGCTCCAGAGAAGGTAGCCCTGAGAAAAATGGGCTCTTTGGAGGACAATCATC AACCTCCAACAAGTTTAGTCCTTCCTCGGCAAACTCCTGGATTCCATCAGCACAACTTAAGCCTACTGCAATCACTATGG CTCACTTGCCTATGTTTGCTGCATGGACTGATGCTTAG

Microexon DNA seq	TTTATCTTG
Microexon Amino Acid seq	VYLG
Microexon-tag DNA Seq	TGGGATAATAGTTGCAAAAAGGAAGGACAGACTAGGAAGGGAAGGCAAGTTTATCTTGGTGGATATGATATGGAAGAAAAAGCTGCTAGAGCTTATGATTTAGCAGCA
Microexon-tag Amino Acid seq	WDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAA
Transcript ID	XM_026599929.1
Gene ID	Ps.18120
Gene Name	NA
Pfam domain motif	AP2
Motif E-value	1.6e-13
Motif start	344
Motif end	402
Protein seq	>XM_026599929.1 MKSMSNDSNSNNNSSSNNNNWLGFSLSPHMTMEVPSESHHTHTHNQQHHHQTSSTAAVSNNTVPTSFFLSPPHMNNSEIC YGVGTCHENSGYYSHLSVMPLKSDGSLCIMEALSRSQSEGMVPTSSPKLENFLGSGAMGNPHHYGNSERETMALSLDSMY YHQNTETQNNRQQPQQHSLNFLQQPQDHHIQVQQHTYYSGLTGHEIYQTSLEEENKGTHLSNSSLQLPPMGEDGISGLKN WVARHYPTNNSSMEQKMNTAGCLTNDGSGSGSVNAMGYGDLQSLSLSMSPGSQSSCITASQQISPTGTAECVAMETNKRG SSKMGQKQPVHRKSIDTFGQRTSQYRGVTRHRWTGRYEAHLWDNSCKKEGQTRKGRQVYLGGYDMEEKAARAYDLAALKY WGPSTHINFPLENYQDELEEMKNMSRQEYVAHLRRKSSGFSRGASMYRGVTRHHQHGRWQARIGRVAGNKDLYLGTFSTQ EEAAEAYDIAAIKFRGVNAVTNFDITRYDVERISASNTLLAGELAKRHKDVEPVVEVVEQHSSVQNGGEGNLPEENAAGP DWKMVRNHSQQQQQQLQQQQQQQTASVENLEHKPFETNNYRNLPFSMSLHDLMGIDAMNSNQQGLEDSNRSSAHLSNTSS LVTSLSSSREGSPEKNGLFGGQSSTSNKFSPSSANSWIPSAQLKPTAITMAHLPMFAAWTDA*
CDS seq	>XM_026599929.1 ATGAAGTCCATGAGTAATGATAGCAACAGCAACAACAACAGCAGCAGCAACAACAACAACTGGTTGGGTTTTTCACTTTC ACCTCACATGACCATGGAAGTTCCTTCAGAATCTCATCATACCCATACTCATAATCAACAACACCATCATCAAACTTCTT CTACTGCTGCAGTTTCAAATAACACTGTTCCAACAAGCTTCTTTCTCTCTCCACCTCATATGAATAACTCTGAAATCTGT TATGGAGTAGGAACTTGTCATGAAAACAGTGGATATTATTCTCATTTGAGTGTAATGCCACTAAAGTCTGATGGGTCTCT TTGTATCATGGAAGCTCTCAGTAGATCACAATCAGAAGGAATGGTGCCAACTTCATCCCCAAAACTGGAAAATTTCTTAG GAAGTGGAGCAATGGGGAATCCTCATCACTATGGAAACAGTGAAAGAGAAACCATGGCTCTTAGTTTAGACAGCATGTAT TACCACCAAAACACTGAAACTCAAAATAATAGACAACAACCACAACAGCATTCTCTTAACTTTCTTCAACAACCACAAGA TCATCATATTCAAGTCCAACAACACACATATTACTCTGGATTAACTGGTCATGAGATTTATCAAACTTCATTAGAAGAAG AAAACAAAGGAACACATCTTTCAAATTCTAGTCTTCAACTTCCTCCAATGGGAGAAGATGGTATTTCAGGTTTGAAAAAC TGGGTAGCTAGACACTATCCTACTAATAACTCATCCATGGAACAAAAAATGAATACTGCTGGTTGTTTAACTAATGATGG AAGTGGGTCTGGTTCTGTTAATGCAATGGGTTATGGAGATTTACAGTCTCTGAGCTTGTCAATGAGTCCTGGTTCACAAT CAAGCTGTATTACAGCATCGCAACAGATCTCACCAACTGGTACTGCTGAATGTGTAGCCATGGAAACAAACAAGAGAGGG TCTTCAAAAATGGGTCAGAAACAACCTGTCCATAGGAAGTCCATTGACACATTTGGGCAGAGAACTTCACAATACAGAGG TGTCACAAGGCATAGGTGGACTGGAAGATATGAAGCTCATCTATGGGATAATAGTTGCAAAAAGGAAGGACAGACTAGGA AGGGAAGGCAAGTTTATCTTGGTGGATATGATATGGAAGAAAAAGCTGCTAGAGCTTATGATTTAGCAGCACTGAAGTAT TGGGGACCTTCAACCCACATCAACTTTCCGTTGGAAAATTATCAAGATGAGCTTGAAGAAATGAAGAACATGAGTAGGCA AGAATATGTTGCCCACTTGAGAAGGAAAAGCAGTGGGTTTTCAAGAGGAGCTTCAATGTACAGAGGAGTAACAAGACATC ATCAGCATGGTAGATGGCAGGCAAGGATCGGACGAGTCGCCGGAAACAAAGACCTTTATCTTGGCACATTCAGTACCCAA GAAGAAGCAGCTGAAGCTTATGACATTGCTGCAATCAAATTTCGTGGTGTAAATGCTGTTACTAACTTTGACATAACAAG ATACGACGTTGAACGCATCTCAGCCAGTAATACCTTACTTGCCGGAGAACTTGCCAAGAGGCACAAGGATGTAGAACCTG TTGTCGAAGTTGTCGAGCAACATTCCTCTGTTCAAAATGGAGGAGAAGGTAACTTGCCCGAGGAAAATGCTGCTGGGCCT GACTGGAAGATGGTTCGTAATCATTCGCAACAACAACAACAGCAGCTGCAACAGCAACAACAGCAGCAGACTGCATCAGT TGAAAACCTTGAGCACAAACCATTTGAGACAAACAATTACCGGAACCTCCCATTTTCGATGTCATTACATGATCTAATGG GTATTGATGCAATGAACTCAAACCAACAAGGATTAGAAGATTCTAACAGGTCGAGTGCTCATTTATCGAACACGTCATCA TTGGTTACAAGCTTAAGCAGCTCCAGAGAAGGTAGCCCTGAGAAAAATGGGCTCTTTGGAGGACAATCATCAACCTCCAA CAAGTTTAGTCCTTCCTCGGCAAACTCCTGGATTCCATCAGCACAACTTAAGCCTACTGCAATCACTATGGCTCACTTGC CTATGTTTGCTGCATGGACTGATGCTTAG