Database of MicroExons in Plants - microexon

Microexon ID	At_5:3318813-3318821:+
Species	Arabidopsis thaliana
Coordinates	5:3318813..3318821
Microexon Cluster ID	MEP21
Size	9
Phase	1
Pfam Domain Motif	AP2
Structure of Microexon-tag (flanking exon, microexon, flanking exon sizes)	49,9,50
Microexon location in the Microexon-tag	2
Microexon-tag DNA Seq	TGGGAYAAYAGYWSYWGRARWGARRGYCARAVYARGAARGGAARRCAAGTTTAYYTRGGKGSWTATGAYRAKGARGARRMWGCWGCWMGRGCWTATGAYYTDGCWGCW
Logo of Microexon-tag DNA Seq
Alignment of exons

Microexon DNA seq	TATACTTGG
Microexon Amino Acid seq	VYLG
Microexon-tag DNA Seq	TGGGATAATAGCTGTAGGAGAGAAGGTCAGGCCAGGAAGGGACGTCAAGTATACTTGGGTGGATATGACAAAGAAGATAAGGCAGCTCGAGCTTACGATTTAGCAGCT
Microexon-tag Amino Acid Seq	WDNSCRREGQARKGRQVYLGGYDKEDKAARAYDLAA
Microexon-tag spanning region	3317473-3318953
Microexon-tag prediction score	0.9685
Overlapped with the annotated transcript (%)	100
New Transcript ID	AT5G10510.1x
Reference Transcript ID	AT5G10510.1
Gene ID	AT5G10510
Gene Name	AIL6

Transcript ID	AT5G10510.1
Protein ID	AT5G10510.1
Gene ID	AT5G10510
Gene Name	AIL6
Pfam domain motif	AP2
Motif E-value	2.9e-11
Motif start	253
Motif end	311
Protein seq	>AT5G10510.1 MEMLRSSDQSQFVSYDASSAASSSPYLLDNFYGWSNQKPQEFFKEEAQLAAAASMADSTILTTFVDPQSHHSQNHIPKLE DFLGDSSSIVRYSDNSQTDTQDSSLTQIYDPRHHHNQTGFYSDHHDFKTMAGFQSAFSTNSGSEVDDSASIGRTHLAGDY LGHVVESSGPELGFHGGSTGALSLGVNVNNNTNHRNDNDNHYRGNNNGERINNNNNNDNEKTDSEKEKAVVAVETSDCSN KKIADTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVYLGGYDKEDKAARAYDLAALKYWNATATTNFPI TNYSKEVEEMKHMTKQEFIASLRRKSSGFSRGASIYRGVTRHHQQGRWQARIGRVAGNKDLYLGTFATEEEAAEAYDIAA IKFRGINAVTNFEMNRYDVEAIMKSALPIGGAAKRLKLSLEAAASSEQKPILGHHQLHHFQQQQQQQQLQLQSSPNHSSI NFALCPNSAVQSQQIIPCGIPFEAAALYHHHQQQQQHQQQQQQQNFFQHFPANAASDSTGSNNNSNVQGTMGLMAPNPAE FFLWPNQSY*
CDS seq	>AT5G10510.1 ATGGAGATGTTGAGGTCATCTGATCAGTCTCAGTTTGTCTCCTATGACGCTTCTTCCGCCGCTTCCTCCTCTCCTTATCT CCTCGATAATTTCTATGGTTGGTCAAACCAAAAACCTCAGGAGTTTTTCAAAGAAGAAGCTCAGTTAGCAGCAGCAGCTT CAATGGCGGATTCAACAATCTTAACAACATTCGTAGACCCACAATCTCATCATTCTCAGAATCACATCCCAAAGCTCGAA GATTTTCTCGGTGACTCTTCTTCTATCGTTCGTTACTCCGACAACAGTCAAACCGACACACAAGACTCTTCCCTCACTCA AATCTACGATCCACGTCACCACCATAACCAAACCGGCTTTTACTCCGATCACCACGATTTCAAAACCATGGCCGGTTTTC AATCCGCTTTCTCTACTAACTCCGGTTCAGAGGTCGATGACTCTGCTTCTATCGGAAGGACTCATCTTGCTGGAGACTAT TTGGGACACGTGGTTGAATCTTCTGGTCCGGAGCTAGGGTTTCACGGTGGATCTACCGGAGCTTTGTCACTTGGTGTTAA CGTCAATAACAATACTAATCACCGGAATGATAATGATAATCATTACCGAGGCAATAACAATGGTGAGAGAATCAACAACA ACAACAACAATGACAACGAGAAGACAGATTCTGAGAAGGAGAAGGCTGTTGTGGCTGTGGAAACATCAGATTGTTCTAAT AAGAAGATTGCTGATACGTTTGGTCAAAGGACTTCGATTTACAGAGGTGTTACTCGACATAGATGGACGGGAAGATATGA AGCACATCTATGGGATAATAGCTGTAGGAGAGAAGGTCAGGCCAGGAAGGGACGTCAAGTATACTTGGGTGGATATGACA AAGAAGATAAGGCAGCTCGAGCTTACGATTTAGCAGCTCTGAAATACTGGAATGCTACTGCTACCACCAATTTCCCTATT ACGAATTACTCGAAAGAAGTGGAGGAAATGAAGCACATGACCAAGCAAGAGTTCATTGCCTCCCTCAGGAGGAAGAGTAG CGGTTTCTCTAGAGGAGCTTCGATATACCGAGGTGTTACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATTGGCC GAGTTGCTGGGAACAAAGATCTTTACCTTGGAACCTTTGCAACGGAAGAGGAAGCAGCTGAAGCGTATGACATAGCAGCA ATCAAATTCAGAGGAATAAACGCTGTAACTAACTTTGAGATGAACCGTTACGACGTTGAAGCCATCATGAAGAGTGCACT TCCCATCGGTGGTGCAGCTAAACGTCTTAAGCTCTCTTTGGAAGCTGCTGCTTCATCAGAGCAGAAACCAATCCTCGGTC ATCATCAACTTCACCATTTCCAGCAACAACAACAACAACAACAGCTTCAGCTTCAGTCATCTCCTAATCACAGTAGCATT AACTTCGCTCTCTGTCCTAATTCAGCAGTTCAGTCTCAACAGATCATTCCTTGTGGAATCCCTTTTGAAGCAGCTGCTCT TTACCACCACCACCAACAACAACAGCAACACCAACAGCAGCAGCAGCAACAGAACTTCTTCCAGCATTTTCCGGCGAATG CAGCTTCTGACTCGACCGGGTCTAACAACAACTCCAACGTTCAGGGAACAATGGGACTTATGGCACCAAATCCGGCTGAG TTCTTCCTCTGGCCTAATCAGTCTTACTAA

Microexon DNA seq	TATACTTGG
Microexon Amino Acid seq	VYLG
Microexon-tag DNA Seq	TGGGATAATAGCTGTAGGAGAGAAGGTCAGGCCAGGAAGGGACGTCAAGTATACTTGGGTGGATATGACAAAGAAGATAAGGCAGCTCGAGCTTACGATTTAGCAGCT
Microexon-tag Amino Acid seq	WDNSCRREGQARKGRQVYLGGYDKEDKAARAYDLAA
Transcript ID	AT5G10510.4
Gene ID	At.22661
Gene Name	AIL6
Pfam domain motif	AP2
Motif E-value	3e-11
Motif start	268
Motif end	326
Protein seq	>AT5G10510.4 MMAPMTNWLTFSLSPMEMLRSSDQSQFVSYDASSAASSSPYLLDNFYGWSNQKPQEFFKEEAQLAAAASMADSTILTTFV DPQSHHSQNHIPKLEDFLGDSSSIVRYSDNSQTDTQDSSLTQIYDPRHHHNQTGFYSDHHDFKTMAGFQSAFSTNSGSEV DDSASIGRTHLAGDYLGHVVESSGPELGFHGGSTGALSLGVNVNNNTNHRNDNDNHYRGNNNGERINNNNNNDNEKTDSE KEKAVVAVETSDCSNKKIADTFGQRTSIYRGVTRHRWTGRYEAHLWDNSCRREGQARKGRQVYLGGYDKEDKAARAYDLA ALKYWNATATTNFPITNYSKEVEEMKHMTKQEFIASLRRKSSGFSRGASIYRGVTRHHQQGRWQARIGRVAGNKDLYLGT FATEEEAAEAYDIAAIKFRGINAVTNFEMNRYDVEAIMKSALPIGGAAKRLKLSLEAAASSEQKPILGHHQLHHFQQQQQ QQQLQLQSSPNHSSINFALCPNSAVQSQQIIPCGIPFEAAALYHHHQQQQQHQQQQQQQNFFQHFPANAASDSTGSNNNS NVQGTMGLMAPNPAEFFLWPNQSY*
CDS seq	>AT5G10510.4 ATGATGGCTCCGATGACGAACTGGTTAACGTTTTCTCTGTCACCAATGGAGATGTTGAGGTCATCTGATCAGTCTCAGTT TGTCTCCTATGACGCTTCTTCCGCCGCTTCCTCCTCTCCTTATCTCCTCGATAATTTCTATGGTTGGTCAAACCAAAAAC CTCAGGAGTTTTTCAAAGAAGAAGCTCAGTTAGCAGCAGCAGCTTCAATGGCGGATTCAACAATCTTAACAACATTCGTA GACCCACAATCTCATCATTCTCAGAATCACATCCCAAAGCTCGAAGATTTTCTCGGTGACTCTTCTTCTATCGTTCGTTA CTCCGACAACAGTCAAACCGACACACAAGACTCTTCCCTCACTCAAATCTACGATCCACGTCACCACCATAACCAAACCG GCTTTTACTCCGATCACCACGATTTCAAAACCATGGCCGGTTTTCAATCCGCTTTCTCTACTAACTCCGGTTCAGAGGTC GATGACTCTGCTTCTATCGGAAGGACTCATCTTGCTGGAGACTATTTGGGACACGTGGTTGAATCTTCTGGTCCGGAGCT AGGGTTTCACGGTGGATCTACCGGAGCTTTGTCACTTGGTGTTAACGTCAATAACAATACTAATCACCGGAATGATAATG ATAATCATTACCGAGGCAATAACAATGGTGAGAGAATCAACAACAACAACAACAATGACAACGAGAAGACAGATTCTGAG AAGGAGAAGGCTGTTGTGGCTGTGGAAACATCAGATTGTTCTAATAAGAAGATTGCTGATACGTTTGGTCAAAGGACTTC GATTTACAGAGGTGTTACTCGACATAGATGGACGGGAAGATATGAAGCACATCTATGGGATAATAGCTGTAGGAGAGAAG GTCAGGCCAGGAAGGGACGTCAAGTATACTTGGGTGGATATGACAAAGAAGATAAGGCAGCTCGAGCTTACGATTTAGCA GCTCTGAAATACTGGAATGCTACTGCTACCACCAATTTCCCTATTACGAATTACTCGAAAGAAGTGGAGGAAATGAAGCA CATGACCAAGCAAGAGTTCATTGCCTCCCTCAGGAGGAAGAGTAGCGGTTTCTCTAGAGGAGCTTCGATATACCGAGGTG TTACAAGGCATCATCAACAAGGACGTTGGCAAGCAAGGATTGGCCGAGTTGCTGGGAACAAAGATCTTTACCTTGGAACC TTTGCAACGGAAGAGGAAGCAGCTGAAGCGTATGACATAGCAGCAATCAAATTCAGAGGAATAAACGCTGTAACTAACTT TGAGATGAACCGTTACGACGTTGAAGCCATCATGAAGAGTGCACTTCCCATCGGTGGTGCAGCTAAACGTCTTAAGCTCT CTTTGGAAGCTGCTGCTTCATCAGAGCAGAAACCAATCCTCGGTCATCATCAACTTCACCATTTCCAGCAACAACAACAA CAACAACAGCTTCAGCTTCAGTCATCTCCTAATCACAGTAGCATTAACTTCGCTCTCTGTCCTAATTCAGCAGTTCAGTC TCAACAGATCATTCCTTGTGGAATCCCTTTTGAAGCAGCTGCTCTTTACCACCACCACCAACAACAACAGCAACACCAAC AGCAGCAGCAGCAACAGAACTTCTTCCAGCATTTTCCGGCGAATGCAGCTTCTGACTCGACCGGGTCTAACAACAACTCC AACGTTCAGGGAACAATGGGACTTATGGCACCAAATCCGGCTGAGTTCTTCCTCTGGCCTAATCAGTCTTACTAA