Information report for CEY00_Acc30903
Gene Details
|
|
Functional Annotation
- Encodes a structural core component of a COMPASS-like H3K4 histone methylation complex.;Encodes WD repeat‐containing protein 5
Homologous
- Arabidopsis thaliana — AT3G49660
- Oryza sativa — LOC_Os03g51550
Gene Resources
- Pfam: PF00400
- UniProt: A0A2R6PA32
- EMBL: NKQK01000027
- AlphaFoldDB: A0A2R6PA32
- OMA: QMNFAVW
- InterPro: IPR001680 , IPR015943 , IPR019775 , IPR020472 , IPR036322 , IPR055440
- PANTHER: PTHR19846 , PTHR19846:SF0
- SUPFAM: SSF50978
- PROSITE: PS00678 , PS50082 , PS50294
- Gene3D: 2.130.10.10
- OrthoDB: A0A2R6PA32
- CDD: cd00200
- STRING: 1590841.A0A2R6PA32
Sequences
gDNA Sequence
- >CEY00_Acc30903
CAAAAGCAATATATTTTTTCTGGTCAAGTACGAACTACTGCTTTTGAACCCCTTCGAGGCTTCGACCATTCTCCGTCACCTCAAAATCTTCCCCAACAAGATGGCATCCTCGGTCCCAGCCGAACCAATCAAACCCTACAAGCTCAAGCAAACCCTAACCGGACACAAACGAGCGATCTCGTGCCTCAAGTTCTCCGACGACGGCAAACGCCTCGCCACCGCCTCCGCCGACAAGACCGCCCGCGTCTGGTCCACCGCCGACGGCTCCTCCCTCCACACCTTTCGTGGCCATGACCATGGCATCTCCGACCTCGCATTCTCCTCCGACTCCCGCTTCATCGCCACCGCCTCCGACGACAAAACCGTCCGCATCTGGGACGTCGCCGCCGCCTCTCCCGTCAAAACCCTAACTGGCCACACCAACTACGTCTTCTGCGTCAACTACAACCCCCAGGGAAACATGATCGTGTCCGGTTCGTTCGATGAGACGGTTAGGGTTTGGGACGTGAAGACCGGGAAGTGCTTGAAGGTGCTTCCGGCGCACTCGGATCCGGTCACGGCGGTGAGTTTCAACCGGGACGGGACGTTGATCGTTTCGAGCAGTTACGATGGGCTGTGTCGGATTTGGGACGCGTCGACCGGGCATTGTATGAAGACGCTTATTGATGATGAGAATCCTCCGGTGAGCTTCGTCAAGTTCTCGCCCAATGGCAAGTTCATACTTGTTGGGACTTTGGATAATACATTGGTGAGTTTCTTATCTGTCCCGATTTGGCATAAGGTTGGAATATATATGAAGTTTCGATTCCTAAACTTCTGGGAGCCTTATCTGTTCTCATGGATGCATTTGTTAAAATTCCCGAGGGAGTAAAGACTTAAAAAGCTTAATACGATATGTTTTCATTGATGCATTTGATAATGGCCTTGGTTGATTGTTCTATTTCCCAGTTTGTTTAAATTTCTTGAGTGAGCAGATGCTGAAAAGCTCAGGAGTATATGTTTTGTGTTTCCACTTAATTATCTCTACAAAATCAGTTTTAAATTCTTTGTTAGCAGTTAATTTTGTTTTCAAATTCAGCAAAGTTGGATTATTTAAGAGACTGATTATGTTGTTAGGAAGAGTATAAGTATTACACATTGGGTGAATTCAGTATCTGAAGTGGGTTTTAAGTCATGAAAAATAAAATAATTGATGGCACGTGTGGAGCCGGAATTTATATTCAGTGGATCAAAATTGTAGAATTTAGGGCAAATTACTATTTTTTGTGGGGTCAAAATTGTATTAATGATAAATTATATTAGAGATAATAGTGTACTTTTTTTTTCCGGGTCAATTGACCCCACTTATCCTTACGTGCCTCCGCCCCTGATTGGTGGGACTAAAAAATTTGAATTTAAGTTGGTTTGGAGCTTGTGAAATCTATTTTATGGAAATTTGAAGCTTGTCATCATGTATGATGTACCTAGCTGATTGTTGAAGCCGTTTTGAATTTTGTACTTGTAGATCATAGTTTAAACCTTTTCACAGAATTACCTGATGCATATCGTTTTGGGGTTCTGAATCTACGAATCGTGGGCATTCTATTCATGGGCATTAATGTTGACTCAAAATAGTTGGGAGTAACCCACACATGAATATATGAAAGGCAATGAAAAGGGAAGGGACAAAGGCATTGGTAGTGAATTCTATCCTCAATCTGAAATAGTTATAGTCCAGCATTGAGCATATGTTTCATGTTTTCTCTTACTTTGTGGTTCTAGTTCTAGACATGAGCTGTGGATAGAACTCTAGCAATAAATAAATACACAATGGAAGTACTGCACAAGGGGGTAATGTTGATGGTATGGAAACATCATAGGAGTTGCATAGGACTGATAGGAGTAATAGACCTGCCCTTCTTTTAGCCAAATGGAGCTATTTTTAATACATAACACTGGTATATGATGTATCCCTAACGCAATAAAAGAAATGTGATATGAATTCTTGCAGTAAAGTGATTCGTCTCCTTGGAATGGTAGAAAGCTGAAGTTGCTTCAATTTCTCTTTCGTTTTCTCCAAATTTTGTACATTATAGCACGTGCAGTTGTCAATTCCTCCTTTTCTGATTCATGCTCATGACTAACCATGCCACATGTCATCTTCTTGGAAATAATTTAGTAGTTTGGAGTAATTTGTGTTACCATGCTCAAGTTAATAGACATTATAAAAGCTGGTTTGTATTTTAATGTCATTGACATCAATTGCATTCAAAAATAGAAAAAAGGAAAGCAAAAAGGCCAACAAGTTCACCAATGGAGTGTGTATGGTTTAGGTGCGAGTGACGATTTTTAATACCTCTTATTTCATGATATGGTCTGAGGGCCTCTGCGTAGTGCCTTTTGGAAAAGTATATGCTCTATGCGTGTTCCTTCTGCATAATGTTTGTTAGACTTCTTGCTCATGGAGCATACTTTTGATGGTTGATCTTTAAAATCTTTTCTCCCATACCTTTCAGCAAAGGTTATGTAGATAATGTGCTTTTCCAAAGTTTGTGTTTCATGATATTTGTCCTGCATTTTGCAATGCCTGTGTTACACGGACCCGTAGTATTCCGAGATGTACCCATGTCGACATGACACGGGTACGGGTGCGGGATCTGTACCGGATTCTTGTTCTCAAAAAGGCGGACACAGCTGTCACAGAAGCAAATTGAAGACAAATGTCGTACTGTTGCATACGAGAGAGAAAGAGAGAGAGATTGTTACAAACTAAACATATCACCTAGGGTTTCTAAAAAAATACTGGGCTTGACTAGCCGTCTCTGTTAAAATACTTAATTTGGGTATAAAATTATTGGGCTACTATGTAATTGGGCTTAGGTATTTTTTGGGTGAAAAAGTTATTGGGCTACTGGGATCTTTTAAAATGTAATTGGGCTTTATTAGGTTCCTTCTGTTTTACTTAACTTTTACTTGTTTTTTCATAGGGCACTTTATAATATTTAAATAAAAAGTTCAGATCTTATTAGGCTTTTTAGTCTATATATTTCAAATAAAAAATTATTGGAGCTGCTTTGTAACTAATACAAATTAAAAATTTACTCAAAGTACATAGTTTATTAGAACATTTTCGGTGGTCTCAACAACTATGTTTTTATTAGAACATTTCATAACATTCGGGTGGTCTCAACAACCCTTAGATGTGAAGCACAAAGTACATAGTTTATTAGTTATTGAGATATCGGTGAACTTTTAAACCAGTGTGTTTACTACGTTAAAATTCTGTTTGGATACCACTTTTTGACAAAGTCATCCCAGTTGAACAAGTAAGTTGAAGAAAAGTGAATGCTGTGTTGTTTCTCATCTACTCATTCTTTTAATTGTTTCTGCTCACCGTCATCTGTAGTCTTATGTTGATTTGTTACTTTATCTCCAGAGGCTTTGGAACTTCTCGACTGGGAAATTTCTGAAGACTTACACTGGTCATGTGAATTCCAAATACTGCATCTCATCGACATTTTCGGTGACAAATGGCAAGTATATTGTCAGCGGTTCAGAGGATAATTGTATATATATGTGGGACCTTCAGACGAGGGAAATAGTTCAGAAATTGGAAGGTCACACGGATACTGTCATATCAGTGGCATGTCACCCCACTGAGAACAAGATTGCTTCTGGTGCCCTCAGCAATGACGAAAATGTAAAGATCTGGATTCAAGACGAAGAATGAAGAATGATTTTGCCTGGTATAAGTTTTTCTTCTTCTAATAACTGCATATGCTTGGCAATAATGACATATTTGAGGAAAGATTCATGGGAAAAGCCGATCTGTTTGTCGTCTTTCAATTGCTTGTTGAAATTGTTTCTATTAACTTAATTTAGGTAGCTCCCCTTTTCATTCTAAAGTATTCAGGATGATTACTACTTTGATATCAATACTAATTACGTTCTTATTGCTGTTGAAGCATGTACGGAGCCCTGCGCGTGCCATGACATGCAGGCCCTCCTTATACTCTTTTAAGATTCTTAGGTGACATCTTTCAAATTGGTGAGAATATTTCTTCTTCTTCCATAAAAATGGAAAATATTTCTTCTTCTCAGCTTCTAGTGTGTATATGTAATGTAAATTGCAATCACTTTGGTCACTTTTGAAGGAAAAAAAGGAGACCGAAAGAGAGATTTGTTTCGGTAAAGTGTAATATTTCATAAGATTTATGTAAACTCTTGTTCTTTTTATATAATACGTGTACTTTTCCATAGTTTTCATTTTCAGTCCTTCTTGACAAAAACAAAGTACTTAAAAGTTATAGCGAAAGTTCATTTTTATACAAGGTTGTGTAAAACTGTTGCACATTACAAATTTAAGTTGGATTGAGGTTCAAATCATGGTTTTCCATGGCTTTGTTTTTATCATTTTTACAGAGGGTGATCAGATGAAGGGCCTTTGAAGCCAACTTTCAAAGGCATGAAGCTGATGATAAGAACTTGCATGTTTATTGATGGTGAACTCTGGAAGGAGCTATTGTTTTGCCGTAGTGGGTTAGTCTAGCACACCAAGTGTTTGATGAAATTCCTGATTGGAGTTATGGTTGTGAACCAGCAAAGCAACGCAGTAACCACGAAGAATTGGAGTTGATTCGTGGAATGAATGGACTAGGAAAGAAGCCCACAAAATACATCCTTTGTACCGTTCTTACTTACTATTCAAAGATGCTAAATTGGCGCTTGGGTTTACAAATTCATGCCCGGGGTAATTCAGATGTGTCAAGAGGAGAACTTGTTTATAAGC
CDS Sequence
- >CEY00_Acc30903
ATGGCATCCTCGGTCCCAGCCGAACCAATCAAACCCTACAAGCTCAAGCAAACCCTAACCGGACACAAACGAGCGATCTCGTGCCTCAAGTTCTCCGACGACGGCAAACGCCTCGCCACCGCCTCCGCCGACAAGACCGCCCGCGTCTGGTCCACCGCCGACGGCTCCTCCCTCCACACCTTTCGTGGCCATGACCATGGCATCTCCGACCTCGCATTCTCCTCCGACTCCCGCTTCATCGCCACCGCCTCCGACGACAAAACCGTCCGCATCTGGGACGTCGCCGCCGCCTCTCCCGTCAAAACCCTAACTGGCCACACCAACTACGTCTTCTGCGTCAACTACAACCCCCAGGGAAACATGATCGTGTCCGGTTCGTTCGATGAGACGGTTAGGGTTTGGGACGTGAAGACCGGGAAGTGCTTGAAGGTGCTTCCGGCGCACTCGGATCCGGTCACGGCGGTGAGTTTCAACCGGGACGGGACGTTGATCGTTTCGAGCAGTTACGATGGGCTGTGTCGGATTTGGGACGCGTCGACCGGGCATTGTATGAAGACGCTTATTGATGATGAGAATCCTCCGGTGAGCTTCGTCAAGTTCTCGCCCAATGGCAAGTTCATACTTGTTGGGACTTTGGATAATACATTGAGGCTTTGGAACTTCTCGACTGGGAAATTTCTGAAGACTTACACTGGTCATGTGAATTCCAAATACTGCATCTCATCGACATTTTCGGTGACAAATGGCAAGTATATTGTCAGCGGTTCAGAGGATAATTGTATATATATGTGGGACCTTCAGACGAGGGAAATAGTTCAGAAATTGGAAGGTCACACGGATACTGTCATATCAGTGGCATGTCACCCCACTGAGAACAAGATTGCTTCTGGTGCCCTCAGCAATGACGAAAATGTAAAGATCTGGATTCAAGACGAAGAATGA
Protein Sequence
- >CEY00_Acc30903
MASSVPAEPIKPYKLKQTLTGHKRAISCLKFSDDGKRLATASADKTARVWSTADGSSLHTFRGHDHGISDLAFSSDSRFIATASDDKTVRIWDVAAASPVKTLTGHTNYVFCVNYNPQGNMIVSGSFDETVRVWDVKTGKCLKVLPAHSDPVTAVSFNRDGTLIVSSSYDGLCRIWDASTGHCMKTLIDDENPPVSFVKFSPNGKFILVGTLDNTLRLWNFSTGKFLKTYTGHVNSKYCISSTFSVTNGKYIVSGSEDNCIYMWDLQTREIVQKLEGHTDTVISVACHPTENKIASGALSNDENVKIWIQDEE