Thecc1EG029045t1

Gene Details

Gene ID: Thecc1EG029045t1
Gene Name: TCM_029045
Gene Family: C2H2 family
Description: C2H2 family protein
Species: Theobroma cacao
Source: C2H2 family gene from PlantTFDB

Functional Annotation

Family Introduction

Literature and News

Gene Resources

Homologs

Sequences

CDS Sequence:

>Thecc1EG029045t1|Theobroma_cacao|C2H2|Thecc1EG029045t1
ATGATGAAAGGTTTGTTATTCCACGATCAACAGCAACAAGTTCTGGAAGAGAATATGTCAAATTTGACTTCTGCATCTGGTGAAGCAAGTGTTTCTTCAGGCAATAGAGCCGAAGCTGCCACCAACTATCCTCAACAATACTTTAGTACTCCACCACCTGAAACTCAGCCAGCTAAGAAAAAGAGAAACCTGCCAGGCAACCCAGACCCAGATGCAGAAGTGATAGCTTTGTCTCCTAAAACACTCATGGCAACAAATAGATTTGTGTGTGAGATCTGCAACAAAGGGTTTCAAAGAGACCAGAACCTCCAGCTCCACAGAAGAGGGCATAACTTGCCGTGGAAGTTAAAGCAAAGAACAAGTAAAGAGGTGAGGAAGAAGGTGTATGTCTGTCCAGAACCCAGCTGTGTGCATCATGACCCATCAAGGGCCCTTGGGGACTTGACAGGAATCAAGAAGCATTTTTGCAGAAAGCATGGTGAGAAGAAATGGAAATGTGATAAGTGTTCAAAAAGGTACGCAGTTCAATCGGATTGGAAGGCTCACTCCAAGACTTGTGGCACTAGAGAATACAGATGTGACTGTGGAACCCTCTTCTCAAGGAGAGATAGCTTCATCACTCACAGAGCCTTCTGTGATGCTTTAGCAGAGGAGAGCGCAAGAGCAATCACGGGAGCTAACCCACTTCTCTCCTCGCATCAACCAGGAGCATCAGCATCTCACATTAATTTACAAGTTCCCCAATTCAATGCCCAAGACATACAAGCATTTTCACTTAAGAAAGAGCAACAAAGTTTCAGTCTAAGGCCAGAGATTCCTCCATGGCTCTCTAGCCAACCAATGCTAGGGGCTGGTCCGGGCCCACCACCACAGCCTATAGATCTTTCCTCATCATCATCATCAATCTTCTCCGCAAGATTAGATCATCATCATCAAGAATTCACACAAACAACACACCATCAGGACTTAACACATCATGTAAACCCCAACCCTAACCCTACTAGTCTTGGCCCCACTCTTCCTGCCTACCATCCAACAACAGTACCATCCCCACACATGTCAGCAACTGCATTACTTCAGAAAGCAGCCCAGATGGGTGCAACCATGAGCAGCAAAACTGGCTCATCATCAGCACCAGCTACTGCTGCAGCTGCCTCCTTGATCAGACCCCACCAACAAGCTCACGTGTCTGCTGATTCTGCTGGCAGTAACAATAACACAACAACAGCTGTTTTTGGCCTCAACTTGTCTTCACGTGAAGAACTGGCTGTGATCATGCTGGCTCAGACGAAGGATGGGAGGTTCATAAATGAAACATTCTCATCAACAACAACTACACCAACAACAACGACAAATGCTGCTGCCGCCGCTAGGAATGATCACGAAACTGGCGGTATTCAAGGTGAAGGCTTGACGAGAGATTTCTTGGGTCTTAGAGCTTTCTCTCATAGCGATATTCTCAATCTTGCTGGTCTTAGTAACTGCATGAACACTTCGCATGAACAACGCAATCAGTCGCAAAAACCATGGCAAGTTGTTGATTCACCAAAATTTGAAGCAGTCCATATAGCTCTACTTGCTGCACCATCTGCGGGGACAGGGTCTGGGTACTTTTACTTGCCAGGAACTACTGATAGCTTAAAAGCAGAAGAAATGAATCACAGTAAAAAGCTAGCTGCAACGGAGTCAACCTCCAAATCAACTGCGGCGATGGCGAGAAAGCGAAGCAGCAAAACGACGTTGATCTTCTTCGTTTTGCTTTCCATTGTAGCTTTCGTTGCTTTCGTTCCCGTCTTCGCTTCTCTCCCTTCTCTTTCCTCTCACTCTCACGATCTTCACCTCCATCTTCGTCTTCATCAGCGTCAGCATCGTCTCGAAAAAAGTGATGCTAGAAAGTTTGAAATTGCGGAGGATATGTTTTGGAAAGATGGAAAGCCTTTTCAGATAATTGGTGGTGACTTGCATTATTTCCGCATTCTTCCTGAGTACTGGGAAGATAGGCTTTTAAGAGCAAAAGCACTGGGACTGAATACCATTCAAACTTATATTCCTTGGAATTTGCATGAACCAGAGCCTGGCAAACTGGTTTTTGAAGGCATTGCAGATCTAGTATCATTTCTCAAACTTTGCCAGAAGTTAGGTCTCCTTGTTATGCTTCGAGCTGGGCCTTATATTTGTGCAGAGTGGGATCTTGGAGGATTCCCAGCTTGGTTACTTGCCATAGAACCAGATATCAGACTAAGGTCATCAGATCCTGCTTACCTCCAATTGGTTGAAGGATGGTGGGGAGTCCTACTTCCAAAAGTAGCTCCTCTTCTTTATGGTAATGGAGGTCCTATTATAATGGTGCAGATAGAAAATGAATTTGGGTCATATGGAGATGATAAAGCTTATCTTCGTCACCTGGTGAAGTTGGCTAGAGGACATCTTGGGGAAGACATTATTTTGTATACTACAGATGGAGGTTCTCGAGAAACTCTTGAAAAAGGAACCCTTGTAGGAGATGATGTCTTTTCCGCTGTTGACTTCACTACTGGGGATGATCCTTGGCCCATATTTGAGTTACAAAAGGAGTTCAATTCCCCTGGGAAATCACCACCACTTTCTTCGGAGTTTTATACAGGTTGGCTTACACATTGGGGTGAGAAGATTGCAAGGACAGATGCAGATTTTACCGCAGCTGCCTTGGAAAAGATTTTGTCACGAAATGGTTCTGTCGTGCTTTATATGGCACATGGTGGAACAAACTTTGGATTTTATAATGGGGCAAATACAGGTGCTGATGAGTCAGATTACAAGCCTGATCTAACTTCCTATGATTATGATGCGCCAATTACGGAGTCTGGTGATGTGGACAATGCAAAATTCAAAGCCATAAGGAGAGTGGTGGGGAAATATAGTTCAGTATCTCTTCCTTCATTTCCTTCCAGTAATAAAAAGACAGGATATGGTTTTATCCAGTTACAAAAAACAAGAAGTTTATTTGATTTACTTGATGGGTTTGATTCTGCACACATTGTTGAAGCTGAAAATCCAACTGCAATGGAGTATTTCTACCAGATGTTTGGATTTCTATTATATGTATCTGAATATGCATCGAAAGCTGGTGGAAATAAGCTATTTATACCAAAGGTGCATGACAGAGCTCAAGTGTTCATATCATGCCCTTCTAGAGCTGATGGTGGACGAGTATCATATGTTGGTACAATTGAAAGATGGTCAAATCAAGCAATTTACCTTCCTAATGCTAAATGTGTTTCTAACACCAGCTTATTTATTTTGGTTGAAAACATGGGCCGTGTAAATTATGGACCATACTTGTTTGACAGGAAGGGAATTTTGTCTTCTGTTTATGTAGATGGGAGAGTTTTGAACAGATGGAAAATGATCCCAATTCCTTTCCAAAACCTGAATGAGGTGCCAAAGTTCAATCCTGTCATTCAAGTTGCATCTGAATTCCCTAAAGTATCCATCCGCAAAAAGTTAGAGCACAAGTCAGAGGATGTTTTAGAAGGACCATCATTCTACACTGGTCATTTCTCTATTGATAAAACTAGTGAAGTTACAGATACATTCATTTCGTTTAGAGCCTGGGGTAAAGGGATTGCTTTTGTTAATGAATTCAACATCGGAAGATATTGGCCAACTTCAGGACCACAATGCAACCTTTATATCCCTGCTCCAATCCTTCGGCATGGGGAAAATGTTTTGGTGATATTCGAGTTAGAATCACCAAACCCTGAGCTTGTGGTTGATTCAGTTGATCAGCAAGATTTCAATTGTGGATCAAGTAAAGCAAGTGTGCGTCAACTTTAA

Protein Sequence:

>Thecc1EG029045t1|Theobroma_cacao|C2H2|Thecc1EG029045t1
MMKGLLFHDQQQQVLEENMSNLTSASGEASVSSGNRAEAATNYPQQYFSTPPPETQPAKKKRNLPGNPDPDAEVIALSPKTLMATNRFVCEICNKGFQRDQNLQLHRRGHNLPWKLKQRTSKEVRKKVYVCPEPSCVHHDPSRALGDLTGIKKHFCRKHGEKKWKCDKCSKRYAVQSDWKAHSKTCGTREYRCDCGTLFSRRDSFITHRAFCDALAEESARAITGANPLLSSHQPGASASHINLQVPQFNAQDIQAFSLKKEQQSFSLRPEIPPWLSSQPMLGAGPGPPPQPIDLSSSSSSIFSARLDHHHQEFTQTTHHQDLTHHVNPNPNPTSLGPTLPAYHPTTVPSPHMSATALLQKAAQMGATMSSKTGSSSAPATAAAASLIRPHQQAHVSADSAGSNNNTTTAVFGLNLSSREELAVIMLAQTKDGRFINETFSSTTTTPTTTTNAAAAARNDHETGGIQGEGLTRDFLGLRAFSHSDILNLAGLSNCMNTSHEQRNQSQKPWQVVDSPKFEAVHIALLAAPSAGTGSGYFYLPGTTDSLKAEEMNHSKKLAATESTSKSTAAMARKRSSKTTLIFFVLLSIVAFVAFVPVFASLPSLSSHSHDLHLHLRLHQRQHRLEKSDARKFEIAEDMFWKDGKPFQIIGGDLHYFRILPEYWEDRLLRAKALGLNTIQTYIPWNLHEPEPGKLVFEGIADLVSFLKLCQKLGLLVMLRAGPYICAEWDLGGFPAWLLAIEPDIRLRSSDPAYLQLVEGWWGVLLPKVAPLLYGNGGPIIMVQIENEFGSYGDDKAYLRHLVKLARGHLGEDIILYTTDGGSRETLEKGTLVGDDVFSAVDFTTGDDPWPIFELQKEFNSPGKSPPLSSEFYTGWLTHWGEKIARTDADFTAAALEKILSRNGSVVLYMAHGGTNFGFYNGANTGADESDYKPDLTSYDYDAPITESGDVDNAKFKAIRRVVGKYSSVSLPSFPSSNKKTGYGFIQLQKTRSLFDLLDGFDSAHIVEAENPTAMEYFYQMFGFLLYVSEYASKAGGNKLFIPKVHDRAQVFISCPSRADGGRVSYVGTIERWSNQAIYLPNAKCVSNTSLFILVENMGRVNYGPYLFDRKGILSSVYVDGRVLNRWKMIPIPFQNLNEVPKFNPVIQVASEFPKVSIRKKLEHKSEDVLEGPSFYTGHFSIDKTSEVTDTFISFRAWGKGIAFVNEFNIGRYWPTSGPQCNLYIPAPILRHGENVLVIFELESPNPELVVDSVDQQDFNCGSSKASVRQL*