Glyma.04G194600.1.p

Gene Details:

Gene ID: Glyma.04G194600.1.p
Gene Name: GLYMA_04G194600, LOC100783850
Gene Family: Trihelix Family
Description: Trihelix Family protein
Species: Glycine max
Source: Trihelix family gene from PlantTFDB

Protein Features:

Pfam: PF13837
PROSITE profile: PS50090
InterPro: IPR017877

Annotation Proteins:

Refseq: XP_003522430.1 — ribonuclease J isoform X1
Swissprot: Q84W56 — RNJ_ARATH; Ribonuclease J
TrEMBL: K7KL53 — K7KL53_SOYBN; Uncharacterized protein
STRING: GLYMA04G37020.2 — (Glycine max)

Gene Ontology:

GO:0009658 — Biological Process — chloroplast organization
GO:0009942 — Biological Process — longitudinal axis specification
GO:0060918 — Biological Process — auxin transport
GO:0009507 — Cellular Component — chloroplast
GO:0003677 — Molecular Function — DNA binding

Family Introduction:

GT factors constitute a plant-specific transcription factor family with a DNA-binding domain that binds GT elements. The DNA-binding domain of GT factor, rich in basic and acidic amino acids and proline and glutamine residues, features a typical trihelix (helix-loop-helix-loop-helix) structure that determines the specific binding of GT elements; thus GT factors are also called trihelix transcription factors. GT elements are highly degenerate cis-elements with A/T-rich core sequences (Villain et al. 1996; Wang et al. 2004). Interaction between GT factors and GT elements has been implicated in the complex transcriptional regulation of many plant genes.

Literature:

Systematic analysis of GT factor family of rice reveals a novel subfamily involved in stress responses. DOI: 10.1007/s00438-009-0507-x ; PMID: 20039179

Sequences:

CDS Sequence:

>Glyma.04G194600.1.p|Glycine_max|Trihelix|Glyma.04G194600.1.p
ATGTCCGCTCTCACATCTCTCTCACTCTCTCTTCGCACACTCTCCCTCCGCCCCAAACCAACAACCTCACTTTCCGCTTCACTCTCTGCAATCCCAGGAACAGGAAGTAGCGATGGATCTAAAACCAAAGTACCTCCCCGCAAAAGAACGAGGAGAATAGAAGGCCCTAGAAAGAGCATGGAGGACTCCGTTCAACGAAAGATGGAGCAGTTTTACGAAGGCTCCGATGGGCCTCCGCTTCGCGTTCTGCCCATTGGCGGTTTGGGAGAAATTGGGATGAATTGCATGCTAGTCGGGAACCATGACCGCTACATTCTCATTGATGCTGGTGTCATGTTTCCAGATTATGATGAACTTGGAGTTCAAAAGATTATACCTGATACCACGTTTATAAGAAAGTGGAGCCACAAGATTGAAGCGCTTGTCATAACGCATGGTCATGAAGATCATATTGGTGCGTTGCCTTGGGTCATTCCAGCATTGGATTCCAATACACCAATTTTTGCATCTTCCTTTACATTGGAGCTTATGAAAAAACGTTTGAAGGAACATGGTATTTTCGTTCCATCTAGACTCAAAGTATTTAGAACAAGGAAGAAGTTTGTGGCTGGGCCATTTGAGATAGAACCCATCAGGGTGACCCATTCTATTCCTGATTGTTGTGGACTAGTTCTTCGCTGTTCTGATGGTACTATTCTTCACACTGGGGACTGGAAGATTGATGAAACACCACTTGATGGGAAAGTTTTTGATCGTGAAGCTTTAGAGGAACTCTCTAAAGAAGGAGTGACATTGATGATGAGTGATTCAACAAATGTACTCTCACCTGGAAGGACAATTAGTGAATCTGTTGTGGCAGATGCTTTGTTGAGACATATTTCAGCATCTAAAGGAAGGGTTATTACTACCCAATTTGCATCAAATCTACATCGGCTTGGTAGTGTGAAAGCTGCTGCTGATTTAACTGGCAGAAAGTTGGTATTTGTTGGCATGTCTTTAAGGACGTATTTAGATGCAGCTTGGAAGGATGGAAAGGCTCCAATTGATCCATCCACTCTGGTGAAAGCAGAGGATATTGATGCTTATGCTCCAAAGGATCTGCTAATTGTAACAACAGGTTCTCAAGCAGAACCACGTGCTGCCTTGAACCTTTCATCTTACGGAAGTAGTCATGCTTTCAAACTAACCAAGGAAGATGTTGTTTTGTATTCAGCTAAGGTTATCCCTGGTAATGAGTCTCGTGTGATGAAAATGCTAAACCGCATATCAGAGATTGGATCAACAATTGTTATGGGGAAAAATGAAGGTCTGCACACATCTGGTCATGCATATCGTGGAGAATTGGAAGAAGTACTTAGAATAGTGAAGCCACAACATTTTCTTCCAATCCATGGAGAACTTTTGTTCCTGAAGGAACATGAATTACTTGGAAAATCAACTGGGATACGGCACACTGCTGTTATTAAGAATGGAGAGATGCTTGGTGTTTCACATTTGAGAAATAGAAGAGTTCTTTCCAATGGTTTCATTTCCCTTGGAAAAGAGAACTTACAGTTGAAATATAGTGATGGCGATAGAGCATTTGGTACATCTAGTGATCTCTTCATTGATGAAAGATTGAGAATCGCATTAGATGGCATCATTGTCATTAGCATGGAAATATTTCGCCCTAAAGTTTTAGATGGTTCGGCTGAAAACACCTTGAAAGGGAAGATAAGGATTACCACGAGATGCTTATGGCTTGACAAGGGGAAACTGATGGATGCACTCTACAAAGCTGCCCGTGCAGCTCTTTCAAGCTGCCCTGTAAAGAGTCCACTTGCTCACATCGAAAGAATTGTGTCTGAGGTATTGAGGAAGACGGTGAGGAAGTACAGTGGTAAACGGCCTGAAGTTATTGCCATTGCCATAGAAAAACCTGCAGCCATTCTTGCTGATGAGATAAACACGAAATTGTCTGGCAAATCCCATGTGGGTCTTGGAATGTCAGCCTTAAGTAAAGCAGTGGATGGACATAGGAAGGGAAATCAGTCCACTGCACTGCAAGTTAAAGATGATAGTATTGGTAATGCAAGTGGAGCAGGGGGTGATTTATCCGATGAAAACAACACTGCAAGTGGGCCTGAGGGTTATTTATCCGAGGAAGACAACACTGCAAGTGGGGCCGAGGGTGATTTATCTGAGTCAGAGGATTCAGATGAATTTTGGAAACCATTCATTACATCATTACCAGTTGAGAAGTCAATCAGTGCTGACAATAGTTATGTTTCACAAAAGGAGCAAAAGTCCAATTTGAAGAAAGATGATTCTGAAGACATTGATGAAGCCAAGTCAGAAGAAACGTCTAATTCTGAACCCAAGCTTTCAAAATCAGTTAAGAGAAATAAATGGAAAACTGAGGAAGTTAAGAAGCTGATTGGTATGCGTGGGGAACTAAGTGACAGATTTCAAGTTGTGAAGGGAAGGATGGCCCTCTGGGAAGAGATTTCTCAAAAATTGTTGGCTGATGGGATCAGCAGAAGTCCCGGACAGTGCAAATCTCTGTGGACATCTTTGGTAGTCAAATATGAGGGGATTAAGAATAAAAATGATAGCAAGAAAAGTTGGCCATACATAGAAGACATGGAAAGGATAATGTCTGATAAAGAAGCCCCTGCAACAAAATGA

Protein Sequence:

>Glyma.04G194600.1.p|Glycine_max|Trihelix|Glyma.04G194600.1.p
MSALTSLSLSLRTLSLRPKPTTSLSASLSAIPGTGSSDGSKTKVPPRKRTRRIEGPRKSMEDSVQRKMEQFYEGSDGPPLRVLPIGGLGEIGMNCMLVGNHDRYILIDAGVMFPDYDELGVQKIIPDTTFIRKWSHKIEALVITHGHEDHIGALPWVIPALDSNTPIFASSFTLELMKKRLKEHGIFVPSRLKVFRTRKKFVAGPFEIEPIRVTHSIPDCCGLVLRCSDGTILHTGDWKIDETPLDGKVFDREALEELSKEGVTLMMSDSTNVLSPGRTISESVVADALLRHISASKGRVITTQFASNLHRLGSVKAAADLTGRKLVFVGMSLRTYLDAAWKDGKAPIDPSTLVKAEDIDAYAPKDLLIVTTGSQAEPRAALNLSSYGSSHAFKLTKEDVVLYSAKVIPGNESRVMKMLNRISEIGSTIVMGKNEGLHTSGHAYRGELEEVLRIVKPQHFLPIHGELLFLKEHELLGKSTGIRHTAVIKNGEMLGVSHLRNRRVLSNGFISLGKENLQLKYSDGDRAFGTSSDLFIDERLRIALDGIIVISMEIFRPKVLDGSAENTLKGKIRITTRCLWLDKGKLMDALYKAARAALSSCPVKSPLAHIERIVSEVLRKTVRKYSGKRPEVIAIAIEKPAAILADEINTKLSGKSHVGLGMSALSKAVDGHRKGNQSTALQVKDDSIGNASGAGGDLSDENNTASGPEGYLSEEDNTASGAEGDLSESEDSDEFWKPFITSLPVEKSISADNSYVSQKEQKSNLKKDDSEDIDEAKSEETSNSEPKLSKSVKRNKWKTEEVKKLIGMRGELSDRFQVVKGRMALWEEISQKLLADGISRSPGQCKSLWTSLVVKYEGIKNKNDSKKSWPYIEDMERIMSDKEAPATK*