DESCRIPCIÓ
La proteïna CHOP, també anomenada DDIT3, és un factor induïble per dany al DNA que provoca parada del creixement.
ESTRUCTURA GENÒMICA
El gen de la proteïna CHOP (ENSG00000175197 ) es troba localitzat a la posició q13.1-q13.2 del cromosoma 12, concretament de la posició 56,196,640-56,200,567.

El gen conté un total de 4 exons (94 bp, 48 bp, 167 bp i 586 bp) que donen lloc a un únic transcrit. La seqüència total del gen és de 3Kb.
Aquest gen presenta un únic transcrit:
| Longitud transcrit: 909bp | N° exons: 4 |
| Longitud proteïna resultant: 169aa | Cadena: - |

Com podem veure en la imatge, aquest transcrit està constituït per quatre exons, dels quals només els dos últims són codificants. Cal tenir en compte que estem parlant de la cadena reversa. A més, tal i com mostren les caixes representatives dels exons, els dos exons codificants ho son parcialment, ja que presenten les corresponents regions 3' i 5' UTRs.
A continuació presentem una representació dels 4 exons, amb l'identificador corresponent de l'Ensembl. Com ja s'ha dit abans, a partir d'aquests exons d'obté un únic transcrit. Concretament són els exons 3 i 4 els codificants (tenir en compte que estem parlant de la cadena reversa).
Cal dir que s'han consultat altres bases de dades per confirmar el nombre d'exons i s'ha obtingut la mateixa informació.

Després de buscar en diverses bases de dades no s'ha trobat evidència de cap altre transcrit. Per tant, aquest gen només dóna lloc a una isoforma ja que no es produeix splicing alternatiu.

ESTRUCTURA PROTEICA
El gen CHOP codifica per una proteïna que, com es pot veure en la imatge, està formada per les següents regions i dominis:

Per tal de detallar millor aquestes regions i dominis, s'utilitza la seqüència aminoacídica de la proteïna. En lletra blava es destaca la part de la proteïna CHOP que participa en la fusió. Com que aquesta part conté els dominis d'unió al DNA i Leucine-Zipper, aquests es mantindran en la proteïna fusionada.

HOMOLOGIA: Conservació en altres espècies
En aquest apartat es mostren les espècies que la base de dades de l'Ensembl considera ortòlogues del nostre gen humà. S'ha utilitzat aquesta base de dades perquè és la que ens proporciona més informació al respecte. Cal destacar que aquestes espècies presenten dos percentatges d'homologia (target %id i query % id). Això és degut, com ja s'ha comentat a l'apartat d'homologia de la proteïna FUS, a que les seqüències no solen ser de la mateixa longitud i no és el mateix comparar la seqüència llarga amb la curta que a la inversa.
| Espècie | Target % id | Query % id | Tipus | Espècie | Target % id | Query % id | Tipus |
|---|---|---|---|---|---|---|---|
Bos taurus![]() |
93 | 92 | 1 to 1 | Canis familiaris![]() |
92 | 92 | 1 to 1 |
Cavia porcellus![]() |
90 | 89 | 1 to 1 | Danio rerio![]() |
32 | 41 | 1 to 1 |
Dasypus novemcinctus![]() |
91 | 90 | 1 to 1 | Echinops telfairi![]() |
87 | 86 | 1 to 1 |
Gasterosteus aculeatus![]() |
14 | 23 | 1 to 1 | Macaca mulatta![]() |
98 | 98 | 1 to 1 |
Mus musculus![]() |
88 | 88 | 1 to 1 | Oryzias latipes![]() |
15 | 24 | 1 to 1 |
Pan troglodytes![]() |
99 | 99 | 1 to 1 | Rattus norvegicus![]() |
91 | 90 | 1 to 1 |
Takifugu rubripes![]() |
16 | 24 | 1 to 1 | Tetraodon nigroviridis![]() |
15 | 24 | 1 to 1 |
Tupaia belangeri![]() |
93 | 94 | 1 to 1 | Xenopus tropicalis![]() |
38 | 47 | 1 to 1 |
Si ens fixem bé en els percentatges d'homologia de cada una de les espècie, trobem alguns que presenten valors molt baixos. Això ens porta a pensar que aquestes espècies comparteixen només algunes característiques mínimes dels gens, com poden ser dominis específics, etc. En conseqüència, s'ha decidit establir un mínim d'homologia (65%) necessari per considerar les espècies ortòlogues. Les espècies que superen aquest percentatge estan marcades a la taula en color blau.
L'Ensembl proporciona un arbre filogenètic corresponent a la seva llista d'ortòlegs. Amb les mateixes seqüències es fan els alineaments amb el programa ClustalW i es construeix un arbre filogenètic amb el programa Mega. Els dos arbres es mostren a continuació.
Si comparem aquests dos arbres es pot veure que ambdós segueixen una coherència evolutiva a nivell global, és a dir, els grups principals (mamífers, peixos, etc.) es mantenen agrupats. Tot i això, també observem algunes espècies, mal connectades amb d'altres.
Aquest és el cas, per exemple, de les espècies Canis familiaris i Felis catus, que es troben separades en l'arbre del ClustalW i agrupades en l'arbre de l'Ensembl. Això fa que considerem més fiable l'arbre de l'Ensembl, tot i que tots dos arbres donen una idea global de com el gen es troba més conservat en espècies properes i menys conservat en espècies més allunyanes.
EXPRESSIÓ: Caracterització de l'expressió
Per mitjà del programa UCSC es pot estudiar l'expressió del gen, tant a partir d'experiments de microarrays com a partir d'inmunohistoquímica al VisiGene com a partir dels ETS (no ho tractarem per ser menys informatiu).
En aquest apartat es mostren els resultats de diferents experiments realitzats amb conjunts de teixits específics i en condicions determinades segons el xip utilitzat. Cal tenir en compte que estem utilitzant una escala de colors on el vermell és indicador d'alt nivell d'expressió i el verd és indicador de baix nivell d'expressió. A més, s'ha optat per canviar la configuració per defecte en quant a brillantor, i s'ha augmentat per accentuar les variacions de colors.
S'han consultat tres experiments diferents i els resultats d'expressió obtinguts són els següents:

Aquest experiment ens mostra que hi ha una major expressió del nostre gen ddit3 (CHOP) en el “buffycoat”, que és el nom que se li dona a la fracció d'una mostra de sang després de centrifugar, que conté les plaquetes i glòbuls blancs. També trobem l'expressió una mica elevada (vermell no tan fort) en testicles, estómac, duodè, pulmons, nodus limfàtic i timus.

La utilització d'aquest xip no destaca cap teixit amb alts nivells d'expressió. Els que presenten una tonalitat vermellosa corresponen a l'os i als testicles. Trobem menys expressió en l'ovari, pell i encara menys en timus i cervell.

El xip U95 ens mostra una màxima expressió en la tràquea i els testicles, seguida de menor expressió en timus, cor, sang, ronyó, fetge i pulmó.
Podem concloure que aquest gen s'expressa en gran varietat de teixits, degut a que la seva funció és participar en processos biològics bàsics pel funcionament cel.lular, sobretot pel que fa a la regulació del cicle.
Degut a que aquest gen participa en la resposta al dany cèl.lular, obtindríem alts nivells d'expressió si experimentéssim a nivell de teixits danyats o patològics.
Per tal de complementar la informació obtinguda a partir dels experiments amb microarrays, s'ha cercat l'expressió d'aquest gen al VisiGene. La imatge més representativa és la que es mostra a continuació, en la que es pot veure l'expressió del gen a nivell del sistema nerviós central en un embrió de ratolí.
Font: Mahoney Lab FUNCIÓ
El gen DDIT3 està classificat al Gen Ontology sota els següents termes:
| TERM | GO | DESCRIPCIÓ | REF. PUBMED |
|---|---|---|---|
| Transcription correpressor activity | GO:0003714 | Es refereix a la funció d'un cofactor que actua reprimint la transcripció des del promotor de la RNA polimerasa II, sense unir-se al DNA. | [8] |
| Transcription factor activity | GO:0003700 | Es refereix a la funció d'unir-se a una seqüència específica del DNA per tal de modular la transcripció. El factor de transcripció pot o no interaccionar selectivament amb una altra proteïna o complex macromolecular. | [7] |
| TERM | GO | DESCRIPCIÓ | REF. PUBMED |
|---|---|---|---|
| mRNA transcription from RNA polymerase II promoter | GO:0042789 | Fa referència a la síntesis de RNAm a partir de DNA per mitjà de la RNA polimerasa II, amb origen a un promotor específic de la Pol II. | [2] |
| Regulation of cell redox homeostasis | GO:0030503 | Qualsevol procés que modula l'entorn redox d'un compartiment cel.lular. | [4] |
| Regulation of progression through cell cycle | GO:0000074 | Qualsevol procés que modula la progressió a través del cicle cel.lular. | [1] |
| Regulation of transcription, DNA-dependent | GO:0006355 | Qualsevol procés que modula la freqüència, grau o extensió de la transcripció depenent DNA. | [5] |
| Response to DNA damage stimulus | GO:0006974 | Canvi en l'estat o l'activitat d'una cèl.lula o un organisme (en termes de moviment, secreció, producció enzimàtica, expressió gènica, etc.) com a conseqüència d'un estímul indicador de dany al DNA degut a l'entorn o a errors al metabolisme. | [7] |
REGIÓ PROMOTORA
La caracterització de la regió promotora i del factors de transcripció que s'hi uneixen ha estat realitzada mitjançant un programa Perl i mitjançant el programa PROMO.
Tant el codi del programa en Perl com les seqüències i matrius utilitzades es troben en els següents enllaços:
- Fitxer de matrius: humanfactots_selectedmatrices.txt
- Fitxer de seqüències: sequencia_promotora_chop.fa
- Programa en Perl: identificacio_de_lufs.pl
El programa s'ha d'executar des del terminal de la següent manera:
$./identificacio_de_lufs.pl humanfactors_selectedmatrices.txt sequencia_promotora_chop.fa
Els resultats obtinguts amb el programa Perl es mostren a la taula 1. En aquesta taula es detalla la posició d'unió del factor de transcripció a la seqüència, així com l'score i el p-value.
| FACTOR DE TRANSCRIPCIÓ | POSICIÓ | SCORE | P-VALUE |
| AP-1 | 337 | 9.61138305855906 | <0.11 |
| AR | 1070 | 7.29991598140254 | <0.2 |
| c-Myc | 812 | -990.438967478317 | <0.56 |
| NF-AT1 | 385 | 6.74405756769459 | <0.39 |
| NF-kappaB | 649 | -990.139432208859 | <0.73 |
| SRF | 873 | -990.59284106328 | <0.51 |
| YY1 | 129 | 6.26946366001423 | <0.73 |
| RXR-alpha | 982 | 7.32617901189514 | <0.31 |
| HIF-1 | 808 | 8.78129055186863 | <0.07 |
| AhR | 353 | 7.60346027648978 | <0.16 |
| PU.1 | 383 | -989.21970032057 | <0.54 |
| HNF-4 | 701 | -988.724475409946 | <0.29 |
| NRSF | 605 | -987.608657603403 | <0.24 |
Els resultats obtinguts d'introduir la seqüència promotora al PROMO es mostren a la taula 2. Aquests resultats han segut obtinguts assumint un percentatge de dissimilitud del 15% i aplicant un filtre només pels factors de transcripció humans.
A partir dels resultats obtinguts, s'ha reduït la llista dels factors de transcripció eliminant els que tenen un RE equally inferior a 0,1. Ens hem centrat en aquest paràmetre i no en el RE query perquè el primer ens determina la probabilitat de trobar els nucleòtids de forma equiprobable respecte seqüències a l'atzar i el segon respecte la nostra seqüència. Com que només tenim una seqüència, creiem que és millor donar més importància al RE equally i filtrar els no resultats a partir d'aquí.
Un cop seleccionats els resultats s'obté una llista més curta però on s'observa que els factors de transcripció estan repetits perquè s'uneixen en més d'una posició. Es torna a filtrar la llista eliminant de totes les posicions d'unió de cada factor aquella amb un RE equally més baix. El nombre d'unions de cada factor es refereix als cops que s'uneix aquest factor en llocs diferents però només es mostra el lloc on s'uneix amb una RE equally més baixa.
Aquest resultat és el que trobem a la taula 2.
| FACTOR DE TRANSCRIPCIÓ | POSICIÓ | RE-EQUALLY | N°UNIONS | FACTOR DE TRANSCRIPCIO | POSICIÓ | RE-EQUALLY | N°UNIONS |
| AhR:Arnt [T05394] | 182 | 0.00315 | 2 | HNF-4alpha[T03828] | 791 | 0.01515 | 1 |
| AP-1 [T00029] | 329 | 0,01678 | 1 | ELF-1 [T01113] | 285 | 0,002701 | 1 |
| c-Ets-2 [T00113] | 373 | 0,04196 | 1 | GATA-3 [T00311] | 992 | 0.02111 | 1 |
| c-Fos[T00123] | 332 | 0,02098 | 1 | Ik-1[T02702] | 791 | 0,00034 | 4 |
| c-JUn [T00133] | 331 | 0,06714 | 5 | LEF-1 [T02905] | 563 | 0,06714 | 1 |
| COUP-TF1 [T00149] | 90 | 0,00492 | 2 | MAZ [T00490] | 365 | 0,00079 | 6 |
| CTF [T00174] | 188 | 0,01416 | 2 | MEF-2A [T01005] | 647 | 0,02203 | 2 |
| E2F-1 [T01542] | 592 | 0,08392 | 2 | NF-kappaB1 [T00593] | 863 | 0,00944 | 1 |
| EBF [T05427] | 441 | 0,03881 | 2 | POU2F2 [T00646] | 74 | 0,01259 | 1 |
| Egr-3 [T00243] | 595 | 0,02111 | 1 | PU.1 [T02068] | 317 | 0,02416 | 1 |
| ETF [T00270] | 484 | 0,005226 | 5 | PXR1:RXR-alpha [T05671] | 688 | 0,03357 | 2 |
| GCF[T00320] | 501 | 0,05035 | 1 | RAR-beta [T00721] | 961 | 0,04196 | 1 |
| GR [T05076] | 1046 | 0,06714 | 1 | RXR-beta: RXR-alpha [T05420] | 767 | 0,00295 | 2 |
| HNF1B [T01950] | 53 | 0,04196 | 1 | Sp1 [T00759] | 196 | 0,00105 | 7 |
| HNF-1C [T01951] | 52 | 0,01259 | 1 | RAR-alpha1 [T00719] | 301 | 0,01136 | 1 |
| HNF-3alpha [T02512] | 882 | 0,05035 | 1 | NF-Y [T00150] | 192 | 0.00955 | 2 |
Els factors de transcripció obtinguts mitjançant aquests dos procediments es comparen per tal de veure si coincideixen. Els factors de transcripció coincidents, així com la posició on s'uneixen, es determinen en la taula 3.
| FT COINCIDENTS | PERL | PROMO |
| AP-1 [T00029] | 337 | 329 |
| PU.1 [T02068] | 383 | 317 |
En aquesta taula podem veure com només 2 factors de transcripció coincideixen en ambdós mètodes. D'aquests dos, cap coincideix en el lloc d'unió.
L'obtenció de resultats diferents és degut a que l'algoritme utilitzat pels dos mètodes no és el mateix. Cal dir que, tot i canviar la dissimilitud al 10 % o al 20% al Promo, els resultats obtinguts són els mateixos, sempre amb només dues coincidències.