Tema 2.2 - Genes (2016)

Apunte Catalán
Universidad Universidad de Girona (UdG)
Grado Biología - 3º curso
Asignatura Genómica
Año del apunte 2016
Páginas 9
Fecha de subida 19/03/2016
Descargas 63
Subido por

Descripción

Tema 2.2 - Genes: Els introns, els gens, els pseudogens, non processed pseudogenes, processed pseudogenes, numts, what is a gene?, phenomena complicating the concept of gene, results from ENCODE- dispersed genome activity, a proposed updated definition.

Vista previa del texto

Genòmica – T2.2 - Sònia Vivo TEMA 2.2: GENES El projecte ENCODE (anys 2001-2003) va aconseguir seqüenciar el genoma humà i trobar les funcions dels gens presents en aquest genoma.
Com ja sabem un gen està format per un promotor, unes regions 3’ i 5’ UTR (UnTranslated Regions), exons i introns. Els exons són regions codificants (van des del codó d’iniciació (ATG) fins el codó stop). Els introns són seqüències que trenquen els exons (formen disrupted exons) fet que pot tenir funcions reguladores de l’expressió gènica.
Exon is any nucleotide sequence encoded by a gene that remains present within the final mature RNA product of that gene after introns have been removed by RNA splicing.
Un intró és “qualsevol cosa que és extreta del mecanisme de l’splicing”.
Dystrophin gene és el gen humà més gran (2.2Mb). Ocupa el 0.07% del genoma total (recorda que tan sols el 1.5% del genoma forma part de gens codificants de proteïnes). Els investigadors varen tardar 16 hores en transcriure aquest gen. Té 28 isoforms coneguts, és a dir, és un gen codificant per 28 proteïnes diferents. Dystrophin es troba a Xp21 (Cromosoma X, braç petit (petite), regió 21) → Xl21 (cas hipotètic) seria al cromosoma X, al braç llarg (large), regió 21). Està format per 79 exons i 78 introns (400kb). El transcrit primari està format per 2400kb i el mRNA madur per 14kb i 3500 Aa.
● Els Introns: Hi han 4 tipus d’introns.
2 tipus d’introns els quals necessiten enzims externs per eliminar-se: - Introns en gens nuclears codificants de proteïnes. Són els introns clàssics, els que es relacionen amb el mRNA. Necessiten, com hem dit, un enzim per eliminar-se → l’spliceosoma.
- Introns en gens (nuclears i en arqueus) de transferència d’RNA (tRNA)- Són eliminats per enzims d’splicing del tRNA.
2 altres tipus d’introns els quals són capaços d’eliminar-se a sí mateixos: 1 - Genòmica – T2.2 - Sònia Vivo Introns de self-splicing grup I: eliminats per catàlisis de l’RNA → Es separen gràcies a una G.
- Introns self-splicing grup II: eliminats per catàlisis de l’RNA → Es separen gràcies a una A.
● Els Gens: Els gens poden ser classificats en 3 classes depenent de la RNA polimerasa: - Classe I → són gens ribosomals de RNA, transcriuen el 50% de l’RNA (mai trascriu el 5SRNA) que formarà part dels ribosomes (rRNA). Aquest RNA és el més actiu a les cèl·lules.
Aquests gens estan, normalment, organitzats en tandem repeats i n’hi han centenars de milers de copies.
- Classe II → són gens que transcriuen per l’RNA missatger (mRNA), l’RNA petit nucleolar (snRNA) i el microRNA. Aquest RNA poden patir modificacions post-traduccionals.
- Classe III → són els gens menys funcionals. Sintetitzen 5s rRNA, tRNA i altres petits RNAs.
● Els Pseudogens: Els pseudogens són gens disfuncionals: els gens perden la funció de ser codificants per proteïnes o ja no s’expressen a la cèl·lula ja que han patit mutacions disruptives (s’ha format un disrupted gene): 2 Genòmica – T2.2 - Sònia Vivo S’estima que el genoma humà conte uns 19.000 psudogens (repartits en els tres tipus seguents): - Non processed pseudogenes: A copy of a functional gene may arise as a result of a gene duplication event and subsequently acquire mutations that cause it to become nonfunctional.
Un pseudogen no processat és una copia d’un gen funcional. Aquesta copia ha estat causada per una duplicació gènica. La còpia, però, ha patit alguna mutació la qual provoca que el “nou” gen sigui no funcional.
Si comparem el genoma humà amb el genoma d’un ocell (Gallus gallus) observem que hi ha un mateix gen però que en humans és no funcional (pseudogen) i en Gallus gallus sí ho és (gen).
Aquests “gens” són ortòlegs.
- Processed pseudogenes: mRNA transcript of a gene is spontaneously reverse transcribed back into DNA and inserted into chromosomal DNA. → Un RNA missatger es transcrit inversament a DNA i inserit al DNA cromosòmic (estan relacionats amb els transposons).
Els pseudogens processats NO tenen introns perí SÍ tenen cua poly A. Els no processats SÍ tenen introns però NO tenen cua poly A.
- Numts: El numts són fragments de gens del genoma mitocondrial incorporats al genoma del nucli. Són pseudogens nuclears amb origen mitocondrial.
El DNA mitocondrial té 16Kb (la mida del DNA circular del mitocondri és de 16Kb). Alguns numts són fragments d’aquest DNA i altres numts són tot el DNA circular complert introduït al DNA nuclear.
3 Genòmica – T2.2 - Sònia Vivo Els pseudogens, com hem comentat, són disruptes genes i, per tant, s’espera que no tinguin cap funció. S’ha vist, però, que això no és cert. A continuació es mostraran alguns exeples de psudogens que sí tenen una funció determinada: EXEMPLE CHONDRODYSPLASTIC DOGS: Els gossos poden tenir les potes curtes (chondrodysplastic dogs) o tenir-les normals (nonchondrodysplastic dogs). El gen relacionat amb aquests fenotips és el fgf4. En el gen normal hi han introns, exons, seqüències reguladores, etc. En transcriure’s aquest gen es produeix una proteïna funcional i els gossos tenen el fenotip normal pel les potes (llargues).
En altres gossos, però, aquest gen ha mutat i ha format un pseudogen processat. Aquest pseudogen processat actua com un transposó i es situarà a una altra part del genoma. El pseudogen fgf4 no té introns i pot haver patit algun canvi nucleotídic a la seva seqüència. Els gossos que tenen aquest pseudogen processat (fgf4 retrogene) tenen un fenotip diferent, són gossos chondodysplastics → potes curtes. Les mutacions al gen han fet que aquest pseudogen sí es transcrigui i tradueixi a una proteïna però aquesta proteïna tindrà una seqüència diferent fet que provocarà que el gos tingui les potes curtes.
La definició de pseudogen, doncs, no és sempre correcte ja que en aquest exemple el pseudogen sí té una funció determinada.
4 Genòmica – T2.2 - Sònia Vivo EXEMPLE PTEN GENE: El gen PTEN és un gen supressor de tumors. Aquest gen es troba al cromosoma 10. Es transcriu en un RNA amb 2 seqüències (S1 i S2) a la regió 3’UTR. Com que es tradueix a una proteïna supressora de tumors, hi haurà menys probabilitats de patir un càncer.
La seqüència S1 és la diana del microRNA. Quan el microRNA s’uneix amb la seqüència S1, no hi ha la producció de la proteïna i, per tant, hi ha més probabilitats de tenir un càncer.
Al cromosoma 9, hi ha un pseudogen processat (PTENP1). Aquest pseudogen té unes petites mutacions a la seqüència codificant respecte el gen inicial (PTEN). Una de les mutacions crea un codó STOP. Aquest fet impedeix que la proteïna repressora de tumors es formi a partir de la transcripció i traducció d’aquest pseudogen. Tos i això, si que es pot transcriure (però no traduir) a una seqüència la qual té les seqüències S1 i S2. La seqüència S1, com ja hem comentat, és la diana del microRNA.
Aquest microRNA, doncs, té dues dianes: La seqüència S1 del gen funcional (PTEN) i la S1 del pseudogen processat (PTENP1).
L’RNA no funcional (la transcripció del pseudogen) al fer de diana del microRNA fa que hi hagi menys microRNA el qual vagi al RNA normal. Així doncs, es poden traduir més proteïnes supressores de tumors.
El pseudogen fa d’esquer (esquer en anglès és decoy) pel microRNA.
El pseudogen el qual en principi no tenia cap funció ja que no era codificant de proteïnes acaba tenint una funció molt important → aconseguir que hi hagi més proteïnes PTEN i més supressió tumoral.
5 Genòmica – T2.2 - Sònia Vivo ● What is a gene? L’última definició de gen la va proposar the encyclopedia of DNA elements (ENCODE).
Van fer un test experimental i varen veure que el 80% del genoma tenia funció en algun moment i en algun procés determinat. Creuen, però, que el 100% del genoma té una funció tot i que no ho han pogut testar experimentalemnt.
Es varen proposar diverses definicions de què és un gen abans que ho fes ENCODE: - Segons Human Genome Nomenclautre Organization (2002) un gen és → a DNA segment that contributes to phenotype/function. In the absence of demonstrates function a gene may be characterized by sequence, transcription or homology.
- Segons Sequence Ontology Consortium (2006) un gen és → locatable region of genomic sequence, corresponding to a unit of inheritance, which is associated with regulatory regions, transcribed regions and/or other functional sequence regions.
Hi han moltes part d’aquestes dues definicions més tradicionals, però, que no acaben de quadrar (hi han diversos “problemes” amb aquestes definicions): 1. Gene regulation: són seqüències (trans, gen que regula) que poden afectar pràcticament cada aspecte de la regulació gènica. Són seqüències que es poden trobar dins la seqüència codificant del gen, a regions adjacents al gen o molt allunyades d’aquest.
2. Overlapping (solapament): a la mateixa seqüència del DNA poden haver-hi dos marcs de lectura diferents (reading frames) (a la mateixa seqüència s’engloben 2 gens diferents depenent del marc de lectura que s’utilitzi) o un gen es pot trobar dins l’intró d’un altre gen.
↳ 3 possibles marcs de lectura diferents per a una mateixa seqüència.
3. Splicing and Trans-splicing: una mateixa seqüència pot donar diferents productes mitjançant diferents splicings (diferents mRNA). El trans-splicing fa referència a que dos gens es transcriuen i els mRNAs s’uneixen per traduir-se a una sola proteïna. El tandem chmerism fa referència al fet que dos gens consecutius codificants de proteïnes poden transcriure’s al mateix temps a un mateix mRNA produint una fused protein → la RNA polimerasa es salta la senyal de stop i segueix transcrivint.
6 Genòmica – T2.2 - Sònia Vivo 4. Parasitic and mobile genes: són els transposons → gens que poden canviar de lloc.
5. The lage amount of “junk DNA” under selection and Transcribed: Hi ha molt de junt DNA que és transcrit i traspassat a la descendència (selecció). Junk DNA significa DNA escombraries. No és correcte utilitzar aquesta nomenclatura ja que segurament aquest DNA sí te alguna funció.
- Phenomena complicating the concept of the gene: A continuació es mostren un seguit de fenòmens que produien gens no funcionals que al final resulta que sí tenen una funció determinada: - Results fom ENCODE - dispersed genome activity: 1. Unannotated transcription: Quan un gen està annotated vol dir que s’en sap totes les funcions i l’estructura. Així doncs, quan un gen no està anotat (non-annotated o unannotated) 7 Genòmica – T2.2 - Sònia Vivo vol dir que no es coneix què fa. Hi ha molt de non-annotated DNA que té una funció al genoma ja que és transcrit a mRNA (hi han TARs (Transcriptionally Active Regions) i transfrags) però encara no es sap quina és aquesta funció.
2. Unannotated and alternative TSSs: la transcripció no sempre comença allà on pensem, pot començar a molts punts diferents del genoma. Els TSSs són unannotated Transcription Start Sites.
3. More alternative splicing: existeix més splicing del que pensavem per gen. De mitja, cada gen pot ser transcrit de 5’4 maneres diferents → un gen pot produir 5’4 mRNAs diferents.
4. Dispersed regulation: 1 gen determinat té molts punts de regulació. Els punts de regulació poden estar downstream (lo més “normal”), upstream, dins el propi gen o molt allunyat del gen.
En el genoma tenim regions riques en seqüències reguladores i regions pobres d’aquestes seqüències.
5. Noncoding RNAs, Pseudogenes, Constrained elements: noncoding RNA fa referència a aquell RNA que no es tradueix a proteïna. Les constrained regions (UCR) són regions seleccionades negativament. El 40% de UCR són seqüències codificants de proteïnes les quals s’espera que estiguin seleccionades negativament. El 60% són seqüències no codificants però que tenen alguna funció determinada.
Les UCR són seqüències de 200 parells de bases (pb). Són seqüències petites les quals no canvien gaire, o gens, entre espècies → pot tenir més o menys la funció del 16S rRNA.
8 Genòmica – T2.2 - Sònia Vivo - A proposed updated definition: Es varen proposar diverses definicions de què és un gen abans de trobar la definició definitiva: 1. A gene is a genomic sequence (DNA or RNA) directly encoding functional product molecules, either RNA or protein.
2. In the case that there are several functional products sharing overlapping regions, one takes the union of all overlapping genomic sequences coding for them.
3. This union must be coherent—i.e., done separately for final protein and RNA products—but does not require that all products necessarily share a common subsequence.
La definició final de què és un gen, però, va ser la següent: A gene is a union of genomic sequences encoding a coherent set of potentially overlapping functional products.
Si analitzem aquesta definició veiem que: - [...] union of genomic sequences [...] indica que una seqüència pot formar part de diferents gens i/o que les seqüències que formen un gen poden estar en diferents parts del genoma.
- [...] overlapping functional products. indica que els productes del solapament han de ser funcionals. Si no són funcionals, allò no és un gen! I, a més, també indica que en una regió del genoma es poden produir diferents productes funcionals.
Anteriorment s’afirmava que: gen=locus i gen= 1 producte. Això, però, no sempre és veritat com veiem a la definició anterior.
9 ...