TEMA 2. DIVERSITAT FENOTÍPICA I VARIACIÓ GENÈTICA II (2015)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Genètica de Poblacions
Año del apunte 2015
Páginas 12
Fecha de subida 02/03/2015
Descargas 33
Subido por

Vista previa del texto

TEMA 2: DIVERSITAT FENOTÍPICA I VARIACIÓ GENÈTICA II 1. TIPUS DE POLIMORFISMES DEL DNA: SEQÜÈNCIACIÓ En aquesta imatge es pot veure l’estructura d’un gen: les regions flanquejants 5’ i 3’, les 5’UTR i 3’UTR (UnTranslated Region), les regions codificants (amb exons i introns).
En les seqüències hi ha 2 tipus de variació: - SNPs: són canvis d’un sol nucleòtid. En una base concreta, en alguns individus per exemple hi trobem una C i uns altres una T.
- Indel: la seqüències d’una persona té més bases que la d’una altra. Això està causat per insercions i delecions (d’aquí ve el nom indel).
Si hi ha SNPs en una regió no traduïda, aquest és un polimorfisme silenciós. Si es traduís, una base diferent podria fer canviar el triplet i que codifiqués per un aminoàcid diferent (polimorfisme no sinònim) o que el triplet nou igualment codifiqués pel mateix aminoàcid que l’original (polimorfisme sinònim). Si hi ha un polimorfisme no sinònim, però igualment els aminoàcids diferents tenen la mateixa càrrega, en l’electroforesi no es detecta aquest canvi (per això l’electroforesi era limitada).
2. MESURES DE LA VARIABILITAT NUCLEOTÍDICA Si mesurem la variabilitat dels gens, ens estem quedant curts, perquè també podem mesurar la variabilitat directament en el DNA. Per mesurar els següents paràmetres de variació nucleotídica una mostra de n seqüències d’una regió del genoma d’una espècie.
- Polimorfisme nucleotídic S*: proporció de nucleòtids polimòrfics (també se’ls anomena llocs segregants) en el total de la seqüència que estudiem. Això varia molt amb la mida de les mostres.
𝐒 ∗= 𝐒 𝐋 - Watterson ϴ: mesura el mateix que S*, però és la mesura corregida. Es corregeix amb el factor de correcció a, que té en compte la mida n de la mostra.
𝚹= 𝐒∗ 𝐚 1 1 1 1 1 𝐚 = [1 + + + + + ⋯ + ] 2 3 4 5 (𝐧 − 1) - Diversitat nucleotídica o heterozigosi esperada a nivell nucleotídic: és el nombre promig de diferències entre seqüències agafades per parelles entre la longitud de la seqüència.
𝛑= 𝚷 𝐋 Ex: variabilitat nucleotídica en el gen Rhodopsin 3 de Drosophila simulans: Ex: com es calcula la diversitat nucleotídica? S’agafen les seqüències nucleotídiques en parelles i en cada parella s’observa quantes diferències hi ha: Seqüències 1 i 2: 8 diferències Seqüències 1 i 3: 9 diferències Seqüències 1 i 4: 12 diferències Seqüències 1 i 5: 11 diferències Seqüències 2 i 3: 8 diferències Seqüències 2 i 4: 7 diferències Seqüències 2 i 5: 10 diferències Seqüències 3 i 4: 5 diferències Seqüències 3 i 5: 4 diferències Seqüències 4 i 5: 5 diferències Hem fet 10 comparacions, per tant, la mitjana de diferències és: 𝚷= 8 + 9 + 12 + 11 + 8 + 7 + 10 + 5 + 4 + 5 = 7,9 10 𝛑= 𝚷 7,9 = = 0,0158 𝐋 500 Watterson i diversitat nucleotídica han de ser molt semblants. Tenim la següent fórmula: 𝜋 = 4 · Ne (població efectiva) · µ (taxa de mutació) Si tenim la diversitat nucleotídica i la taxa de mutació, podem calcular la mida de la mostra. Així doncs, la diversitat nucleotídica es veu afectada per la mida de la població i per la taxa de mutació. Les diferències de diversitat nucleotídica entre grups i espècies es podran explicar pel fet de tenir diferents mides de població o taxes de mutacions.
En estudis de variabilitat nucleotídica en diferents espècies i grups, es van obtenir els següents valors de diversitat. Podem observar que la diversitat disminueix de procariotes a vertebrats.
Com s’explica? La interpretació d’això rau en la mida de la població: els procariotes tenen poblacions enormes, mentre que els vertebrats normalment tenen poblacions que difícilment superen l’ordre de 104. Com la diversitat nucleotídica és directament proporcional a la mida de la població, els procariotes, que tenen poblacions molt més grans, tenen més diversitat nucleotídica.
En aquest article es van trobar 43 polimorfismes en el gen de la alcohol deshidrogenasa de Drosophila melanogaster. D’aquests 43 polimorfismes, tots eren silenciosos menys 1, justament el que provocava que la proteïna corrés diferent en l’electroforesi. Això demostra que hi ha molta variabilitat oculta que no és visible si utilitzem segons quins experiments.
3. DIVERSITAT NUCLEOTÍDICA NUCLEAR I MITOCONDRIAL Quan el 2001 es va publicar el primer esborrany del genoma humà, es va fer un estudi de variació (ja que es va fer gràcies a diversos donants). Es van comparar els genomes de diferents donants i es van detectar 1,42 milions de SNPs (Single Nucleotids Polimorphisms) repartits per tot el genoma.
Es va veure que la majoria dels SNPs es trobaven en autosomes, i que la densitat en la que es trobaven era de 1 SNP cada 1,85 kb. En els cromosomes sexuals, per contra, hi ha menys SNPs i en menys densitat (1 SNP cada 3,77 kb en el cromosoma X i cada 5,19 kb en l’Y). És lògic que hi hagi molts més SNPs en autosomes, ja que hi ha més autosomes que cromosomes sexuals.
La diferència de densitat, però, és el que realment ens fa veure que hi ha més SNPs, i en conseqüència més diversitat nucleotídica, en els autosomes. Això s’explica per la diferència en la mida de la població de cromosomes. La mida efectiva (Ne) de qualsevol autosoma és 4 cops més gran que la del cromosoma Y, i 1,33 cops més gran que la del cromosoma X (per cada 4 còpies d’un autosoma en la població, hi ha 3 còpies del cromosoma X, i una còpia del cromosoma Y).
El 2012, amb les dades del projecte dels mil genomes (que pretenia seqüenciar mil genomes i comparar-los per estudiar la variabilitat present en l’espècie humana) es va veure que hi havia molts més SNPs. De fet, es va estimar que hi havia uns 38 milions de SNPs. També es van trobar 1,4 milions d’indels, i 14.000 delecions grans (tot i que aquestes ja es consideren variacions estructurals). La majoria de SNPs nous que es van trobar van ser al cromosoma X.
En un treball recent es va comparar la diversitat nucleotídica entre l’espècie humana i les espècies de primats properes filogenèticament. Es van genotipar els genomes de diversos humans, ximpanzés, goril·les, orangutans... i en aquest cas es va calcular l’heterozigosi observada.
Es va veure que els humans no africans tenien una heterozigositat que concordava amb l’obtinguda en altres estudis (projecte genoma), però en els africans l’heterozigositat era major.
Entre els africans hi ha més variabilitat.
Dins els ximpanzés, el bonobo té una variabilitat molt menor a la resta de les subespècies, comparable a la dels humans no africans. Però les altres subespècies tenen una variabilitat més alta. Com hem dit abans, la mida de la població és important alhora de determinar la diversitat nucleotídica (i gènica, recordem la fórmula d’abans). És possible que com la població de bonobo és més petita, tingui menys diversitat.
En aquesta taula, si comparem les dues columnes veiem que sembla haver-hi tres patrons: - Vertebrats: la variació en el DNA mitocondrial és molt més gran que la del nuclear.
- Invertebrats: la variació és semblant en el DNA mitocondrials i el nuclear.
- Plantes: en el DNA mitocondrial la diversitat és molt menor que en el DNA nuclear.
Per tant, no passa el mateix en tots els grups. A què es deuen aquestes diferències? Si ens basem en el model neutralista (és a dir, ens basem en el que coneixem, les fórmules conegudes...) s’haurien de deure a la mida de la població efectiva o a la taxa de mutació. En el DNA mitocondrial, la mida efectiva és aproximadament quatre vegades més petita que en el DNA nuclear (perquè només es transmet a través de les femelles i de forma haploide). Però la relació amb la diversitat del nucli canvi en cada grup, per tant també hi ha de tenir alguna cosa a veure la taxa de mutació.
Aquesta taula mostra per què hi ha polimorfismes que no causen cap canvi d’aminoàcid (canvi sinònim). De fet, hi ha més polimorfismes sinònims que no-sinònims. Així, podem calcular tots els paràmetres explicats abans (S*, 𝜋...) per separat pels llocs que tenen canvis sinònims i pels que tenen canvis no-sinònims.
Direm Ls als llocs que tenen canvis sinònims, i La als que tenen canvis no sinònims.
Ls = S4 + 1/3 · S2 La = S0 + 2/3 · S2 S4 són els llocs on qualsevol canvi de nucleòtid dóna el mateix aminoàcid (en la taula es mostren com una N). S0 són els llocs on qualsevol canvi de nucleòtid provoca un canvi d’aminoàcid. S2 són els llocs on dels tres possibles nous nucleòtids, un mantindrà el mateix aminoàcid, i els altres dos provoquen un canvi d’aminoàcid.
4. TIPUS DE POLIMORFISMES DEL DNA: ALTRES MÈTODES POLIMORFISME DE LES DIANES DE RESTRICCIÓ Es digereix el DNA amb un enzim de restricció. Els fragments de DNA resultants se separen segons la mida amb una electroforesi. Les bandes de DNA obtingudes no són visibles per si soles al gel d’agarosa, i per això cal fer un southern blot.
Per fer un southern blot, les bandes s’han de transferir a una membrana de nylon. En aquesta membrana de nylon es posen unes sondes de DNA marcades radioactivament. Les sondes hibridaran amb les bandes que continguin la seqüència complementària de la sonda. Si il·luminem la membrana amb raigs X, es veuen les bandes que han hibridat.
Els polimorfismes poden fer que en diferents genomes apareguin noves dianes de restricció o en desapareguin d’altres. Així, podem detectar polimorfismes segons els patrons de bandes aconseguits.
A més, el fet de detectar variació en les dianes de restricció, també ens permet estimar la diversitat nucleotídica. (En l’esquema es mostra com a exemple la diana de restricció de l’enzim EcorI).
POLIMORFISME DE LA LONGITUD DELS FRAGMENTS DE RESTRICCIÓ (Restriction Fragment Length Polymorphism – RFLP) Una dels primers tipus d’estudi de la variació va ser aquest. La variació en la longitud dels fragments de restricció es detecta quan es talla el DNA amb un enzim de restricció, ja que només amb un SNP pot aparèixer o desaparèixer una diana de restricció. Per tant, segons les dianes que hi hagi, els fragments de DNA resultants tindran una longitud diferent.
(Ni puta idea de la diferència amb el mètode anterior, no la va saber explicar ni el profe).
DNA POLIMÒRFIC AMPLIFICAT ALEATÒRIAMENT (Random Amplified Polymorphic DNA – RAPD) S’utilitzen uns encebadors qualssevol per fer una PCR. En aquesta PCR, per tant, s’amplificaran fragments aleatoris del genoma amb seqüències diferents, tots aquells que es trobin entre els encebadors que hem utilitzat. Es fa una electroforesi amb els fragments amplificats obtinguts, i s’aconsegueix un patró de bandes.
Si es repeteix el mateix procés, amb els mateixos encebadors, en una altra mostra, el patró de bandes canviarà, perquè només un SNP ja pot fer que la seqüència que reconeixen els encebadors canviï, i per tant ja no s’amplifiquin els mateixos fragments.
Per tant, patrons de bandes diferents ens permeten detectar que hi ha variabilitat. Després d’això, però, es pot extreure la seqüència amplificada de la banda que varia, seqüenciar-la, mirar a quin lloc del genoma pertany...
POLIMORFISME EN LA LONGITUD DELS FRAGMENTS AMPLIFICATS (Amplified Fragment Length Polymorphism – AFLP) Amb uns enzims de restricció dels quals coneixem la diana, es digereix el DNA en fragments de diferent mida. Als fragments resultants se’ls afegeix uns adaptadors a cada extrem. Els adaptadors són unes seqüències conegudes que serveixen per amplificar els fragments als quals s’uneixen. Ara, per dissenyar els encebadors només cal posar la seqüència complementària als adaptadors més les bases de la diana de restricció.
Els adaptadors s’usen perquè només les bases de la diana de restricció no són suficients per fer un encebador, en calen més, i la resta de bases dels fragments ja varien les unes de les altres.
Per això s’afegeixen els adaptadors, i es fa que tots els fragments tinguin una seqüència igual.
Després d’amplificar els fragments amb una PCR, farem una electroforesi, i també s’obtindrà un patró de bandes que variarà en diferents mostres, ja que un sol SNP ja pot fer canviar dianes de restricció. Per tant, aquest mètode també permet detectar variació nucleotídica.
Essencialment, aquest mètode és igual que l’anterior, la diferència rau en que s’utilitzen dianes de restricció i adaptadors.
MICROSATÈL·LITS Aquest mètode encara se segueix utilitzant de forma bastant àmplia. Els microsatèl·lits són regions hipervariables del genoma. Estan formats per seqüències de 2 a 10 nucleòtids que es repeteixen n vegades. Aquesta variació no es va descobrir fins als anys 90.
La variació dels microsatèl·lits rau en el nombre de repeticions que hi ha de la seqüència. Pot estar repetida 10, 20, 56 vegades...
Per amplificar aquestes regions hem d’utilitzar uns encebadors que s’uneixin als dos extrems de la seqüència microsatèl·lit (amb unes bases d’espai entre la seqüència i l’encebador). Tot i utilitzar els mateixos encebadors en la mateixa regió del genoma, la longitud del fragment amplificat variarà (ja que hi pot haver més o menys seqüències repetides). Normalment la variació dels microsatèl·lits és multial·lèlica i codominant.
Els microsatèl·lits són bastant difícils de detectar, seqüenciar... però un cop ja s’ha fet aquesta feina, fer-ne un estudi de la variació és fàcil.
Quan s’estudien microsatèl·lits, s’observa molta més diversitat gènica que la que es pot observar fent electroforesis de proteïnes “normals”.
En el següent esquema, cada línia representa un microsatèl·lit. La heterozigositat és de mitjana 0,65 per una mostra de 216 cromosomes X estudiats, i de 0,7 per 5048 autosomes.
ÚS DELS MICROSATÈL·LITS EN LA IDENTIFICACIÓ D’INDIVIDUS Una sola reacció de PCR múltiplex permet esbrinar el sexe de l’individu i el genotip de 10 loci microsatèl·lits. La probabilitat de que dos individus coincideixin en els resultats d’aquesta reacció és de 10-13.
El múltiplex pot amplificar simultàniament diversos loci a la vegada (normalment uns 10). Per no confondre’s entre fragments de diferents loci (que poden tenir la mateixa longitud) s’utilitzen fluorocroms. A més, també es pot jugar amb els encebadors per fer que en cada loci estudiat els fragments siguin d’una longitud molt diferent que la dels fragments d’altres loci. En l’esquema es veu que entre els loci marcats amb fluorocrom verd l’amelogenina té uns fragments de l’ordre de 100 bases, el D8S1179 de l’ordre de 150 bases, el D21S11 de 200...
Dins un mateix loci microsatèl·lit, les diferències entre fragments són molt petites, de bases. Per això per separar-los per la mida es fa una electroforesi capil·lar.
En tots els loci en que hi ha dos pics vol dir que l’individu és heterozigot per aquell loci microsatèl·lit. Per exemple, en el locus D18S51 porta dos al·lels: el 16 i el 18. Aquest individu en concret només heterozigot pel locus D19S433.
L’amelogenina serveix per determinar el sexe. És un gen que es troba en els cromosomes sexuals, tant en l’X com en l’Y. Però en aquest cas, només hi ha diferència entre l’al·lel que es troba en el cromosoma X i en el del cromosoma Y. Per tant, si hi ha dos pics en aquest locus, l’individu és mascle. Si només hi ha un pic, és femella.
5. VARIACIÓ ESTRUCTURAL EN EL GENOMA HUMÀ La variació estructural s’ha estudiat més tard, perquè és molt més complexa. N’hi ha molta més i produeix efectes molt més importants.
Parlem de variació estructural quan les alteracions impliquen regions de DNA de més de 1 Kb.
Es subdivideixen en: - Les que provoquen una alteració de la quantitat de DNA (variació en el nombre de còpies, o delecions d’entre 1 i 3,89 Kb (CNV)). Les CNV són de mitjana de 103 Kb, i es troben repartides sobretot en regions centromèriques i telomèriques.
- Les que mantenen la quantitat de DNA (inversions, translocacions...).
Les regions del genoma duplicades o delecionades contenen gens, les conseqüències poden ser molt importants. Com veiem en el següent esquema, les possibilitats poden variar molt i ser molt complexes: ...