TEMA 4. ORGANITZACIÓ DE LA VARIACIÓ GENÈTICA II (2015)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Genètica de Poblacions
Año del apunte 2015
Páginas 14
Fecha de subida 18/03/2015
Descargas 29

Vista previa del texto

TEMA 4: ORGANITZACIÓ DE LA VARIACIÓ GENÈTICA II 1. EQUILIBRI GAMÈTIC I ASSOCIACIÓ GAMÈTICA EQUILIBRI GAMÈTIC Considerem dos loci (A i B), cada un amb dos al·lels (p1 i p2, i q1 i q2).
Per tant hi ha quatre combinacions d’al·lels, quatre possibles gàmetes. Els genotips dels gàmetes s’anomenen combinacions gamètiques, tipus gamètics o haplotips.
Parlem d’equilibri gamètic quan els dos loci són estadísticament independents, i llavors la freqüència de cada haplotip sigui la multiplicació de les freqüències dels dos al·lels que el conformen (com està en cada casella en la taula).
Quan les freqüències no siguin aquestes sinó unes altres, direm que la població no està en equilibri, sinó que està en associació gamètica.
ASSOCIACIÓ GAMÈTICA Hi ha un desequilibri entre les freqüències esperades pels haplotips i les reals. La freqüència de cada haplotip (x1, x2, x3 i x4) ara serà la multiplicació de les freqüències dels al·lels que el conformen més una mesura del desequilibri, D.
Quan D sigui més gran que 0, les freqüències x2 i x3 seran menors que les d’aquests haplotips en equilibri (estaran en defecte), i x1 i x4 seran majors (estaran en excés). Als haplotips 2 i 3 se’ls anomena gàmetes de repulsió, i als haplotips 1 i 4 gàmetes d’acoblament.
De fet, amb les mateixes fórmules podem observar que si la diferència dels haplotips 1 i 4 és positiva la dels haplotips 2 i 3 ha de ser negativa. Si partim de que D és la diferència entre x1 i la freqüència esperada: D = x1 − p1 q1 → p1 = p1 q1 + D + x2 → x2 = p1 − p1 q1 − D → q1 = p1 q1 + D + x3 → → → x2 = p1 (1 − q1 ) − D → → x3 = q1 (1 − p1 ) − D → → x4 = q2 (1 − p1 ) + D → 𝐱𝟐 = 𝐩𝟏 𝐪𝟐 − 𝐃 x3 = q1 − p1 q1 − D → q2 = p1 q2 − D + x4 𝐱𝟏 = 𝐩𝟏 𝐪𝟏 + 𝐃 𝐱𝟑 = 𝐩𝟐 𝐪𝟏 − 𝐃 x4 = q2 − p1 q2 + D → 𝐱𝟒 = 𝐩𝟐 𝐪𝟐 + 𝐃 2. MESURES DEL DESEQUILIBRI GAMÈTIC (LD) D = x1 – p1q1 o D = x1x4 – x2x3 Com les freqüències dels haplotips no poden ser negatives, el valor absolut màxim de D serà la freqüència dels haplotips que estiguin en defecte. Per tant: - Dmax: Si D>0, estan en defecte els gàmetes de repulsió, per tant el valor màxim serà p1q2 o p2q1 (la freqüència més baixa de les dues). Aquesta és la Dmax perquè el valor és positiu.
Dmin: Si D<0, estan en defecte els gàmetes d’acoblament, per tant el valor mínim al qual pot arribar D (ja que té un valor negatiu) serà –p1q1 o –p2q2 (la freqüència més baixa de les dues).
Dmax = p1q2 o p2q1 Dmin = –p1q1 o –p2q2 Necessitem una mesura relativa de D, que ens digui com de forta és. Això ho podem fer dividint el valor de D per la D màxima (en el cas de D positiva) o per la D mínima (en el cas de D negativa) a la qual pot arribar una població.
Quan D>0: D′ = D D max Quan D<0: D′ = D D min El màxim desequilibri teòric al qual es pot arribar és D=0,25. Aquesta és la freqüència més alta que pot tenir un haplotip sent la més baixa de les quatre en un sistema amb dos loci. En general, si hi ha més loci, la D màxima teòrica serà 1/2n, on n són els loci que estudiem.
Coeficient de correlació: El coeficient de correlació, ρ, es pot interpretar com la correlació entre dues variables binàries: X (X=1  presència de l’al·lel A1; X=0  absència de l’al·lel A1), i Y (Y=1  presència de l’al·lel B1; Y=0  absència de l’al·lel B1).
Aquest coeficient es pot calcular amb la següent fórmula: sxy 2 𝛒= √s x 2 · s y 2 La covariança i les variàncies respectives les podem obtenir amb aquestes altres fórmules: ̅̅ 𝐬𝐱𝐲 𝟐 = ∑ fi (Xi − ̅ X)(Yi − ̅ Y) = ∑ fi ∗ X i ∗ Yi − ̅̅ XY 𝐬𝐱 𝟐 = ∑ fi ∗ (X i − ̅ X)2 = ∑ fi ∗ X i2 − ̅ X2 𝐬𝐲 𝟐 = ∑ fi ∗ (Yi − ̅ Y)2 = ∑ fi ∗ Yi2 − ̅ Y2 ̅ = ∑ fi ∗ x i 𝐗 ̅ = ∑ fi ∗ yi 𝐘 fi equival a xx, x2, x3...
El coeficient de correlació està relacionat amb el valor del Xi quadrat que faríem si volguéssim contrastar les freqüències d’una població per veure si es troba en desequilibri gamètic: ρ2 = p D2 q 1 1 p2 q2 Xi2 = ρ2·n FREQÜÈNCIA O FRACCIÓ DE RECOMBINACIÓ Aquesta seria la proporció de gàmetes que porten una combinació d’al·lels que no està present en els cromosomes parentals.
Si no hi hagués recombinació, els al·lels que es troben en un mateix cromosoma no se separarien, i les freqüències gamètiques no canviarien mai, serien sempre 50% per cada un dels haplotips parentals.
La recombinació fa que es puguin produir gàmetes diferents dels que han format l’individu.
Si un individu s’ha format per la unió d’un gàmeta A1B1 i un A2B2, per recombinació podrà produir també gàmetes A1B2 i A2B1.
Entre gens que no es troben al mateix cromosoma, com la combinació d’al·lels entre un i l’altre és aleatòria, hi ha un 50% de gàmetes parentals i un 50% de recombinants. Per tant, entre gens que es troben al mateix cromosoma, si hi ha molta recombinació entre ells, la màxima freqüència de gàmetes recombinants que esperaríem seria la mateixa que si es trobessin en cromosomes diferents, és a dir 50%.
3. APROXIMACIÓ A L’EQUILIBRI GAMÈTIC Partim dels mateixos supòsits de població ideal que fèiem servir en l’equilibri Hardy-Weinberg.
El canvi de freqüències gamètiques d’una generació a l’altra té lloc en la formació dels gàmetes a partir de les cèl·lules gonadals de l’adult.
Les següents taules mostren les freqüències dels haplotips i els genotips en la generació 0.
Freqüències dels haplotips en la generació 0 (x1, x2, x3 i x4): Sabent que aquestes són les freqüències dels haplotips dels gàmetes que han format la generació 0, les freqüències dels genotips que observarem en la generació 0 serien les següents.
Per exemple pels següents genotips: - - A1A1B1B1: aquest genotip només es pot haver format per la unió de dos gàmetes A1B1.
La probabilitat de que això passi és x1·x1, o sigui x12.
A1A1B1B2: aquest genotip s’ha d’haver format per la unió d’un gàmeta A1B1 i un A1B2.
Com cada un dels gàmetes pot haver vingut indistintament de qualsevol dels dos progenitors, la freqüència és 2·x1·x2.
A1A2B1B2: aquest genotip es pot haver format per la unió dels gàmetes A1B1 i A2B2, o també per la unió dels gàmetes A1B2 i A2B1. Per tant la probabilitat de trobar aquest genotip, o sigui la seva freqüència, és 2·x1·x4 + 2·x2·x3.
Si fem això amb tots els altres genotips, obtenim la següent taula de freqüències dels genotips: Ara volem calcular les freqüències dels haplotips que produiran aquests fenotips, és a dir, les freqüències dels haplotips de al generació 1.
Per exemple, volem saber x1’, que és la freqüència de l’haplotip A1B1. Aquest només es pot haver produït a partir dels genotips que tinguin aquests dos al·lels.
Genotip A1A1B1B1 A1A1B1B2 A1A2B1B1 A1A2B1B2 Probabilitat de produir l’haplotip A1B1 1 0,5 0,5 Si els haplotips parentals eren A1B1 i A2B2, (1-r)/2 Si els haplotips parentals eren A1B2 i A2B1, r/2 Per tant: 𝐱𝟏′ = x1 2 + 0,5 · 2x1 x2 + 0,5 · 2x1 x3 + 1−r r · 2x1 x4 + · 2x2 x3 = 2 2 = x1 2 + x1 x2 + x1 x3 + (1 − r) · x1 x4 + r · x2 x3 = = x1 2 + x1 x2 + x1 x3 + x1 x4 − r · x1 x4 + r · x2 x3 = = x1 (x1 + x2 + x3 + x4 ) − r · (x1 x4 − x2 x3 ) = = 𝐱𝟏 − 𝐫 · 𝐃𝟎 Si fem el mateix procediment amb els altres haplotips veurem que tenim les mateixes fórmules: 𝐱𝟐′ = 𝐱𝟐 + 𝐫 · 𝐃𝟎 𝐱𝟑′ = 𝐱𝟑 + 𝐫 · 𝐃𝟎 𝐱𝟒′ = 𝐱𝟒 − 𝐫 · 𝐃𝟎 Si el valor de D0 era positiu, i per tant els gàmetes d’acoblament estaven en excés, veiem que justament en la generació 1 la seva freqüència disminueix. I per als gàmetes de repulsió, que estaven en defecte, la freqüència augmenta. Per tant, les freqüències dels haplotips tendeixen a acostar-se a l’equilibri.
x1′ = x1 − r · D0 x1′ = p1 q1 + D1 p1 q1 + D1 = x1 − r · D0 → p1 q1 + D1 = p1 q1 + D0 − r · D0 → D1 = D0 − r · D0 → → 𝐃𝟏 = 𝐃𝟎 · (𝟏 − 𝐫) Aquesta fórmula també ens demostra que el desequilibri en una generació i la següent disminueix. Si generalitzem a t generacions: 𝐃𝐭 = 𝐃𝟎 · (𝟏 − 𝐫)𝟐 La màxima freqüència de recombinació (r) que hi pot haver és 0,5. Si dos gens tenen entre ells aquesta taxa de recombinació, el desequilibri disminuirà a la màxima velocitat de generació en generació. Si r és més petita, disminuirà de forma més lenta.
Per exemple, partint del màxim teòric de desequilibri (D=0,25), si hi hagués una taxa de recombinació r=0,5, es tardaria unes 7/8 generacions fins que el desequilibri arribés a 0. Llavors es diria que els dos gens ja no estarien en associació gamètica, sinó que estarien en equilibri gamètic.
La velocitat a la que D disminueix, per tant, també depèn de r. L’associació gamètica entre dos loci pot romandre en una població durant molt de temps, però tard o d’hora sempre s’arriba a D=0. Això passarà en els casos en que els gens siguin molt propers, i per tant tinguin una r pràcticament de 0.
És a dir, esperem més desequilibri gamètic en els gens més propers, i més equilibri gamètic en els gens llunyans.
ESTIMACIÓ DE LES FREQÜÈNCIES GAMÈTIQUES 4. DETECCIÓ, MESURA I SIGNIFICAT DE L’ASSOCIACIÓ GAMÈTICA Fem una taula de contingència. Calculem els valors esperats per cada haplotip i fem una prova de bondat d’ajust: A partir dels valors observats, podem calcular p1, p2, q1 i q2. Amb aquestes freqüència, el valor esperat per cada haplotip se suposa que és piqj·N.
Xi observat és 184,73. Això és molt significatiu. Observem que són els haplotips en repulsió són els que estan en defecte, ja que els valors observats són menors que els esperats en cas que hi hagués equilibri gamètic.
Podem mesurar el grau de desequilibri (D). Podem fer-ho amb les dues fórmules: 𝐃 = 𝐱𝟏 − 𝐩𝟏 𝐪𝟏 D = 0,2370 – (0,5425)(0,3080) = 0,0699 o 𝐃 = 𝐱𝟏 𝐱𝟒 − 𝐱𝟐 𝐱𝟑 D = (0,2370)(0,3865) – (0,3055)(0,0710) = 0,0699 Com en surt una D positiva, hem de calcular la Dmax per aquests dos loci. Veiem que el gàmeta que està en menys freqüència és NS, per tant: Dmax = p2q1 = 0,4575·0,3080 = 0,1409 D’ = D/Dmax = 0,0699/0,1409 = 0,4961  49,61% ESTIMACIÓ DE LES FREQÜÈNCIES GAMÈTIQUES Partim d’una taula semblant a la d’abans: tenim el nombre d’individus amb cada genotip. La notació és la següent: 11 vol dir que el genotip s’ha format per la unió dels gàmetes A1B1 i A1B1.
Així, els gàmetes són els següents: - A1B1: gàmeta 1.
A1B2: gàmeta 2.
A2B1: gàmeta 3.
A2B2: gàmeta 4.
Podem calcular les freqüències al·lèliques de cada loci: El problema està en el genotip A1A2B1B2, que no podem saber quants s’han format per gàmetes en repulsió (N23) i quants per gàmetes d’acoblament (N14).
Llavors hauríem de tornar a fer el mecanisme iteratiu per saber les freqüències al·lèliques: comencem suposant que tots els individus amb el genotip N* són N14 i cap és N23. A mesura que anem fent els mateixos càlculs una vegada i una altra ens apareixeran els dos genotips.
S’ha de repetir iterativament aquest procés fins que les freqüències s’estabilitzin. Llavors podrem saber les freqüències reals.
ESTIMACIÓ DE LES FREQÜÈNCIES GAMÈTIQUES AMB DOMINÀNCIA En aquest cas no podem diferenciar com abans els genotips. Només podem saber els individus que tenen genotip recessiu en els dos loci (N44), ja que es podran detectar pel fenotip. Amb els heterozigots recessius de cada loci podem calcular les freqüències de l’al·lel recessiu en cada un d’ells (p2 i q2).
p2 = √N3.
q2 = √N.3 Amb el nombre d’individus N44 ja podem calcular la freqüència de l’haplotip A2B2 (x4), que és l’arrel quadrada de N44. Amb tot això podem calcular D amb la següent fórmula: D = x4 – p2q2 A partir de les freqüències al·lèliques que tenim podem calcular les restants, p1 i q1. I amb aquestes i D, podem calcular totes les altres freqüències d’haplotips amb les fórmules que ja coneixem: x2 = p1 q2 − D x3 = p2 q1 − D x4 = p2 q2 + D Aquest mètode és molt menys precís i potent que el reiteratiu, ja que hem partit del supòsit que els dos loci es trobaven en equilibri Hardy-Weinberg.
5. ASSOCIACIÓ GAMÈTICA L’únic factor que elimina l’associació gamètica entre dos loci és la recombinació. A més, entre una generació i una altra, el canvi de les freqüències gamètiques es dóna només en els dobles heterozigots, ja que en els altres, els gàmetes parentals i els recombinants són els mateixos.
També és important saber els factors que generen associació gamètica: - - - - - - - Hibridació: la hibridació és l’encreuament de dues poblacions amb freqüències diferents en dos loci.
Ex: si creuem una població que és tota AA amb una que és tota aa, la primera generació filial serà tota Aa. Tot i que les poblacions inicials estiguessin en equilibri HardyWeinberg, la primera generació filial no ho està.
Si apliquem el mateix a l’equilibri gamètic: si creuem una població que és tota AABB, i una altra que és tota aabb, la primera generació filial és tota AaBb. Aquesta generació ha estat formada només per dos tipus de gàmetes, sembla que hi hagi associació gamètica, tot i que si deixem passar una o dues generacions, si els dos loci no estan lligats, ja s’arriarà a l’equilibri gamètic.
Subdivisió i migració (mescla poblacional): també s’anomena efecte Wahlund. És la mescla de poblacions amb freqüències diferents. Una població es tota AA (freqüència 1) i l’altra tota aa (freqüència 1). Si mesclem les dues poblacions, ens semblarà tenir una població amb una freqüència 0,5 pel genotip AA i 0,5 pel aa. Llavors aquesta població no estaria en equilibri Hardy-Weinberg. Tot i que dues poblacions estiguin en equilibri Hardy-Weinberg, si no tenen exactament les mateixes freqüències, la mescla no estarà.
Si apliquem el mateix a l’equilibri gamètic: mesclem una població que només produeix gàmetes AB (freqüència 1) i una altra que només en produeix ab (freqüència 1). Llavors observem una població on es produeixen gàmetes AB amb una freqüència de 0,5, i ab amb 0,5. Llavors, ens sembla que no està en equilibri gamètic.
Arrossegament (hitchhiking): hi ha dos loci propers. Un al·lel d’un dels loci és favorable evolutivament i per selecció natural n’augmenta la freqüència. Això arrossega la variació existent en el loci proper, que estava en desequilibri amb ell.
Efecte fundador: d’una població donadora un petit nombre d’individus forma una nova població no abans no hi havia individus d’aquesta espècie. Aquest cas es dóna en illes, on un grup d’individus provinent del continent forma una nova població.
Com més petit sigui el grup d’individus fundadors, menys gàmetes portaran, i per tant és més probable que aquests no estiguin en equilibri gamètic. Tot i que això només s’observarà al principi; si els loci no són propers al cap d’unes generacions s’arribarà a l’equilibri.
Deriva genètica: és un efecte de mostreig que hi ha en una població a cada generació.
Com més petita és una població, més passa això. En una generació, només un nombre de gàmetes arriba a produir els genotips de la generació següent. Probabilísticament, pot ser que aquests no estiguin en equilibri, i per tant faran que la següent generació no estigui en equilibri gamètic.
Selecció epistàtica: se seleccionen combinacions d’al·lels. Pot ser que una combinació d’al·lels, des del punt de vista de la selecció natural és molt favorable. No és que un al·lel sigui favorable i arrossegui un al·lel d’un altre loci al qual està lligat, sinó que la combinació de dos al·lels, per alguna raó, és molt més favorable evolutivament que una altra combinació. Llavors, els gàmetes que portin aquesta combinació augmentaran de freqüència, i s’observaran freqüència típiques d’associació gamètica, tot i que potser aquests dos loci no són propers.
Mutació (història genealògica dels haplotips): això té importància en l’estudi de l’associació gamètica en humans.
HISTÒRIA GENEALÒGICA DELS HAPLOTIPS COM A CAUSA D’ASSOCIACIÓ GAMÈTICA En la següent imatge veiem que hi ha dos posicions. En una hi ha un SNP i en l’altre no. Però hi ha una mutació i en el segon lloc es canvia una C per una G, donant lloc a un nou SNP. Aquesta mutació s’hauria pogut donar en un cromosoma que en l’altre SNP tingués una A o una T. En aquest cas s’ha donat amb una A en l’altre SNP.
Si tenim dos llocs amb SNP, teòricament hi ha quatre possibles combinacions d’aquests SNP, però en un primer moment només n’observem tres. En aquest cas, l’haplotip que es troba en freqüència 0 és el TG. Quan un dels haplotips es troba en freqüència 0, hi ha el desequilibri màxim (o mínim, en tot cas el valor absolut és el màxim), i per tant D’=1.
L’haplotip TG podria aparèixer per una altra mutació, però és molt probable que es doni la mateixa mutació que abans en el mateix lloc. Per tant, si apareix, serà per recombinació. Fins que no hi hagi recombinació entre els dos SNPs no hi haurà l’haplotip TG, i per tant el desequilibri serà màxim.
Que hi hagi recombinació o no dependrà de com de propers siguin els dos SNPs. Com més propers, menys probabilitats hi ha de que hi hagi recombinació entre els dos, i més temps es mantindran en associació gamètica amb el desequilibri màxim. Si són més llunyans, més probabilitats de que hi hagi recombinació i aparegui el quart haplotip.
ESTUDIS D’ASSOCIACIÓ GAMÈTICA ENTRES SNPs En el cromosoma 22 hi ha 1500 SNPs. En la gràfica a, cada punt representa una parella d’SNPs, i ens mostra la distància a la que es troben i el desequilibri relatiu que tenen. En la gràfica b és el mateix cas, però no ens mostra la D’ de cada parella, sinó la correlació ρ.
En la gràfica c es mostra la mitjana de la D’ per les parelles de SNPs que es troben a la mateixa distància. Clarament podem observar que a més distància entre SNPs hi ha menys D’.
La gràfica d també mostra la mitjana de ρ per a parelles d’SNPs que es troben a la mateixa distància. També es veu, de manera encara que més pronunciada que amb D’, que com més a prop es troben dos SNPs, més forta és la correlació entre ells.
THE INTERNATIONAL HAPMAP PROJECT El 2002 es va començar un projecte per obtenir un mapa dels haplotips del genoma humà. Es va determinar el genotip de 270 individus de quatre poblacions diferents. Es va analitzar un SNP cada 5 Kb d’eucromatina.
Així, es van poder estudiar les associacions gamètiques entre SNPs.
Es va veure que el genoma humà està format per blocs de SNPs que mostren entre sí una associació gamètica molt gran, amb un desequilibri relatiu pràcticament d’1 (D’=1). Aquests blocs es troben separats per hot spots de recombinació i no estan associats entre ells.
Els pics de desequilibri ens permeten veure la recombinació històrica que hi ha hagut en un lloc.
Els llocs on no hi ha vermells a la gràfica de dalt són els llocs on hi ha els pics de recombinació en la gràfica de baix, que coincideixen amb les separacions entre blocs de SNPs.
Hi ha identificats un 33.000 hot spots en el genoma humà. Els hot spots representen el 60% de la recombinació en el genoma humà, però només el 6% de la seqüència del genoma. Molts hot spots contenen una seqüència consens que afavoreix la recombinació (CCNCCNTNNCCNC).
ESTUDIS D’ASSOCIACIÓ L’associació entre SNPs i malalties serveixen per detectar els gens que les provoquen i la seva posició.
Es fa una prova de Xi quadrat per veure si hi ha associació gamètica entre una malaltia i un SNP determinat. Si la prova dóna un resultat significatiu, vol dir que entre el SNP i el gen que provoca la malaltia hi ha associació gamètica, és a dir, que estan a prop en un mateix cromosoma. Així, sabem aproximadament on es troba el gen que provoca la malaltia, ara s’han d’analitzar més a fons tots els gens de la zona per trobar el que ens interessa.
Aquests estudis es fan amb molts SNPs alhora. Per exemple en ratolins: es miren diversos SNPs de diferents soques, i es fa l’estudi amb una sola malaltia.
Els resultats es representen en un manhattan-plot: en l’eix de les y hi ha el logaritme decimal (log10) de la probabilitat de tenir una associació. La probabilitat que s’exigeix és molt alta (més del típic 95%), ja que l’estudi s’ha fet amb moltes mostres. En l’eix de les x hi ha les regions del cromosoma en el qual hi ha els SNPs.
En aquest cas veiem que només una regió és molt probable que hi hagi associació entre els SNPs i el gen de la malaltia. El pas final és analitzar els gens d’aquesta regió que ha doant més probabilitat per estudiar si tenen relació amb la malaltia.
...