TEMA 4 – ORGANIZACIÓN DE LA VARIACIÓN GENÉTICA (II) (2015)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Genètica de Poblacions
Año del apunte 2015
Páginas 8
Fecha de subida 18/03/2015
Descargas 6

Vista previa del texto

TEMA 4 – ORGANIZACIÓN DE LA VARIACIÓN GENÉTICA (II) 1. Frecuencias gaméticas en un sistema de dos loci dialélicos A las frecuencias de los alelos de cada alelo los llamaremos: - Locus A: p1 y p2 Locus B: q1 y q2 Las combinaciones de alelos las llamaremos combinaciones gaméticas o haplotipos.
2. Equilibrio gamético y asociación gamética Equilibrio gamético o equilibrio de ligamiento El equilibrio gamético se alcanza cuando los dos loci son estadísticamente independientes. Se dará cuando la frecuencia de las combinaciones gaméticas del producto de las frecuencias de cada alelo por separado.
Asociación gamética o desequilibrio de ligamiento Cuando las frecuencias de las combinaciones gaméticas (xi) no sean estas, es decir, el producto de las frecuencias alélicas, no habrá equilibrio gamético, sino que habrá asociación gamética o desequilibrio gamético. Pero la suma de todas las frecuencias siempre seguirá siendo 1.
- A1 A2 Total B1 p1q1 p2q1 q1 B2 p1q2 p2q2 q2 Total p1 p2 1 A1 A2 Total B1 x1 = p1q1 x3 = p2q1 q1 B2 x2 = p1q2 x4 = p2q2 q2 Total p1 p2 1 x1 + x2 + x3 + x4 = 1 Medidas del desequilibrio gamético (LD) En resumen tenemos: - D = x1 – p1q1 D = x1x4 – x2x3 Dmax = min {p1q2 ó p2q1} Dmin = max {-p1q1 ó -p2q2} - D’ = D/Dmax cuando D>0 D’ = D/Dmin cuando D<0 ρ2 = D2/(p1q1p2q2) = χ2/n Chi-cuadrado (χ2) = ρ2·n Recordemos que: - Media(x) = Σfixi Var(x) = Σfi(xi – media(x))2 = Σfixi2 – media(x)2 Cov(xy) = Σfi(xi – media(x))(yi – media(y)) = Σfixiyi – media(x)·media(y) Cuando hay desequilibrio, las frecuencias de las combinaciones gaméticas se desvían respecto a las frecuencias de equilibrio. Para calcular las frecuencias en equilibrio sumaremos o restaremos el valor D a las frecuencias en equilibrio.
D nos servirá para medir este desequilibrio.
- - Cuando D>0: o x1 y x4 (gametos en acoplamiento) en exceso.
o x2 y x3 (gametos en repulsión) en defecto.
Cuando D>0: o x1 y x4 (gametos en acoplamiento) en defecto.
o x2 y x3 (gametos en repulsión) en exceso.
D es una medida absoluta que no nos permite comparar pares de loci, ya que todo dependerá de las frecuencias alélicas. Para comparar pares de loci necesitaremos medidas relativas del desequilibrio: D’ o ρ2 (coeficiente de correlación. D’ siempre se encuentra entre (0, 1).
El valor máximo de D se alcanza cuando pi = qi = 0.5 y cierto xi = 0. Si las frecuencias alélicas no son 0.5, nunca llegaremos a estos límites.
Frecuencia o fracción de recombinación Los que rompe la asociación gamética es la recombinación, lo que implica que la frecuencia de los gametos que entra es distinta a la que sale. Por tanto, podríamos decir que la frecuencia de recombinación (r) es la proporción de gametos que llevan una combinación de alelos que no está presente en los cromosomas parentales.
- Frecuencia de gametos parentales: 1-r Frecuencia de gametos parentales: r La frecuencia de recombinación varía entre (0, 0.5).
3. Acercamiento al equilibrio gamético Partimos de una población que no está equilibrio. Es decir, en la generación 0: D0 = x1 – p1q1 = x1x4 – x2x3. Queremos mirar cuanto se tarda en llegar al equilibrio en esta población.
A1 A2 Total B1 x1 x3 q1 B2 x2 x4 q2 Total p1 p2 1 Miramos cual es la probabilidad de que se dé cada cruzamiento: A1A1 A1A2 A2A2 B1B1 x12 2x1x3 x32 q12 B1B2 2x1x2 2x1x4 + 2x2x3 2x3x4 2q1q2 B2B2 x22 2x2x4 x42 q22 2 2 p1 2p1p2 p2 1 Por ejemplo, para el gameto A1B1: A1B1 A2B1 A1B2 A1B1 A1B2 A1B1 A1B1 A1B1 A2B2 A2B1 2 Probabilidad de cruzamiento ↓x1 ↓2x1x3 ↓2x1x2 ↓2x1x4 ↓2x2x3 A1B1 A1B1 A1B1 A1B1 A1B1 Frecuencia de gametos 1 ½ ½ (1-r)/2 r/2 Parentales - x1’= x12 + 2x1x2·½ + 2x1x3·½ + 2x1x4·(1-r)/2 + 2x2x3·r/2 = x1 – r(x1x4 – x2x3) = x1 – r·D0 x2’= x2 + r·D0 x3’= x3 + r·D0 x4’ = x4 – r·D0 D1 = D0 – r·D0 = D0(1 – r) Dt = D0(1 – r)t Si D>0, el gameto con menor frecuencia (gameto en repulsión), que estaba en defecto, ahora aumentará su frecuencia para acercarse al equilibrio. Por el contrario, el gameto de mayor frecuencia (gameto en acoplamiento), que estaba en exceso, disminuirá su frecuencia para acercarse también al equilibrio. Si D<0, será al revés.
Cuando la frecuencia de recombinación sea máxima, el desequilibrio disminuirá a la mitad en cada generación y tardará entre 6 – 8 generaciones en desaparecer. En cambio, si r es muy pequeña debido a que los dos loci se encuentran muy cerca uno del otro, el desequilibrio podría tardar miles de generaciones en desaparecer.
Estimación de las frecuencias gaméticas A1 A2 Total B1 n1 n3 n1 + n3 B2 n2 n4 n2 + n4 Total n1 + n2 n3 + n4 n - p1 = (n1 +n2)/n q1 = (n1 +n3)/n - D = x1 – p1q1 - x1 = n1/n x2 = n2/n = p1 – x1 x3 = n3/n = q1 – x1 x4 = n4/n = 1 – x1 – x2 – x3 4. Detección, medida y significado de la asociación gamética Pruebas para detectar el desequilibrio de ligamiento Una manera de detectar el desequilibrio sería con la siguiente tabla o una tabla de contingencia 2x2: Haplotipo MS Ms NS Ns Total - Frecuencias (O-E)2/E Observadas Esperadas 474 334.2 58.48 611 750.8 26.03 142 281.8 69.35 773 633.2 30.87 2000 2000 184.73 χ2 = Σ(obs-esp)2/esp = 184.73 g.l. = nº de clases – 1 – nº de parámetros independientes estimados (p1 y q1) = 1  χ2crit = 3.84 Si lo hiciésemos con una tabla de contingencia, los g.l. = (c-1)(f-1) = 1 también.
Aceptamos H1, ya que χ2obs >>> χ2crit y por tanto, p<<<0.05: hay una desviación muy grande respecto a lo que esperamos por azar.
Otra forma de medir el desequilibrio de ligamiento sería calcular los esperados como pi*qi*n. Los esperados serán exactamente los mismos que antes, ya que en realidad estamos haciendo del mismo cálculo que antes. Además, los grados de libertad seguirán siendo los mismos. Por tanto, el valor del χ2 será el mismo y el resultado también.
Haplotipos MS Ms NS Ns Total Frecuencias Desequilibrio máximo Absolutas Relativas 474 0.2370 0.3080 611 0.3055 0.2345 142 0.0710 0 773 0.3865 0.4575 2000 1 1 Ahora debemos medir el grado de asociación o de desequilibrio (D). La D se puede calcular de dos maneras diferentes, aunque los dos métodos darán exactamente el mismo resultado.
- <D> = x1 – p1q1 = 0.237 – 0.5425*0.308 = 0.237 – 0.1671 = 0.0699 <D> = x1x4 – x2x3 = 0.237*0.3865 – 0.3055*0.071= 0.0699 Como D>0, los gametos en repulsión están en defecto y los gametos en acoplamiento están en exceso.
Queremos alejar lo más posible los gametos que se encuentran en acoplamiento y en exceso de los que se encuentran en repulsión y en defecto. Para esto, haremos que el valor mínimo sea 0, pero sin que cambie el valor de p i ni qi. El Dmax también lo podremos calcular de dos maneras diferentes: - Dmax (como D>0) = min {p1q2 ó p2q1} = 0.1409 Dmax (como D>0) = x1’x4’ – x2’x3’ = 0.308*0.4575 – 0*0.2345 = 0.1409 Por tanto: D’ = <D>/Dmax = 0.0699/0.1409 = 0.4961 = 49.61%. Este resultado nos dice que la población que estamos estudiando muestra casi la mitad de la máxima asociación (D) que podría llegar a presentar.
Otra manera de calcular esta asociación sería mediante ρ: D2 = p1q1p2q2 - ρ2 = 0.30392 = 0.0924 = χ2/n - χ2 = ρ2·n = 0.0924*2000 = 184.73  ¡mismo resultado que antes! Estimación de las frecuencias gaméticas En los dobles heterocigotos no sabremos exactamente cuántos hay en repulsión y cuántos en acoplamiento.
- p1 = (2N1· + N2·)/2N q1 = (2N·1 + N·2)/2N p2 = 1 – p1 q2 = 1 – q1 B1B1 B1B2 B2B2 Total A1A1 A1A2 A2A2 Total N11 N13 N33 N·1 N12 N* = N14 + N23 N34 N·2 N22 N24 N44 N·3 N1· N2· N3· N Para estimar por ejemplo, x1, lo mejor sería el recuento, pero no podemos hacerlo exactamente por lo que hemos comentado ahora: x1 = 2𝑁11+𝑁12+𝑁13+𝑵𝟏𝟒  no sabemos cuántos exactamente hay en acoplamiento. Para solucionar 2𝑁 esto, necesitaremos el método iterativo, parecido a lo que hacíamos con los grupos sanguíneos ABO.
Si trabajamos en EXCEL, podríamos hacer una tabla de este estilo: N11 N12 N13 N14 N23 N x1 x2 x3 x4 N* 0 Estimación de las frecuencias gaméticas con dominancia En este caso, sólo tenemos 4 fenotipos posibles: 𝑁3· 𝑁 p2 = √ 𝑁·3 𝑁 q2 = √ 𝑁44 𝑁 x4 = √ A1A2A2 Total B1- N11 + N12 + N21 + N* N33 + N34 N·1 + N·2 B2B2 N22 + N24 N44 N·3 Total N1· + N2· N3· N D = x4 – p2q2 Ejemplo: Asociación del color y patrón de la concha en Cepaea nemoralis - Hay dominancia: rosa domina sobre amarillo y bandas domina a no bandas.
Rosa Amarillo Total p2 = 0.8313 q2 = 0.5388 Con bandas 237 604 841 x4 = 0.4259 D = -0.022 Sin bandas 129 215 344 Total 366 819 1185 2 - χ = 9.9  significativo.
- Es una estima bastante “cutre” porque asumimos que la población se encuentra en equilibrio Hardy-Weinberg y porque hay varios genotipos que dan un mismo fenotipo.
5. Asociación gamética en humanos Factores que generan la asociación gamética: - - - - - - Mutación (historia genealógica de los haplotipos).
Por ejemplo, en una misma secuencia tenemos un sitio polimórfico y uno monomórfico. De repente aparece un cambio en el sitio monomórfico. En este punto tenemos 3 de las 4 combinaciones posibles: AC, AG y TC, pero no TG. por tanto, habrá el máximo mínimo desequilibrio (según si D>0 o D<0) y una D’=1.
Para que aparezca la combinación TG, debería haber una recombinación entre AG y TC. También podría aparecer una mutación espontánea que cambiara TC por TG, pero esto es muy improbable, ya que la tasa de mutación espontánea es muy baja.
Selección epistática (sobre combinaciones de alelos). Hay interacción entre dos loci determinados. Éstos sólo se ven favorecidos cuando van juntos, no si van por separado. Por tanto, por SN al final habrá un exceso de estas combinaciones.
Deriva genética. En una población pequeña sólo se generarán un número finito de gametos. Debido a esto, por azar podrían generarse asociaciones gaméticas.
Efecto fundador. Cuando una pequeña parte de una población forma una población nueva en una zona que estaba vacía, se dice que hay un efecto fundador. Cuanto menor sea el tamaño de la población fundadora, mayor será el efecto fundador, más probable será que las frecuencias gaméticas no representen las del equilibrio en la población original. Por tanto, la nueva población puede que se encuentre en desequilibrio gamético durante unas cuantas generaciones.
Arrastre (hitchhiking). Imaginemos que en una población hay un alelo favorable y por selección natural aumenta su frecuencia en la población. Si en ese alelo aparece una mutación, la SN provocará que se arrastre esa mutación a medida que la frecuencia del alelo favorable aumenta.
Subdivisión y migración (mezcla poblacional o efecto Wahlund). Supongamos dos poblaciones que difieren en sus frecuencias. Una de ellas está fijada para el alelo A, mientras que la otra lo está para el alelo a. Si mezclamos (no cruzamos) ambas poblaciones, seguirá sin haber individuos heterocigotos y la población no estará en equilibrio HW.
Población AA Aa aa Total 1 1 0 0 1 2 0 0 1 1 1+2 0.5 0 0.5 1 Lo mismo pasa con las poblaciones gaméticas.
Población AB Ab aB ab Total 1 1 0 0 0 1 2 0 0 0 1 1 1+2 0.5 0 0 0.5 1 Hibridación: cruzamiento entre dos poblaciones con diferentes frecuencias alélicas. Imaginemos una situación extrema: cruzamos machos AA con hembras aa. Todos los hijos de la F1 serán Aa. Por tanto, la población no estará en equilibrio HW.
Esto lo extrapolamos a dos alelos: cruzamos machos AABB con aabb. Por tanto, los individuos de la F1 todos serán AaBb y tampoco habrá equilibrio gamético.
Por el contrario, la recombinación la destruye. La recombinación rompe la asociación entre diferentes loci.
El historia genealógica de los haplotipos como causa de asociación gamética En la siguiente imagen hemos representado el cromosoma 22 humano. Se han utilizado unos 1500 marcadores. Cada punto representa una pareja de marcadores. Se han representado la D’ y la ρ2 según la distancia entre los marcadores.
Tanto en la gráfica de D’ como en la de ρ2 hay un descenso de sus valores a medida que aumenta la distancia entre marcadores. Solamente se ve claramente que hay asociación cuando los dos marcadores están bastante cerca uno del otro.
The International HapMap Project (Nature 437:1299 y Nature 449:851) - Inicio 2002 Objetivo: Obtener un mapa de haplotipos del genoma humano Procedimiento: Determinación del genotipo de 270 individuos pertenecientes a 4 poblaciones en un SNP cada 5 kb de la eucromatina.
Poblaciones: Yoruba (Nigeria), Europea (Utah, USA), Han (China), Tokyo (Japón).
Phase I (2005). Analizados 1.3 x 106 SNPs Phase II (2007). Analizados 3.1 x 106 SNPs Block-like structure of human LD and recombination hotpots Se vio que el genoma humano está formado por bloques de SNPs con una asociación muy grande (con una D’ ≈ 1) y separados entre sí por bloques casi sin asociación entre ellos.
Esto se ha interpretado como que la recombinación se da en puntos calientes o hot spots de recombinación, no se da uniformemente. Estos puntos calientes coinciden con las zonas entre los bloques con gran asociación que habíamos nombrado antes.
Hot spots de recombinación: - Identificados unos 33.000 hot spots 68% localizados en una región ≤5kb La distancia de mapa media inducida por un hot spot es 0.043 cM La distancia de mapa máxima inducida por un hot spot es 1.2 cM Los hot spots explican el 60% de la recombinación en el genoma humano pero sólo representan el 6% de la secuencia.
Muchos hot spots contienen la secuencia consenso CCNCCNTNNCCNC.
Cartografía de genes con estudios de asociación Comparamos a nivel genotípico los individuos afectados por cierta enfermedad y los controles. Si la prueba de χ2 sale significativa, significará que el gen responsable de la enfermedad (o uno de ellos) se encuentra cerca del marcador que hemos utilizado.
De esta manera, se puede estudiar un cromosoma entero o incluso todo el genoma.
Genome wide association studies (GWAS) Pero para hacer los estudios de asociación, no se usa un solo SNP, sino que se usan varios. Los resultados se representan mediante un Manhattan blot y se hace una gráfica del log10p/región del SNP. Aceptaremos que hay asociación con una p de 10-6, a que si usáremos p<0.05 como habitualmente, habrían muchos falsos positivos.
...