Tema 2. Diversidad fenotípica y variación genética (2015)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Genètica de Poblacions
Año del apunte 2015
Páginas 7
Fecha de subida 22/03/2015
Descargas 0
Subido por

Vista previa del texto

Grado de Genética – GdP T-2 Gloria Hidalgo DIVERSIDAD FENOTÍPICA Y VARIACIÓN GENÉTICA 1. TIPOS DE POLIMORFISMOS Esquema de la estructura de un gen eucariota – Inicio (5’) y final (3’) de la transcripción. Nos encontramos el promotor en la región flanqueante 5’, seguido de la región UTR (se transcribe pero no se traduce) y del codón de inició ATG (Met).
Cuando secuenciamos varios alelos y los analizamos y alineamos, podemos descubrir dos tipos de variación:  SNP: polimorfismos sencillos. Se da cuando hay una substitución de una base por otra diferente.
Depende de donde se de esta, encontramos polimorfismos: o Silenciosos: en región que no se traduce y que no pasa a la proteína (a veces se incluye todo lo que no dé lugar a cambio de proteína).
o No sinónimo: el cambio de base produce un cambio de aa, que deja a la proteína no funcional.
o Sinónimo: el cambio de nt no afecta a la proteína, ya que el triplete degenerado seguirá dando el mismo aa.
 Indel: situaciones donde las secuencias no casan porque una es más larga que otra. Se puede tratar de una inserción o de una deleción (variación estructural a pequeña escala: 1 o pocos nt).
2. MEDIDA DE LA VARIABILIDAD NUCLEOTÍDICA Cuando tenemos varias secuencias aisladas y los comparamos mediante la alineación, ¿cómo podemos mediar la variabilidad genética del DNA? Necesitamos medidas de gran resolución, a nivel nucleotídico – son paralelas a las vista a nivel genético.
 Polimorfismo nucleotídico: proporción de nt polimórficos en la secuencia.
S* = S/L S: sitios polimórficos en la secuencia L: longitud del DNA  Watterson Ѳ: proporción de sitios polimórficos divididos por un factores de correlación que depende del tamaño de la muestra (número de secuencias).
Wat. Ѳ = S*/a  a=1+ 3 n- Diversidad nucleotídica o heterocigosis esperada: equivalente a nivel genético.
П: nº promedio de diferencias entre las sec tomadas a pares Representa que si tomamos dos alelos del mismo locus, cual es la proporción de sitios que esperamos que sean diferentes.
1 Grado de Genética – GdP T-2 Gloria Hidalgo Ejemplo: Variabilidad nucleotídica en el gen Rhodopsin 3 de Drosophila simulans No hay toda la secuencia representada, únicamente se ven las posiciones donde había diferencias entre las secuencias.
A = 1 + ½ + 1/3 + ¼ (no más, solo hay 5 secuencias analizadas).
Diversidad: comparar dos a dos y hacer el promedio.
Mirar el número de diferencias en cada comparación dos a 1 2 3 4 5 1 dos. Ej: diferencias entre A1/A2 y sale que hay 8.
2 8 n(n- ) Comparaciones = 3 9 8 4 12 7 5 П = (8+9+8+12+7+5+11+10+4+5) / 10 = 7,9 5 11 10 4 5 = 7,9 /500 = 0,0158 También, pero, se puede hacer calculando las diferencias entre posiciones. Ej: En el nt 132 hay 5 secuencias: dos T y tres C, las diferencias entre estos nt da lugar a 6. Hay 79 diferencias en total, entre las comparaciones da la П.
Comparamos que Watterson y diversidad son muy parecidos. Estos son normales, ya que las medias de estos dos parámetros se espera, bajo la teoría neutralista, que sean iguales.
La teoría neutralista dice: σ = П = 4·Ne·µ 3. DIVERSIDAD NUCLEOTÍDICA EN EL DNA NUCLEAR Y MITOCONDRIAL El trabajo de Martin Kreitman (1983) –Nucleotide polymorphism at the alcohol dehydrogenase locus of D.melanogaster– se secuenciaron 11 alelos y observamos 43 sitios segregantes; de estos, 14 estaban en los exones (13 eran sinónimos y 1 no sinónimos). Había 3 en la UTR, 18 en los intrones y 8 en la región de flanco (5’ o 3’). Esto debería sumar los 43; solamente había uno de los 43 polimorfismos daba lugar a un cambio en la proteínas y los otros 42 están en sitios que no se iban a traducir (silenciosos). Demostró que había una enorme variabilidad oculta más allá de la técnica utilizada en electroforesis.
2712nt (43polim) – S* = 43/2721 = 0,0158 – O = 0,0158/2,93 = 0,0054 – π = 0,006.
2 Grado de Genética – GdP T-2 Gloria Hidalgo Luego la revista Nature publicó un borrador del genoma humano. En el mismo experimento también se hizo una comparación de varias personas para medir la variabilidad de todo el genoma – estudios de variación. En este caso se detectaron alrededor de 1.42 millones de SNPs, la mayoría de los cuales estaban en los autosomas. De forma que en estos (cromosoma del 1-22) hay una densidad de SNPs de 2 cada 1,85kb y en los cromosomas sexuales era aun más baja – la π de los autosomas era más baja que en los de Drosophila.
Esta diferencia entre el X y Y con los autosomas se puede deber, aceptando el marco teórico del neutralismo (π ≈ 4·Ne·µ), a que el tamaño de población es menor para el X y Y que para los autosomas: - Cada autosoma se encuentra dos veces en cada individuo.
- El cromosoma X se encuentra 1 ♂ o 2 ♀ veces en cada individuo.
- El cromosoma Y se encuentra una vez cada dos personas.
Por cada 4 copias de un cromosomas cualquiera solo hay 3 copias del cromosoma X (el número efectivo del cromosomas X es menor al de un cromosomas cualquiera). En la caso del cromosomas Y, por cada copias de un autosomas cualquiera solo hay una copias del cromosomas Y (suponiendo misma cantidad de los dos sexos), de forma que le tamaño efectivo del Y es ¼ del tamaño efectivo de los autosomas.
Más adelante se ha seguido trabajando, se hizo el Proyecto de los 1000 genomas  secuencias 1000 genomas y compararlos para ver la variabilidad presenten en la especie humana.
En total unos 38millones de snips (antes los 1,42, recuerdas?). Muchos de estos eran nuevos cuando se secuenciaban por primera vez – Son los + abundantes, porque son los que se encuentran principalmente (por eso se ven al principio). En este trabajo más de la mitad del snips encontrado eran novedosos.
También se descubrieron indel 1,38milliones en autosomas y 59k en cromosomas X.
En un trabajo reciente se comparo la diversidad nucleotídica entre humanos y las especies de primates más próximos a nosotros. En este caso se secuencia el genoma de varios individuos humanos y varios primates y se calculo la heterocigosidad obs (H) –secuencia individuos puede alinear secuencias obtenidas y ver cuál es la tasa en la que aparecen diferencias a lo largo del genoma.
La H en el caso de los africanos es mayor, esto se observa en muchas tipos de variaciones (más variación en África que en resto del planeta). En las distintas poblaciones de áfricas hay muchísimas variaciones.
La heterocigosis o la diversidad, con una estima de la tasa de mutación, se puede deducir cual puede ser el tamaño de la mutación (con ecuación neutralismo).
Otro estudio que se hizo trataba de hacer un resumen global de la variabilidad de sitios silenciosos de diferentes grupos de organismos. Obtenido valores promedios para procariotas, para especies eucariotas unicelulares o logocelulares, para invertebrados, plantas terrestre e vertebrados.
3 Grado de Genética – GdP T-2 Gloria Hidalgo Se ve una clara disminución de la variación desde procariotas a vertebrados. Esto se puede deber por el tamaño de población (procariotas tienen más tamaño de población).
3.1. DIVERSIDAD NUCLEOTÍDICA DEL DNA MITOCONDRIAL Todo lo visto hasta ahora hacía referencia al genoma nuclear, pero también hay DNA en mitocondrias y cloroplasto. En un trabajo se comparo la diversidad nucleotídica en zonas silenciosas (no codificantes o sinónimas) en diferentes grupo de organismos en el núcleo y en la mitocondria. Se compararon, de forma que se puede ver que hay tres tipos de patrones:  En vertebrados: variación en la mitocondria es mucho mayor que en el núcleo (hasta un orden de magnitud superior).
 En invertebrados: no hay un patrón muy claro, pero más o menos es parecida y del mismo orden de magnitud.
 En plantas: hay mucha más diversidad en el núcleo que en las mitocondrias.
Es decir que no ocurre los mismo en todas las especie, sino que según la que sea se puede obtener una cosa o otra. Estas diferencias que se observan se pueden interpretar, desde el marco teórico neutralista, por el tamaño efectivo (tamaño efectivo del mitocondria es distintos que del núcleo: Ne nuc = 4Ne mit – se transmite vía hembra y haploide), pero esa diferencia debería ser la misma en todas partes. Por tanto además son importantes las diferencias en la tasa de mutación entre la mitocondria y el núcleo, así como también las diferencias entre especies.
3.2. DIFERENCIAS ENTRE SITIOS SINÓNIMOS Y NO SINÓNIMOS Se ha mencionado varias veces que los polimorfismos de las regiones codificantes pueden ser sinónimos (no cambia el aa debido a la degeneración del código genético) o no sinónimos (cambia el aa). Esto implica que podemos calcular los parámetros de las mediadas de la variación separadamente para sitios sinónimos y los no sinónimos (ya que hay más polimorfismo en los sitios sinónimos).
Cuando queremos calcular de la diversidad nucleotídica separadamente para estos sitios sinónimos (S) y los no sinónimos (A), tenemos que hacer lo mismo que S (Sinónimos) A (No sinónimos) hacíamos antes para toda la secuencias pero separando para Ls = S4 + (1/3)S2 La =S0 + (2/3)S2 una cosa de la otra. Por tanto tenemos que calcular de la Ss Sa longitud de las secuencias cuantos son sinónimos y cuantos no, πs πa para al final obtener un πS y un πA En la tabla de la imagen, tenemos parte del código genético.
Y: pirimidina R: purina Degeneración cuádr. (S4): sinónimo.
Degeneración cero (S0): no sinónimo.
Degeneración doble (S2):  1/3 sinónimos  2/3 no sinónimos Ej: TTT – TTC (Sin.), TTG (no sinónimo), TTA (no sinónimo) *Ile i Ser son aa “especiales”, se toman como de S2 4 Grado de Genética – GdP T-2 Gloria Hidalgo 4. TIPOS DE POLIMORFISMOS DEL DNA: OTROS MÉTODOS En la figura, están representadas tipos de variación que se han estudiando a nivel de DNA.
 Polimorfismos en la longitud de los fragmentos de restricción (RFLP): Se detecta cuando se corta DNA con una enzima de restricción. Si tenemos un cambio en un nucleótido, una diana puede aparecer o desaparecer, de forma que los fragmentos según este está diana o no serán distintos. Ej: Al lado, EcoR1 corta por secuencia GAATTC, pero si hay un cambio nucleotídico a GATTTC la diana ya no es efectiva y los fragmentos que generara esta enzima de restricción será diferente.
Esto se detecta por el Southen blott: digerimos el DNA con una enzima, y los fragmentos resultantes son separados por electroforesis según su tamaño. Estos se traspasan a una membrana de nylon, la cual se tratara con una sonda de DNA marcada que nos permitirá revelar donde están esos fragmentos que corresponden con la región (hibridará sobre fragmentos de la misma secuencia y revelara donde están las bandas que corresponden a esa región). Esta banda se expondrá a rayos X para mostrar donde están las bandas radiactivas. Podemos encontrar, por tanto, polimorfismos en los tamaños de los fragmentos obtenidos por restricción.
Permite saber la diversidad nucleotídica mediante métodos estadísticos, que nos permiten saber que sucede cuando hay cambios de dianas – No se usa actualmente.
 Rapd (RNA polimórfico amplificado al azar): Se refiere a utilizar para la PCR cebadores pequeños y aleatorios de 6-8bases (lo normal es de 20-24nt, la cual es muy difícil que se repita en el genoma por azar). Al utilizar cebadores más cortos, y además de secuencias aleatorias, lo que conseguiremos es amplificar muchos fragmentos del genoma a ciegas. De forma que estas regiones se amplificaran por PCR, pero estos fragmentos nosotros no sabemos de donde provienen (método quick and dirty).
Es un método de obtener variabilidad, porque con esta muestra se puede obtener tres bandas, pero si se repite en otra muestra, puede ser que salgan 4 bandas, por ejemplo.
5 Grado de Genética – GdP T-2 Gloria Hidalgo  Polimorfismo en la longitud de un fragmento amplificado (AFLP): Es una técnica que digiere el DNA en fragmentos de determinado tamaño y a estos se le añaden unos adaptadores en los extremos. Y después, como los adaptadores tienen una secuencia conocida, diseñar cebadores de PCR que corresponden con esos extremos. Variando los nucleótidos que se cogen al final del cebador, se pueden ir amplificando diferentes fragmentos. Si la muestra que amplificamos tiene el los nucleótidos concretos, se amplificará; pero si tiene otros nucleótidos, no amplificara (somos un poco específicos: primer - secuencia que conocemos y final dado por el fragmento).
Variabilidad dada por la variación de los nts (Según si corresponde o no con el primer diseñado).
 Microsatélites (SSLP o SSR) Lugares especiales del genoma (regiones hipervariables), donde tenemos una pequeña secuencia de 210nt repetida un cierto número de veces – está presente en todos los organismos. En los distintos alelos podemos tener un número de repeticiones diferentes.
La variabilidad consiste en que el número de repeticiones cambia en función del alelo, ind, crom Ej: la región microsatélite TAAA esta repetida en este alelo 10 veces. Igual que aquí aparece 10 veces, en otro cromosomas o otros individuos podía aparecer diferentes veces (7,8,9,11, etc). Estos loci se estudia con la región secuenciada para poden diseñar cebadores a ambos lados del microsatélite y por PCR amplificar esta secuencia. La longitud del fragmento amplificado depende del número de repetición del microsatélite (entre 132 y 148 nt) – polimorfismo detectado por PCR y electroforesis (según tamaño).
Normalmente son multialélicos (entre 5 y 10 alelos), la herencia es codominante, con muestreo no invasivo (no dañas al individuo) y cuesta bastante desarrollarlos (encontrar regiones, aislarlas, secuenciarlas, etc), pero una vez que los tengo, hacer PCR y electroforesis es relativamente fácil y barato – El coste global es moderado.
En general la diversidad génica que se observa es muy alta, ya que los loci son especiales, hipervariable. Esta diversidad no se puede extrapolar como significativa para los alelos sin microsatélites. En este estudio, se estudiaron los 216 loci microsatélites en el cromosoma X, y el promedio de la diversidad génica (H) es de 0,65.
En los 22 autosomas, se estudiaron 5048 loci y la diversidad media fue 0,7. Son más altas que las heterocigosis que obteníamos por electroforesis de proteínas.
Electroforesis capilar: método que permite diferir entre molécula que se distinguen por un único nucleótido – utiliza cebadores fluorescentes (marcados por florocromo) y al final del capilar tenemos un laser que mide la cantidad de fluorescencia. Lo que sale en el caso de un microsatélite son los dos picos verdes de la derecha que observamos en la imagen.
Reacción multiplex: PCR de varios loci a la vez. Se utilizan diversos fluorocromos – por el color podemos separar en parte los fragmentos que provienen de un locus u otro. El otro tuco esta en diseñar cebadores 6 Grado de Genética – GdP T-2 Gloria Hidalgo para los microsatélites que tengas tamaños distintos (diferentes picos en el verde). En resumidas cuentas, en un solo multiplex con 10 loci microsatélites podemos obtener el genotipo de estos 10 loci para el individuo – con dos picos: heterocigoto; con 1 pico: homocigoto.
A esto podemos añadir PCR especifica que detecta el cromosoma X y Y, mediante el gen amalegenina: está en X y Y pero tiene estructura diferente. Se utiliza mismo cebador, pero el fragmento que resulta es diferente – dos bandas: hombre; una banda: mujer.
La probabilidad de que haya una coincidencia es de 10-13.
5. DIVERSIDAD ESTRUCTURAL En el genoma, a demás de la variación hablada hasta ahora existe la variación estructural que implica segmentos de DNA de > 1kb. El estudio de empezó después de la secuenciación del genoma humano, ya que tenemos una referencia con la que comparar (ver si hay diferencias macroscópicas en alguna región): - Dan lugar a un cambio en la dosis de DNA (variación en el número de copias, CNV) - Las que no (inversiones y translocaciones).
Podemos encontrarnos con una deleción o una duplicación en regiones importantes. En algunos casos la variación puede ser muy compleja y cuesta ver que ha sucedido – varía el número de repeticiones de más de un región, o también pueden haber cambio en orden de los fragmentos.
Ej: los expertos en aromas, es muy probable que tengan más presencia de receptores de olores (número de copias mucho mayor).
La variación estructural se ha tardado más en investigar porque es más difícil, se necesitan técnicas sofisticadas y un genoma referencia. Pero el resultado es que existe cantidad de variación muy importante y que puede tener que ver con secuencias importantes.
Datos de la Variación estructural en el genoma humano • Database of Genomic Variants (Octubre 2010): 89427 entradas (57829 CNV y 850 inversiones) en 14478 loci que cubren 970 Mb (~34% del genoma).
• CNV: longitud 1 kb a 3.89 Mb (mediana 103 kb) distribuidas preferencialmente en las regiones centroméricas y teloméricas.
No todo es exacto, contiene tasa de errores considerable.
7 ...