TEMA 2 – DIVERSIDAD FENOTÍPICA Y VARIACIÓN GENÉTICA (II) (2015)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Genètica de Poblacions
Año del apunte 2015
Páginas 8
Fecha de subida 14/03/2015 (Actualizado: 21/03/2015)
Descargas 3

Vista previa del texto

TEMA 2 – DIVERSIDAD FENOTÍPICA Y VARIACIÓN GENÉTICA (II) 1. Tipos de polimorfismos del DNA: secuenciación En un gen encontramos varias partes: - Regiones flanqueantes 5’ y 3’.
Promotor.
UTR (untranslated región) 5’ y 3’.
Región transcrita: exones e intrones Región traducida Cuando secuenciamos varios alelos de un mismo gen tras la alineación de estos podemos encontrar: - SNPs (single-nucleotide polymorphism): cambios de una base por otra.
Polimorfismos debidos a la deleción o inserción de un número variable de pares de bases.
Además, podemos clasificar los polimorfismos según su situación y efecto: - Polimorfismo silencioso: el polimorfismo ocurre en una región del gen que no se traduce.
Polimorfismo no sinónimo: provoca un cambio de aminoácido, los que puede provocar un cambio en la estructura de la proteína entera.
Polimorfismo sinónimo: el polimorfismo no llega a provocar un cambio de aminoácido.
2. Medida de la variabilidad nucleotídica Cuando alineamos y comparamos secuencias o alelos podemos medir la variabilidad a nivel nucleotídico; esto se hace con medidas paralelas a las de nivel génico). Por tanto, si obtenemos una muestra de n secuencias de una región dada del genoma de una especie, podemos medir la variación nucleotídica mediante: - - Polimorfismo nucleotídico o de sitios segregantes: S* = S/L o S = nº de polimorfismos o L = longitud de la secuencia entera Watterson: Θ = S*/a o a (factor de corrección) = [1+1/2+1/3+…+1/(n‐1)] Diversidad nucleotídica o heterocigosis esperada a nivel nucleotídico: π = Π/L o Π: número promedio de diferencias entre secuencias tomadas a pares.
Los valores π y θ deberían ser muy parecidos o cercanos, ya que aunque de maneras diferentes, estamos calculando lo mismo bajo la teoría neutralista: θ ≈ π ≈ 4·Ne·µ, donde Ne es el tamaño efectivo de la población.
Ejemplo: Variabilidad nucleotídica en el gen Rhodopsin 3 de Drosophila simulans - Muestra (n) = 5 secuencias.
Longitud (L) = 500 nucleótidos.
Polimorfismo nucleotídico: S* = 16/500 = 0,032 o S = 16 posiciones polimórficas.
Watterson: Θ = 0,032/2,0833 = 0,0154 o a = 1 + ½ + 1/3 + ¼ = 2.0833 Diversidad nucleotídica: π = 79/500 = 0,0158 o Π = 79: suma de todas las diferencias 2 a 2 para cada posición en las 10 comparaciones posibles.
3. Diversidad nucleotídica en el DNA nuclear y mitocondrial Ejemplo: Nucleotide polymorphism at the alcohol dehydrogenase locus of Drosophila melanogaster.
En el experimento en el que se basa este artículo, se secuenció por primera vez varias veces el mismo locus. Se pudo ver que había varios polimorfismos; exactamente en este caso se encontraron 43 en un total de 2741 nucleótidos: - 14 en los exones: 13 sinónimos y 1 no sinónimo.
3 en las UTR: silenciosos.
18 en los intrones: silenciosos.
8 en las regiones flanqueantes 5’ y 3’: silenciosos.
De esta manera se demostró que si miramos sólo la variabilidad de proteínas por electroforesis, no veremos toda la variabilidad genética que existe, sólo detectaremos una pequeña parte.
- S* = 43/2721 = 0,0158.
Θ = 0,0158/2,93 = 0,0054 π = 0.006 Luego la revista Nature publicó un borrador del genoma humano. En el mismo experimento también se hizo una comparación de varias personas para medir la variabilidad de todo el genoma. En este caso se detectaron alrededor de 1,4 millones de SNPs, la mayoría de los cuales estaban en los autosomas. Se vio que la π de los autosomas era más baja que en los de Drosophila, pero que en los cromosomas sexuales aún era mucho más baja.
¿A qué se podían deber estas diferencias? Recordemos que π ≈ 4·Ne·µ  los cromosomas sexuales tienen una Ne mucho más baja que los autosomas: - Cada autosoma se encuentra dos veces en cada individuo.
El cromosoma X se encuentra 1 o 2 veces en cada individuo.
El cromosoma Y se encuentra una vez cada dos personas.
Ne (A) = 2 Ne (X) = 4 Ne (Y) Pero esto tampoco es la única explicación, aunque sigue siendo parte de la respuesta.
Cromosoma Nº SNPs Densidad Diversidad nucleotídica (π) Autosomas 1-22 1380155 1 cada 1.85kb 7.65·10-4 X 34842 1 cada 3.77kb 4.69·10-4 Y 4193 1 cada 5.19kb 1.51·10-4 Total 1419190 1 cada 1.91kb 7.51·10-4 Más tarde se hizo el proyecto de los 1000 genomas. Se llegaron a encontrar 38 millones de SNPs, muchos de ellos hasta entonces desconocidos. Se vieron también unos 2 millones de INDELs y 14000 grandes deleciones.
En un trabajo reciente se comparó la diversidad nucleotídica entre humanos y los primates más cercanos a nosotros: chimpancés, gorilas, orangutanes… Se calculó la heterocigosidad promedio observada (H). Se vio que hay una gran diferencia de la heterocigosidad entre humanos africanos y no africanos: los no africanos tenemos una menor H que los africanos; esto podría ser debido a que el ser humanos nació en África. Se vieron diferencias similares entre subespecies de otras especies.
Otro estudio que se hizo trataba de hacer un resumen global de la variabilidad de sitios silenciosos de diferentes grupos de organismos.
Podemos ver que hay una disminución de la variación desde procariotas a vertebrados. Esto podría tener relación con el tamaño de población.
Más tarde se estudió el DNA mitocondrial. Se comparó su variabilidad nucleotídica silenciosa con la del DNA nuclear entre diferentes grupos de organismos. Si hacemos una comparación de las dos columnas podemos apreciar dos patrones: - Vertebrados: variabilidad mt > nuc Invertebrados: variabilidad mt ≈ nuc Plantas: variabilidad mt < nuc Lo que explicara esto debería ser el tamaño efectivo de las poblaciones: Ne nuc = 4Ne mit. Pero eso no es suficiente, puesto que la diferencia varía entre los diferentes grupos de organismos; por tanto, también deberá intervenir la tasa de mutación.
La π la podemos calcular separadamente para polimorfismos sinónimos y no sinónimos. Cuando queremos hacer esto, tenemos que hacer lo mismo que hacíamos antes, pero por una parte para los sitios sinónimos y por otra los no sinónimos.
S (sinónimos) A (cambio de aminoácido) Ls La (long de la secuencia) Ss Sa πs πa - Ls = S4 + 1/3·S2 L = L s + La La = S0 + 1/3·S2 S4: sitios con degeneración cuádruple: cualquier nucleótido da el mismo aminoácido.
S2: sitios con degeneración doble: sólo dos nucleótidos dan el mismo aminoácido.
S0: si se cambia el nucleótido, también lo hará el aminoácido.
Ile i Ser, a pesar de ser aminoácidos “especiales”, los tomaremos como si tuviesen degeneración doble.
4. Tipos de polimorfismos del DNA: otros métodos RFLP: polimorfismos en la longitud de un fragmento de restricción Un tipo de detección de la variabilidad son los polimorfismos en la longitud de un fragmento de restricción (RFLP o “reflips”). Se detecta mediante el uso de una enzima de restricción que corta el DNA en una secuencia específica. Si hay una mutación o variación en el DNA, podría aparecer una diana que antes no estaba, o viceversa. Por tanto, los fragmentos que se generarán y luego podremos ver mediante electroforesis podrían ser distintos para cada muestra.
Esto se podría revelar con un Southern blot. Traspasaremos la muestra a una membrana de nylon donde habrá unas sondas marcadas radioactivamente. Estas sondas sólo hibridarán donde haya la secuencia específica a la cual sean homólogas. De este modo podríamos detectar polimorfismos en el tamaño de las secuencias.
Este método prácticamente ha dejado de usarse porque durante el proceso se cometían muchos errores.
RAPD: DNA polimórfico amplificado al azar Otro tipo de detección de la variabilidad es el DNA polimórfico amplificado al azar o RAPD. En este caso, se amplifican cebadores cortos, de una 8-10 nucleótidos, al azar, es decir, son cebadores cuya secuencia es aleatoria. Por tanto, los fragmentos que se amplifiquen de varias zonas del genoma serán a ciegas. Si hay dos primers hibridados y están cerca y en la dirección correcta, amplificaremos las zonas entremedio, si no, no se podrá amplificar nada.
¿Cómo obtenemos variabilidad con este método? Si tratamos muestras diferentes, obtendremos patrones de bandas distintos en la PCR.
AFLP: polimorfismo en la longitud de un fragmento amplificado Otro tipo de detección de la variabilidad son los polimorfismos en la longitud de un fragmento amplificado o AFLP.
Es una técnica que consistía en digerir el DNA, con enzimas de restricción específicas, en fragmentos de un determinado tamaño. A estos fragmentos de DNA se les ligaba unos adaptadores de secuencia conocida a los extremos, y luego se amplificaban los fragmentos junto a los adaptadores. Los cebadores que se usaban para la amplificación eran como los adaptadores más unos pocos nucleótidos más. Si estos nucleótidos coincidían con el inicio de la secuencia del DNA que habíamos cortado anteriormente, se amplificaría, y si no coincidía, no amplificaría.
Veríamos la variabilidad también por el patrón de bandas que obtendríamos posteriormente, como en los casos anteriores. Además, si vamos variando los nucleótidos finales de los cebadores, podremos amplificar diferentes regiones y detectar variabilidad en otras regiones del genoma.
SSLP o SSR: polimorfismo en la longitud de una secuencia simple Otro método es el polimorfismo en la longitud de una secuencia simple, abreviado SSLP o SSR. Los microsatélites son lugares especiales hipervariables de un cierto número de repeticiones de 2-9 nucleótidos. En diferentes alelos tendremos un nº distinto de repeticiones.
Por ejemplo, tenemos el tetranucleótido TAAA repetido 9 veces en un alelo. ¿Cómo estudiamos aquí la variabilidad? Tenemos que tener la región secuenciada previamente para crear unos cebadores específicos (20-24 nucleótidos) para amplificar la secuencia. La longitud del fragmento amplificado variará según el nº de repeticiones de TAAA.
- Detección: PCR + electroforesis posterior para separar los fragmentos por tamaño.
Variación: multialélicos Herencia: codominante, ya que podremos ver todos los alelos.
Coste: moderado, puesto que puesto que hay que secuenciar la región, ver si amplifica… Tiempo de desarrollo: considerable Muestreo no invasivo: Sí, ya que no hay que quitarle un trozo de tejido al individuo, sino que con por ejemplo pelo o semen se podría.
Normalmente, la diversidad génica que se observa es muy elevada, ya que son loci hipervariables. Por ejemplo, en un estudio en humanos, en el cromosoma X se estudiaron 216 de estos loci y se obtuvo una H = 0,65. Más tarde se estudiaron 5048 del cromosoma 22A y se obtuvo una H = 0,7.
Una forma de separar los fragmentos por tamaño es usar la electroforesis capilar, donde podemos distinguir variaciones de hasta sólo 1 nucleótido. Se utilizan cebadores marcados con fluorescencia, se lee la fluorescencia al final del fragmento que se amplifica y de este modo se mide la longitud del fragmento.
Ahora, con la electroforesis capilar y la PCR multiplex podemos analizar 10 loci diferentes a la vez. Una sola reacción de PCR “multiplex” permite averiguar el sexo y el genotipo en 10 loci microsatélites con lo que la probabilidad de coincidencia por azar es de 10-13. Para esto es necesario utilizar flourocromos de distintos colores para cada cebador de cada loci, o si repetimos color, deberíamos diseñar los cebadores marcados con el mismo color de tamaños muy diferentes.
A la hora de leerlo, usamos un láser.
- Si detecta un pico, es que es homocigoto para X gen.
Si detecta dos picos, es que es heterocigoto.
Con esta técnica también podemos saber el sexo del individuo si añadimos el cebador para amplificar el gen de la amelogenina, cuya secuencia de aminoácidos es un poco más larga en machos que en hembras.
5. Diversidad estructural Se considera variación estructural a aquellas alteraciones genómicas que implican segmentos de DNA de longitud > 1 kb. Se subdividen en: - Las que dan lugar a un cambio en la dosis de DNA: variación en el número de copias (CNV).
Las que no dan lugar a un cambio en la dosis de DNA: inversiones y translocaciones.
Por tanto, podremos encontrarnos duplicaciones, deleciones grandes… Podemos encontrar también variabilidad en el número de copias presentes de un fragmento en concreto. Si en estas regiones de las cuales hay más de copia, o no hay ninguna, hay genes, variará por tanto el número de genes total que tiene el individuo, lo que puede tener consecuencias a nivel de fenotipo. En otros casos, la variación es muy compleja: varía el número de repeticiones de más de una región, o también puede haber cambios en el orden de los fragmentos.
Esto se empezó a estudiar después de la secuenciación del genoma humano, ya que se secuenciábamos algo, luego lo podríamos comparar con el genoma de referencia. Se ha visto que esta variación es muy importante, y como antes no se podía estudiar, ahora se le da mucha importancia.
- Database of Genomic Variants (Octubre 2010): 89427 entradas (57829 CNV y 850 inversiones) en 14478 loci que cubren 970 Mb (~34% del genoma).
CNV: longitud 1 kb a 3.89 Mb (mediana 103 kb) distribuidas preferencialmente en las regiones centroméricas y teloméricas.
...