Tema 4: Bancos de DNA genómico 2/2 (2017)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Biotecnología - 2º curso
Asignatura Tecnología del DNA recombinante
Año del apunte 2017
Páginas 11
Fecha de subida 03/10/2017
Descargas 0
Subido por

Descripción

Profesor: Jaume Pinyol

Vista previa del texto

TEMA 4 B) BANCOS DE DNA GENÓMICO TECNOLOGÍA DEL DNA RECOMBINANTE.
María Belén Pérez Sanmartín 2º Biotecnología.
Belén Pérez Sanmartín 2º Biotecnología Se puede utilizar uno u otro: A) Si pretendemos clonar DNA de eucariotas, que sabemos que son portadores de secuencias repetidas, utilizaremos un YAC.
B) Si solo queremos un DNA genómico con secuencias que no incluyan estas partes tan repetidas como podrían ser centrómeros, estas secuencias son muy estables, con BACs.
“WALKING” DEL CROMOSOMA.
Nos ha comentado que si tenemos los bancos de DNA genómico que contienen secuencias solapadas, por complementariedad podemos obtener clones que solapen unos con los otros.
Con este procedimiento bioinformático a partir de un clon obtenemos la secuencia de un cromosoma concreto, por comparación e hibridación vamos obteniendo clones solapantes que solapan con él.
El objetivo final es obtener todo un conjunto de fragmentos solapantes entre sí y que nos permitan saber la secuencia determinante del cromosoma entero.
1 Belén Pérez Sanmartín 2º Biotecnología O bien por secuenciación masiva de toda la genoteca hacemos esto por métodos informáticos.
Walking : procedimiento por el cual obtenemos los fragmentos solapantes vía hibridación/ vía comparación informática obtenemos los clonens adyacentes, y al conjunto de clones adyacentes lo llamamos contig.
- Linked flanking marked: durante muchos años se hacía cuando no se sabía la secuencia concreta del genoma humano pero se quería saber un gen de una enfermedad de transferencia genética.
A partir de un primer marcador nos indica que el gen que determina la enfermedad está a una distancia inferior a una mega base de este marcador.
Se hace un walking hasta llegar al gen que da lugar a esa enfermedad. Mediante estudios genéticos que ya comentaremos.
Una vez obtenido este marcador se hace un walking con un banco de DNA genómico hasta que se llega al gen de la enfermedad. Esto se llama clonaje posicional. Es un método por el cual a partir de un marcador acabamos determinando la secuencia de un gen.
CONSTRUCCIÓN DE UN MAPA FÍSICO O “CONTIG”.
A este conjunto de clones solapados que hemos obtenido por hibridación por comparación informática le llamamos contig. Es todo el conjunto de clones solapados que viene de DNA genómico.
2 Belén Pérez Sanmartín 2º Biotecnología Es decir, un contig es el conjunto de clones solapantes derivados de un banco de DNA genómico que entre ellos (el conjunto) representa de forma fiel la secuencia de un cromosoma en el genoma original.
Un contig debería ser un cromosoma entero, pero realmente no se obtiene eso: - En muchos casos se encuentra una secuencia repetida en dos cromosomas diferentes.
Una secuencia altamente repetida mucho más grande que la medida de cada uno de los clones para hacer el walking.
En ambos casos, se llega a una indeterminación, ya que puede venir de dos cromosomas diferentes o hibridar en alguna región del medio y se acabará el contig.
- Por eso el contig puede ser relativamente pequeño, porque hay agujeros que no se pueden resolver y los trozos que faltan pueden ser muy grandes.
Por mucho que se aumente la medida de los clones, no aumenta el contig, ya que también se llega a indeterminación si no se llega al cromosoma entero.
Se puede llegar a contigs para un genoma de una medida mucho más pequeña que un cromosoma.
Solución (nos permite contunar pero no se puede discernir la secuencia): 1. Coger un trozo grande del cromosoma A y nos quedamos con los 2 extremos.
2. Entonces, los clones de los extremos se pueden ligar: hacemos un banco de jumping, es decir, no nos quedamos con el fragmento entero sino con los dos extremos. Ya no se hacen, pero el procedimiento se utiliza en secuenciación masiva y asegura que físicamente los 2 extremos estaban en el mismo cromosoma. Así se llega a secuenciar más trozo.
En general, cuanto más grande sea la secuencia para hacer la secuenciación, más problemas evitaremos.
3 Belén Pérez Sanmartín 2º Biotecnología ULTRASECUENCIACIÓN / NEXT GENERATION SEQUENCING (NGS).
Incluyen todo un abanico (ventall) de técnicas y métodos diferentes que permiten determinar en paralelo la secuencia de hasta miles de millones de fragmentos de DNA.
Permite saber la secuencia completa de procariotas, no hace falta un cloning de microorganismos, se hace la secuenciación masiva sobre un chip/placa.
El primer sistema, 454 (pirosecuenciación) aprovechaba la química de Sanger, pero la determinación del nucleótido incorporado se realizaba a partir del pirofosfato liberado cuando este nucleótido se incorpora en el DNA.
1.
2.
3.
4.
5.
Fijar fragmentos de DNA sobre un chip/placa.
Para cada fragmento se hace la reacción de Sanger (ddNTPs + dNTP normales) El ddnt incorporado al DNA libera un pirofosfato (PPi) y H+.
Por cada PPi se detecta un fotón para determinar la secuencia.
A día de hoy, las tres tecnologías más utilizadas son: 1. Solexa-Illumina . Se utilizan didesoxis fluorescentes.
2. Ion-Torrent. Deriva directamente del 454 pero se detecta el protón en lugar del pirofosfato.
3. SOLID. Oligonucleótidos fluorescentes y T4 DNA ligasa.
4. PACIFIC, OXFORD NANOPORE . En desenvolvimiento, pero altamente prometedoras. De momento tienen tasas de error demasiado elevadas.
NGS. FLUJO DE TRABAJO.
1. Aislamiento del DNA o RNA.
- Si es RNA se pasa a DNA.
Se usan hexanucleótidos al azar como cebadores y no oligo de Ts. Es muy similar al Random Primed.
2. Fragmentación.
- Se utilizan DNasas, sonicación nebulización o transposasas.
Fragmentar el DNA en 200-300 bases.
4 Belén Pérez Sanmartín 2º Biotecnología 3.
Ligación con adaptadores.
Innecesario en el caso de utilizar transposasas para fragmentar.
Con ligasa (T4 DNA ligasa) se añaden adaptadores.
4.
“Emulsion PCR” o “Bridge PCR”.
Para obtener suficiente potencia de señal.
Para amplificar un poco los fragmentos, hasta 1 millón de veces cada fragmento.
5.
Reacciones de secuenciación para leer.
Con todo esto se llega a: 1.
2.
3.
4.
Secuenciación de novo: una secuencia desconocida.
Resecuenciación: identificar mutaciones en poblaciones.
RNAseq: cuantificación de la actividad génica.
ChipSeq: detección de interacciones proteína-DNA.
FRAGMENTACIÓN E INDEXADO MEDIANTE TRANSPOSASAS.
Indexar= registrar ordenadamente datos e informaciones, para elaborar su índice.
La utilización de transposasas es una alternativa para fragmentar, son transposasas del tipo “cut and paste”. Son enzimas que cortan el DNA de forma aleatoria (o casi) a la vez que ligan el DNA inserto a los extremos. Cuando ataca al DNA crea un complejo transitorio con el DNA a insertar llamado “transpososoma”.
1. Poner transposasa + cDNA: si porta la diana y el adaptador, puede cortar el DNA genómico y ligarlo al adaptador.
2. Se crea un complejo de transpososoma.
3. Se hace una pre-aplificación de PCR para seleccionar “los buenos”.
Se puede colocar dos transposones contiguos con el mismo “color”. Como hace falta un oligo azul y uno rosa para que funcione, hace falta que ambos oligos se enganchen bien.
5 Belén Pérez Sanmartín 2º Biotecnología EMULSION PCR.
Una vez ligados los adaptadores, las moléculas de ssDNA se hibridan con un exceso de microesferas (de agarosa) que tienen inmovilizado el oligonucleótido complementario al adaptador.
Las microesferas y todos los reactivos necesarios para la reacción de PCR se emulsionan en mezclas de agua y aceite mineral. Las microgotas resultantes tienen una o ninguna microesfera.Se hace la PCR de emulsión, donde el oligo hace de cebador.
Una vez hecha la PCR se rompe la emulsión y se recuperan las microesferas, cada una con un clon diferente de DNA.
Se amplifica hasta 1 centenar de millones y se pone cada bola sobre la superficie de un giro (con espacios de 44 micras^2), en una superficie compartimentada.
Es decir, las microesferas se depositan en una placa diseñada para tal de que sólo se pueda depositar una microesfera por agujero (Ion torrent).
Cada celda tiene un clon de millones de clones que vienen de un DNA inicial. Entonces, ya se puede secuenciar.
6 Belén Pérez Sanmartín 2º Biotecnología BRIDGE PCR.
La reacción de PCR tiene lugar sobre una superficie que contiene una gran densidad de los oligonucleótidos complementarios a cada uno de los extremos. Durante la amplificación, el molde forma un puente con el oligo forward o reverse y acaba dando un clúster de secuencias idénticas. Finalmente se corta la cadena reverse y los clusters están listos para secuenciar.
Procedimiento: 1. Desnaturalizar y fijar los fragmentos sobre una superficie que contiene una gran densidad de los oligonucleótidos complementarios a cada uno de los extremos.
2. Dejar hibridar y amplificar.
3. Se forma un puente entre el oligo cebador (forward o reverse) y los extremos para hacer una PCR (molde). Cada molécula inicial que origina con el chip hace un cluster.
4. Desnaturalizar: el oligo cebador tiene la secuencia enganchada.
5. Repetir el proceso de desnaturalizar (cortar la cadena reverse).
6. Amplificar para secuenciar con herramientas informáticas.
YOUTUBE: ILLUMINA.
7 Belén Pérez Sanmartín 2º Biotecnología PAIRED READS vs MATE PAIRS.
Por Illumina podemos obtener dos fragmentos diferentes: a cada ciclo queda ruido (soroll), es decir, no se elimina todo lo que toca desnaturalizar y baja la eficiencia.
Fragmentos o extremos emparejados (paired read): - 200 o 300 bases para cada lado (el techo (sostre) de Illumina).
Parte central corta (menos de 1 kb).
Fragmentos de jumping (mate pairs): - Fragmentos de 10 kbs no se pueden amplificar ya que el techo de PCR son 4 -5 kbs. En la práctica, para que sea eficiente se usan extremos de 600 nts (300 y 300) Parte central larga.
Por tanto, 10 kbs no se amplifica por PCR, aprovechamos y nos quedamos con los extremos.
1.
2.
3.
4.
5.
Coger la distancia que se quiera, por ejemplo 10 kb.
Añadir adaptadores a los 10 kb y circularizar.
Cortar y quedarnos con los extremos del 5’ y del 3’.
Poner adaptadores nuevos en los dos fragmentos de los extremos.
Amplificarlo.
8 Belén Pérez Sanmartín 2º Biotecnología 6. Secuenciar por Illumina.
Como sabemos que los 300 nts del 5’ están a 10 kb de los nucleótidos del 3’, y que además están en el mismo cromosoma, poco a poco se puede reconstruir todo su genoma.
1. Se mezcla Illuminas de paired reads y mate pairs.
2. Solapamiento bioinformático.
3. Reconstrucción del genoma de la bacteria.
Las bacterias raramente tienen secuencias repetidas más grandes de 10, 20 kb. En eucariotas puede llegar a las 200 kb, así que no se puede aplificar nada de esta medida. Se trata de hacer lo mismo (con los dos extremos) que el walking, al menos tendremos punto de entrada y salida de la secuencia repetida.
SECUENCIACIÓN.
POR ILLUMINA.
El sistema Illumina va añadiendo sucesivamente didesoxis fluorescentes (ddnts).
Cada nucleótido origina un color diferente y se detecta en cada momento un color. Como solo se puede poner un nucleótido a la vez, evita el problema del ion-torrent.
Mediante un láser se va leyendo la base incorporada de cada cluster.
9 Belén Pérez Sanmartín 2º Biotecnología El sistema Ion-Torrent detecta la base incorporada a partir del protón que se genera por la reacción de polimerización.
Una vez se quede fluorescente, hace falta quitar el ddnt (grupo fluorescente) para que vaya el siguiente nucleótido.
POR ION TORRENT.
Detecta la base incorporada a partir de un protón que se genera en la reacción de polimerización.
1.
Depositar microesferas en placa, para que quede 1 microesfera/celda.
2.
Desnaturalizar y añadir cebador, DNA polimerasa, etc para polimerizar.
3.
Poner dNTPs y ddNTP (sanger normal).
4.
Pasará por arriba (adalt) las bases y “baja” la que haga falta: polimerizará y generará un protón.
Millones, se deteta como corriente todos los DNA que hay.
5.
Sabremos que cada bola puede dar para un nucleótido diferente.
PROBLEMA: - ATTCCCC T* En * habrán 3 As y esto es dificil de diferenciar entre 3 millones de protones y 1, al pasar a bases iguales. Los homopolímeros pasan y puede dar lugar a unos 2.5 millones de protones = genera indeterminación.
Pero es un sistema barato y es capaz de dar información aprovechable.
10 ...

Comprar Previsualizar