Tema 3: Transcriptòmica (2016)

Resumen Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Biotecnología - 3º curso
Asignatura Biologia Molecular de Sistemes
Año del apunte 2016
Páginas 8
Fecha de subida 14/03/2016
Descargas 25
Subido por

Vista previa del texto

Maria Lobato Gómez. Universitat Rovira i Virgili Tema 3. Transcriptòmica - Què és la transcriptòmica? El transcriptoma és el terme que es dona al conjunt de transcrits o mRNA produïts per la cèl·lula, aquest pot variar en funció de les condicions mediambientals. Degut a que inclou el conjunt de mRNA transcrits en la cèl·lula, el transcriptoma també reflexa els gens que s’estan expressant en un determinat moment.
Aleshores, la transcriptòmica té com a objectiu examinar el nivell d’expressió dels diferents mRNA en una població de cèl·lules donada, usant tècniques d’alt rendiment basades en microarrays. Tot i que el mRNA no és el producte final d’un gen, la transcripció és la primera etapa de la regulació del gen i la informació sobre els nivells de transcripció és necessària per entendre les vies de regulació del genoma.
Així, la transcriptòmica, també anomenada “genome-wide expression profiling”, és una tècnica important que s’usa per entendre els gens i les vies involucrades en processos biològics.
En conclusió, és l’estudi del perfil de transcrits que hi ha en un sistema (cèl·lula, teixit (estudis de profiling) o organisme) en un temps determinat amb unes condicions fisiològiques concretes. En els primers estudis, es centraven en els mRNA, avui en dia, amb el disseny de nous microarrays, es poden incloure en l’estudi tRNA i rRNA.
Els estudis de transcriptòmica no acostumen a ser una quantificació absoluta, més bé es comparen dues mostres, de forma que es duu a terme una quantificació relativa. Després de la hibridació podem veure quins gens s’expressen i quins no, i les seves respectives abundàncies relatives, ja que més que catalogar, ens interessa comparar situacions, de forma que no es fa un únic microarray, sinó que es fa ús de molts per tal de veure si una determinada situació està alterant el transcriptoma mitjançant una repressió o una sobreexpressió, de forma que, com a mínim, es comparen dues situacions.
A banda de les tècniques de hibridació, on trobem principalment els microarrays, també es fa ús de tècniques de seqüenciació d’última generació que seqüencien els fragments escollits de cada transcrit.
Si comparem els microarrays amb la resta de tècniques d’estudi de l’expressió gènica, podem veure que és la que pot analitzar un nombre major de gens simultàniament, sent una tècnica moderadament quantitativa, lo de moderat és degut a que no podem fer quantificació d’alguns gens perquè no tenim els seus patrons, de forma que en aquests casos no podrem dir quina quantitat de DNA transcrit tenim en una mostra. La tècnica dels microarrays, com ja s’ha dit, és més bé una tècnica qualitativa. A més, no és una tècnica molt sensible, però sí lo suficient com per obtenir resultats de confiança Maria Lobato Gómez. Universitat Rovira i Virgili - Arrays de DNA: són suports sòlids sobre els que s’han situat en posicions fixes una col·lecció (10.000100.000) de fragments de DNA específics per determinats gens. En un array per estudiar transcriptomes s’usen matrius on els spots tenen adherides sondes complementàries al que volem analitzar, aquests són construïts per empreses que produeixen microarrays, podem triar un de pre-seleccionat o bé podem demanar que ens facin un a mesura. Cada espècie tindrà el seu propi microarray.
o Per a què serveixen?  Anàlisi de l’expressió diferencial de diferents mostres de mRNA  + típic  Nombre de còpies de DNA  Interaccions proteïna-DNA  Detecció de polimorfismes (SNPs) o Tipus de membranes de suport: Cadascuna d’elles té les seves avantatges especifiques. En el cas que es dugui a terme una hibridació amb isòtop de fòsfor, la membrana de niló és el mètode de detecció més sensible. Els microarrays de vidre, en canvi, permeten l’ús de tècniques fluorescents d’alta resolució i de marcatge dual per a l’anàlisi de dues mostres en un únic array.
o Tipus de sondes:  DNA bicatenari: es pot obtenir a partir del producte de la PCR de DNA genòmic (s’usen primers dels gens) o bé d’una col·lecció de clons. En aquest cas parlarem de microarrays.
 Oligonucleòtids: es pot fer primer la síntesi i després la unió al suport (40-70 pb) o bé es pot fer la síntesi sobre el suport (25-60 pb). En aquest cas parlarem de chips.
 Hi ha dues variants de la tecnologia dels microarrays de DNA: o Format I: una sonda de cDNA s’inmobilitza sobre una superficie sòlida com el vidre mitjançant un robot i s’exposa a les dianes per separat o juntes.
o Format II: es un array d’oligonucleòtids (20 -80 mer) sintetitzades in situ per un sistema convencional i s’inmobilitzen en un chip  DNA chips.
Maria Lobato Gómez. Universitat Rovira i Virgili - Esquema general del procés d’anàlisi d’expressió gènica 1) Aïllar RNA de les mostres a comparar: es pot purificar: a. El mRNA: dóna menys background i té més sensibilitat si volem estudiar les molècules que es transcriuen. Es pot purificar mitjançant kits específics de columnes de cel·lulosa que tenen cues de poli-T on hibriden les cues de poli-A b. Tot el RNA: s’usa un sistema de purificació de RNA total Un cop tenim el RNA de la nostra mostra (missatger o total), el punt crític és que aquest tingui una bona qualitat, que no hi hagi contaminació per proteïnes o altres molècules i que no estigui degradat. És fan tests de puresa per cromatografia líquida d’alta eficàcia (HPLC), on es calcula un ratio RIO entre la quantitat de RNAr de les subunitats major i menor, quan el RNA és íntegre aquest valor és constant i si no, és un indicador de degradació. Aquest tests també es poden fer mitjançant NanoDrop (seminaris TBBM), els quals no ens diuen si hi ha contaminació per DNA però en cas de sospita s’ha de fer una predigestió amb DNAsa.
2) Transformar RNA a cDNA marcat per transcripció inversa: depenent si el sistema és Agilent o Affimetrix, s’incorporarà fluorocrom (Cy3 o Cy5) o biotina, respectivament, en els NTPsd.
Si es treballa amb mRNA els primers són de oligo-T, si es treballa amb tot el RNA total, s’usen random primers.
3) Hibridar cDNA marcat a arrays idèntics: es posa en contacte la mostra marcada amb el microchip que conté les sondes, prèviament s’han extret els nucleòtids lliures per eliminar el soroll de fons. És crucial usar tampons i temperatures d’hibridació adequats i òptims. És un procés sensible perquè els fluorocroms són fotosensibles (en Affimetrix no hi ha aquest problema), de forma que s’ha de fer a la foscor.
4) Eliminar cDNA marcat no hibridat: només romandran unides al chip les unions específiques 5) Detectar i quantificar la hibridació: es llegeix la fluorescència amb un scanner de microarrays.
En Afimetrix la detecció es fa mitjançant una reacció enzimàtica on es genera fluorescència com a producte (recorda que el marcatge era amb biotina).
 Què és el Dyeswap? El marcatge invers en el cas de comparar dues mostres marcades amb diferents fluorocroms, es duu a termes empre per corregir la diferent eficiència de marcatge o senyal entre els dos fluorocroms.
Exemple  marcatge normal: mostra 1 mostra 2  marcatge invers: mostra 1 mostra 2 Una altra opció és fer ús de dos slides, un per cada mostra, però en aquest cas tindrem variabilitat interassaig, que es pot corregir amb els spots de controls positius i negatius que trobem en tots els microarrays.
Si usem un únic fluorocrom es tractarà d’un microarray d’un canal i si s’usen dos, de dos canals. Si l’objectiu és comparar dues mostres, hi ha dues opcions: 1) Agafar dos microarrays iguals i posar cadascuna de les mostres per separat 2) Microarray en dos Canals: s’hibriden quantitats iguals de les dues mostres, cadascuna marcada amb un flurocrom diferent.
Els microarrays d’Affimetrix sempre són d’un canal.
Maria Lobato Gómez. Universitat Rovira i Virgili Un cop hem dut a terme tot el procediment esmentat, obtenim dades numèriques i visuals. Es comença observant les visuals, on podem veure cada spot marcat amb un color, el color amb el que està marcat no serveix per quantificar però sí per filtrar spots abans de passar a l’anàlisi de les dades numèriques.
En la fotografia podem veure ràpidament com ha anat el microarray: el resultat de la hibridació, els que s’han expressat, els quadrants del slide que presenten impureses, si hi ha molt de soroll de fons,...
6) Comparar les dades quantitatives de les mostres: com ja s’ha esmentat, en els microarrays la quantificació és relativa.
1) Un cop hem fet la filtració inicial, extraiem les dades de fluorescència que hi ha en un Excel, on tenim les dades de cada spot i una dada annexa que ens indica el background. De forma que a les dades de tots els spots els hi restem el valor del soroll de fons, el qual pot ser diferent depenent de la zona del slide.
2) Normalització: consisteix en treure l’efecte de les diferències que no són degudes a factors biològics. Hi ha dotzenes de mètodes descrits: a. Es pot agafar la fluorescència total d’un canal i posar-la com a referencia en totes les dades de fluorescència abans de calcular el rati (En aquest cas s’assumeix que en cada poeut s’ha posat la mateixa quantitat de fluorescència) b. Es pot agafar un pouet d’un gen constitutiu i referir totes les dades de fluorescència a aquell pouet 3) A partir d’aquí calculem el fold-change, es a dir, un ratio entre les vegades que s’expressa cada gen respecte la seva situació control, si aquest ratio és major a 1, significa que el gen està induït en la situació estudiada, i si es menor, reprimit. Es considera que per sobre de 2 i per sots de 0,5 la inducció o expressió és important (valor arbitrari). En comptes de fer aquesta suposició arbitrària, es pot saber si un gen està sobreexpressat o reprimit fent ús de l’estadística, on a partir dels ratis dels gens obtenim un valor de p que ens dirà si la diferència és significativa o no.
4) Validació: de totes les diferències detectades mitjançant microarrays mitjançant un mètode d’anàlisi de gens individuals, com ara la RT-PCR.
Hi ha programes informàtics que ajuden a l’anàlisi de dades: ImaGene o ArrayVision (d’una universitat d’Austràlia) Si el que estem estudiant és el grau de repressió d’un fàrmac, per exemple, sabrem si el tractament és suau i provoca canvis lents o si és potent, tot mirant els valors dels ratis problema/control.
L’anàlisi dels microarrays de DNA té un gran nombre de problemes estadístics, incloent la normalització de dades.
Per anàlisis d’arrays en membrana de niló les dades es generen per fosfoimaging, on el software correlaciona els spots amb els gens i pot comparar les intensitats dels spots en arrays d’expressió diferencial. En arrays de vidre, en canvi, es generen imatges fluorescents que s’escanegen i el software permet comparar les fluorescències de les mostres.
- Disseny de microarrays: o Els microarrays de vidre d’Agilent, que són de vidre pretractat, han de sintetitzar-se en condicions d’asèpsia, ja que si hi ha contaminació durant el procediment de fabricació s’ha de llençat. Les fàbriques de microarrays estan robotitzades.
Maria Lobato Gómez. Universitat Rovira i Virgili - GeneChip d’Affymetrix: és un chip de silicona, on els oligonucleòtids es sintetitzen sobre l’array. Com a mostra es fa servir cRNA i no cDNA, el cRNA és el RNA derivat de la còpia del cDNA: Maria Lobato Gómez. Universitat Rovira i Virgili - Aplicació de la transcriptòmica: s’usa per trobar la solució a qüestions específiques sobre l’expressió dels gens o Farmacogenòmica: s’usa per trobar la diana de fàrmacs  si el perfil de l’expressió d’un gen causat per una mutació és similar a un causat per un fàrmac, això significa que el fàrmac interacciona amb aquest gen i inactiva la proteïna afectada per la mutació o Toxicogenòmica o Classificació de malalties: s’ha vist que un únic marcador no és suficient per distingir dues malalties similars, com és el cas del càncer o Descobriment de gens: a partir de seqüències de DNA que han estat aïllades i no tenen una funció coneguda, no obstant, si aquestes mostren un patró d’expressió similar al d’un gen caracteritzat, això ens estarà indicant que tenen funcions similars.
- Tipus de repliques o Biològiques: el seu nombre és essencial per definir conclusions d’experiment. Posem com exemple que volem fer un experiment de microarray amb cultius cel·lulars i es vol fer una comparació entre cèl·lules tractades i no tractades. No es durà a terme un únic experiment, sinó que es faran un mínim de rèpliques respecte l’experiment inicial.
Es considera que el nombre òptim és el de 3 repeticions biològiques, molts cops, per estalviar degut a que s’ha de fer una gran quantitat de rèpliques, es fan 2 o 1.
Quan parlem d’animals de laboratori, el tema és diferent, en aquest cas en cada grup experimental hi ha un cert nombre de ratolins (4, 5 o 10) i es fa un microarray per cadascun, de forma que cada grup experimental tindrà el microarray de cada ratolí, on cadascun d’ells seria com una repetició biològica.
Molts cops es baixa el llistó i no es fa un microarray, sinó que, per exemple, si tenim 5 animals, es fa el de 2 representats del grup, o bé si hi ha limitació de material es fan pulls de mostra, on en comptes d’agafar 3 ratolins i fer 3 microarrays es fa una barreja del RNA dels 5 ratolins del grup control i de les 5 rèpliques del grup tractat, i s’analitza el transcriptoma d’un pull d’animals.
Els avantatges del pull és que estem sumant 5 rèpliques biològiques en una mostra, i per tant, estem mirant un solapament de transcriptomes, a més, no fem ús d’una sola mostra, de forma que es poden evitar els errors que es produirien si ens quedéssim amb una sola mostra i aquesta fos errònia. El desavantatge és que no mirem un transcriptoma pur i en conseqüència no sabem ben bé quina és la situació.
o Tècniques: estan incloses en el propi microarray, ja que cada gen no es troba en un únic spot, sinó que com a mínim hi ha dues rèpliques iguals. Tot i així, nosaltres podem afegir més rèpliques tècniques repetint dues vegades l’anàlisi d’una mostra per veure la precisió del resultat i veure les diferències entre aquestes.
Un exemple podria ser que nosaltres fem una placa de cultiu i sembrem tres pouets iguals dels quals extraiem el RNA, aquests pertanyen a la mateixa rèplica biològica, però si els analitzem més d’una vegada són rèpliques tècniques, ja que no hi ha diferència de sembrat o de disseny experimental. Un altre exemple és la inversió del fluorocrom en les mostres a analitzar (Dyeswap), on volem veure si el diferent marcatge afecta en el resultat.
Maria Lobato Gómez. Universitat Rovira i Virgili - Estandardització microarrays: anteriorment hi havia diverses formes de comunicar els resultats d’un array a la plataforma científica, de forma que moltes vegades els grups de recerca expressaven els resultats d’una forma que era impossible d’interpretar pel lector. Degut a això, es va consensuar una plataforma de treball que s’anomena Grup MAGE i va sentar les bases de la informació mínima que s’ha de controlar i informar a l’hora de donar resultats de microarray. En moltes revistes científiques exigeixen el MIAME (Minimum Information About a Microarray Experiment) per publicar resultats de microarray, el qual representa una senyal de qualitat de cara a la informació que es dóna. El MIAME conté 6 parts: 1. Disseny experimental: conjunt d’experiments d’hibridació com un tot, s’ha d’indicar el tipus de cèl·lules i teixits que s’han usats, quants grups d’estudi hi ha en cada experiment, com s’ha obtingut la mostra, quantes rèpliques tècniques i biològiques s’han fet i si hi ha grups control i tractat.
2. Disseny de l’array: s’ha d’indicar clarament quin tipus de microarray s’ha usat, de quina plataforma és, quants gens inclou, de quina espècie és i quin teixit s’ha usat.
3. Mostres: fa referència a la mostra biològica de la qual hem obtingut el material per fer l’estudi amb microarray. També s’ha d’explicar com es prepara el cDNA i com s’ha obtingut el RNA original, el tipus de marcatge i la química d’aquest marcatge.
4. Hibridació: procediments i paràmetres  temps, temperatura, quantitat de cDNA que s’afegeix de cada mostra sobre el filtre, rentats, quin tampó d’hibridació s’usa, tampons i temps rentat 5. Mesures: imatges, quantificació i especificacions  procés d’escaneig dels resultats, s’ha d’indicar com es fa i amb quin equip, si s’usen un o dos canals, quin processador de marcatge usem i com verifiquem si els spots han hibridat correctament 6. Controls de normalització: tipus (controls interns del microarray, fluorescència total o gens housekeeping del microarray), valors i especificacions  quin format de software de normalització s’ha usat.
- ArrayNorm: fa un anàlisi dels resultats en fitxers .txt  els transforma, normalitza i elimina el background, és a dir, fa tot el que sabem que s’ha de fer abans d’arribar als ratios.
1) Disseny de l’experiment: li expliquem l’arbre experimental en un fitxer .txt de cada rèplica i analitza les dades.
Hem de dir quantes repliques hem fet i de quin tipus, o si no n’hem fet.
2) Filtració de spots: visualment es poden detectar els spots erronis/artefactuals 3) Detecció del background: aquest es resta als valors de tots els spots 4) Anàlisi dels valors de fluorescència obtinguts: el traçat de les intensitats de les dues fluorescències en un microarray de doble canal és una forma comuna de mostrar les dades. A partir d’aquí, no es treballa amb la intensitat de fluorescència neta, sinó que es fan transformacions logarítmiques amb base 2 de la intensitat i es representa en forma de gràfic: Maria Lobato Gómez. Universitat Rovira i Virgili 1. Scatterplot: el que s’espera trobar és la línia vermella, ja que per definició s’espera que la relació entre els logaritmes de les dues intensitats ha d’estar en la bisectriu. Ens permet veure tot un núvol de punts que corresponen a cada spot del microarray en un sol gràfic, on s’assumeix que l’experiment ha anat perfecte quan els punts estan al voltant de la bisectriu, ni per sobre ni per sota.
Quan veiem, com en l’exemple, que els punts estan lleugerament per sota, el sistema ens permet reescalar els valors per tenir-los com haurien de ser, es a dir, es normalitzen els valors per a que caiguin a la zona del gràfic on volem, i això permet comparar diferents microarrays. Es a partir d’aquest gràfic on es decideix quin tipus de normalització es fa.
S’assumeix que la fluorescència total per una mostra d’un fluorocrom i un altre és la mateixa.
2. Histograma: presenta forma Gaussiana, el punt màxim s’hauria de trobar en el punt 0, en el cas que això no passi degut a que hi ha un desplaçament, podem corregir els resultats reescalant els resultats, ja que el rati seguirà sent el mateix.
Disseny experimental: Introducció de dades  Filtració de resultats  Eliminació del background  Normalització  Obtenció del ratio  PANTHER  Interpretació de resultats - Empreses de microarrays: 1. Affymetrix 2. Agilent Technologies 3. CombiMatrix 4. Eppendorf 5. Nanogen - Bases de dades per a dades de microarrays: 1. Gene Expression Omnibus-NCBI 2. MUSC database 3. Array Express al EBI 4. caArray at NCI ...