HH (2007)

Otro Portugués
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Bioquímica - 5º curso
Asignatura HH
Año del apunte 2007
Páginas 19
Fecha de subida 02/07/2015
Descargas 15
Subido por

Vista previa del texto

5. Identificació de gens associats a malalties - Patologia TEMA 5. Identificació de gens associats a malalties 26-02-15 Veurem estratègies que s’han fet servir per identificar gens associats a malalties:     Clonatge funcional Quan volem trobar el gen causant d’una malaltia, ens fixem en els símptomes del pacient i a partir de la funció alterada, deduïm quina proteïna pot estar mutada, que ens durà al cDNA i d’aquest al gen. Així és com es van descobrir les talassèmies, hemofílies, fenilcetonúria o l’anèmia falciforme.
Clonatge posicional Si coneixem els símptomes, però no en tenim ni idea de la proteïna => no sabem què pot causar la malaltia, com és el cas de la fibrosis quística, que provoca molts símptomes diferents i no se sap quina és la proteïna defectuosa. Saps que és una malaltia que s’hereta i a través de mapes de lligament genètic, analitzant com es transmet la malaltia, es pot identificar el gen => podràs trobar el cDNA i finalment identificar la proteïna.
Gens candidats Seqüenciació de l’exoma complet L’era post-genòmica no hauria existit sense la PCR, que ens permet amplificar fàcilment el DNA. Ara tots els gens que s’identifiquen es fan a partir de gens candidats. Al tenir tot el genoma humà seqüenciat, podem especular quines seqüències poden donar lloc a la nostra proteïna problema.
CLONATGE FUNCIONAL Sospitem quina és la proteïna afectada i amb això podem arribar a determinar el gen. Mètodes: 1) Sondes d’oligonucleòtids degenerats Coneixent la seqüència de la proteïna, fem unes combinacions d’oligonucleòtids degenerats. Si tenim una idea de quin podria ser el gen alterat, o tenim una petita indicació de la proteïna afectada, aleshores podem seqüenciar una petita part de la seqüència d’aminoàcids i, a partir d’aquesta petita mostra, podem intentar deduir la seqüència de DNA abans de seqüenciar-lo.
Per deduir la seqüència de DNA, imaginem que tenim una petita seqüència que hem obtingut per alguna tècnica, podem tenir el RNA i el DNA, però no serà una seqüència única perquè el codi genètic és degenerat => triar una seqüència poc ambigua => intentar seleccionar regions que tinguin codons únics (triptòfan i metionina). Hem d’intentar evitar aminoàcids que tinguin molts codons, com l’arginina, la serina i la leucina, que estan codificades per 6 codons.
Podem intentar amplificar el fragment i mirar a les bases de dades de quin gen estem parlant.
Farem combinacions d’aquests oligonucleòtids per intentar pescar, amb PCR, el cDNA d’aquesta proteïna => necessitarem una genoteca de cDNA d’un teixit degenerat. Com a primers utilitzarem la barreja d’oligonucleòtids barrejats i un fragment complementari a l’extrem del vector on està clonat el cDNA. Alternativament, enlloc d’utilitzar la PCR, es poden fer servir els oligonucleòtids com a sondes marcades amb radioactivitat o fluorescència.
1 5. Identificació de gens associats a malalties - Patologia 2) Anticossos Alternativament, pot ser que la seqüència d’aminoàcids sigui suficientment antigènica com per detectar-la per un anticòs. Si a partir d’aquest fragment podem generar anticossos contra la proteïna, aleshores l’anticòs ens serveix per anar i fer un screening de la genoteca d’expressió (cDNA clonats en un vector d’expressió amb un promotor) per determinar de quina proteïna estem parlant. Si plaquegem tota la genoteca i fem servir l’anticòs, molt probablement podrem pescar el clon que expressa la proteïna que ha servit com a antigen.
3) Complementació funcional Si tenim la sort de buscar un enzim capaç de metabolitzar un S determinat, pot ser que tinguem un medi restrictiu en el qual només els bacteris que tinguin l’enzim capaç de metabolitzar el S sobrevisquin => els podrem seleccionar per aquesta resistència (pot ser resistència a la T, a un antibiòtic...). Un altre exemple seria un enzim que aprofita un substrat cromogènic.
Després es seqüenciarà el cDNA, localitzarà al genoma i veurà si realment els individus malalts presenten mutacions en aquell locus concret. També caldrà assegurar-se que aquests canvis realment afecten a la funció de la proteïna mutant. Finalment, s’haurà de veure que a la població sana no li afecta.
2 5. Identificació de gens associats a malalties - Patologia CLONATGE POSICIONAL El primer gen que es va aconseguir clonar per clonatge posicional va ser la granulomatosi crònica, lligada al cromosoma X. Un any després es va trobar el gen de la distròfia muscular de Duchenne (2Mb). Al cap de 10 anys del primer gen identificat, només es van clonar 50 gens responsables de malalties => tècnica difícil, però és la única manera de trobar quina és la causa de malalties totalment desconegudes.
En aquest cas no tenim cap pista de quina proteïna és la causant de la malaltia => caldran famílies (com més i més grans millor) per mirar com es transmet la malaltia per anàlisi del lligament genètic: utilitza marcadors genètics per poder situar la malaltia dintre dels cromosomes. Podrem localitzar el cromosoma i després anar acotant en quina regió es troba. A partir de la regió concreta, es poden analitzar genoteques, primer fragments molt grans com YACs o BACs, i després cada vegada és més precís fins identificar el gen de la malaltia i poder-lo seqüenciar. Un cop seqüenciat, com se sap que allò que has trobat és el causant de la malaltia? Cal comprovar => tornes a les famílies i veus si aquests individus que tenen la malaltia presenten mutacions en aquests gens i si la resta de la població que no té la malaltia no té la mutació amb aquest gen.
3 5. Identificació de gens associats a malalties - Patologia Un cop trobem aquesta regió en el mapa genètic, podem estar parlant d’uns 20M de parells de bases. El gen es troba dins d’aquesta regió, però caldrà acotar-ho encara més a través de mapeig físic o genètic (genoteques). Finalment cal mirar si realment hi ha cap gen.
Fase 1: localització de la regió cromosòmica Com hem dit, en molts casos no sabem quina pot ser la proteïna alterada i a partir de les famílies a partir de les quals tenim individus afectats per la malaltia, s’hauria d’intentar fer l’estratègia del revés, mirar en quina posició del genoma estaria el gen i mirar mutacions de la proteïna, que o sabem ni què fa. El primer pas és fer l’anàlisi de lligament genètic. Caldrà disposar de: o o Col·lecció de famílies ben caracteritzades en les quals se segregui la malaltia (com més i més completes millor) Altres caràcters Mendelians (fàcilment identificables i molt polimòrfics) = Marcadors genètics.
Han de ser prou significatius/informatius per dir si estan lligats amb la patologia d’estudi.
Actualment s’utilitzen més els SNPs que els microsatèl·lits, ja que n’hi ha molts, poden amplificar ràpidament per PCR i només tenen dos al·lels possibles. Com que n’hi ha tants, es poden trobar pròxims a gens relacionats amb malalties.
L’anàlisi de lligament genètic es basa en associar el gen de la malaltia amb els marcadors polimòrfics de manera que hem de veure si el gen responsable de la malaltia segrega juntament amb algun marcador polimòrfic que nosaltres sabem on es troba en el genoma.
Cal identificar si hi ha hagut recombinació. Quan els cromosomes es transmeten a la descendència, és molt fàcil que hi hagi recombinació meiòtica, passa molt habitualment en la formació dels gàmetes i això es troba fàcilment quan analitzem una família. Com més propers dos marcadors, menys possibilitat que recombinin entre ells. També poden estar tan separats que sembli que estan en cromosomes diferents.
El màxim de recombinacions que detectarem serà del 50% => molt allunyats, per això podrien estar en cromosomes separats. Mai tindrem més d’un 50% de recombinació. Per fer mapes genètics hem de calcular la freqüència de recombinació i com més fills tinguem més probabilitat hi haurà de trobar recombinants. Podem calcular la freqüència de recombinació entre dos marcadors i això ens donarà una idea de la distància que hi ha entre dos marcadors. La màxima freqüència de recombinació és de 0,5 perquè els dobles recombinants no els detectem.
Imatge: dos individus amb molta descendència, la mare dels quals és homozigot. Els dos pals indiquen que hi ha hagut recombinació en els seus cromosomes. Els quadrats són marcadors i veiem que en l’home de la generació II els dos cromosomes són diferents i la dona amb qui té fills no ens dóna informació. Els no recombinants són els vermells o blaus sencers, són N. Hi ha marcadors que no segreguen junts en el cas del pare, estan en blau i vermell. Si calculem FR en aquest cas, on tenim 5 recombinants i 5 que no => FR = 0,5 => els marcadors no estan lligats o estan en cromosomes diferents.
4 5. Identificació de gens associats a malalties - Patologia Imatge: tota la descendència de l’home de la generació II ha heretat el cromosoma de la mare i el del pare, però en una minoria hi ha hagut recombinació (R). En aquest cas la FR és més baixa, ja que de tots els al·lels possibles només hi ha un recombinant (1/10) => aquests dos marcadors estan lligats, es troben en el mateix cromosoma i probablement molt pròxims.
Quan trobem FR més baixes serà que els marcadors genètics que estem estudiant pertanyen al mateix cromosoma i parlarem de loci sintènics => el segon marcador vist és molt millor perquè segurament sí que es trobin en el mateix cromosoma (sintènics). FR ens indicarà la distància entre els dos marcadors dins del mateix cromosoma 03-03-15 Sabem que els cromosomes en la fase de la primera recombinació meiòtica poden patir recombinacions.
En aquests intercanvis no hi ha ni pèrdua ni guany de material genètic.
Si analitzem dos marcadors concrets, en aquest cas A i B, podem analitzar com es transmeten i veure si estan propers o allunyats. Suposem A proper al centròmer i B proper al telòmer. Si analitzem com estan en els pares i en els fills, podem veure si hi ha recombinants. Suposem que el pare té l’al·lel 1 pel marcador A i 1 pel B i en l’altre 2 per A i 2 per B. Si no hi ha recombinació el fill tindria 1 per A i B o 2 per A i B. Si hi ha recombinació, si només és una, entre dues cromàtides, tindrem que una de les cromàtides no haurà patit recombinació, l’altra tampoc, però entre dues sí que n’hi haurà hagut => un dels cromosomes que es transmeti tingui A1, però B2 enlloc de B1 i en l’altre cromosoma al revés => de les quatre possibilitats, tindrem que hi haurà dos no recombinants i dos recombinants possibles. Què passa si hi ha dobles o triples recombinacions? Cas del mig doble recombinació i A i B estan suficientment allunyats perquè hi hagi doble recombinació, en realitat no detectarem els dos recombinants. Si estiguessin més propers sí que podríem detectar-ho. El recombinant amb doble recombinació no el 5 5. Identificació de gens associats a malalties - Patologia detectem (three-strand). En el cas de four-strand sí que ho detectem. Per tant, com més allunyats dos marcadors més possibilitat que hi ha hagi dobles recombinants. La freqüència de recombinació ens dóna una idea de la distància entre dos marcadors, la calculem i mirem per si realment estan o no lligats en un mateix cromosoma. Com a màxim FR serà de 0,5 perquè els dobles recombinants no els detectem.
Meiosis informatives i no informatives Com més recombinants més separats estaran els gens, però no sempre podem tenir informació dels recombinants. Quan estem estudiant herències de malalties genètiques, la malaltia equival a un dels dos marcadors.
Exemple: marcador A és un marcador genètic polimòrfic i haurem de veure si està lligat o no amb la malaltia, si està proper o no. Detectarem els recombinants: (a) El pare és homozigot per al·lel 1, la mare per A2, i la filla és A1A2. Ens dóna informació si hi ha hagut recombinació entre locus malaltia i marcador? No, perquè el pare és homozigot.
(b) Sí que tenim el pare heterozigot, però la mare també és heterozigot i té els mateixos al·lels que el pare => la filla també és heterozigot pel marcador i no podem saber quin dels dos al·lels prové del pare i quins de la mare => tampoc ens dóna informació.
(c) Els pares són heterozigots, però la filla ha heretat l’al·lel A1 dels dos pares => la filla ha heretat l’al·lel A1 del pare i l’A1 de la mare => estem identificant quin al·lel segrega amb la malaltia del pare, el A1.
(d) La mare té al·lels diferents del pare => sabrem quin prové del pare i quin de la mare => també podem identificar que A1 prové del pare i dóna la malaltia. Observem que no hi ha hagut recombinants entre A1 i la malaltia i podríem sospitar que la malaltia té marcador genètic amb A1.
D’aquesta manera, haurem de poder veure si dos loci estan lligats genèticament i això ho veurem mirant si s’hereten de manera conjunta al passar a la generació següent i també ens dirà la distància genètica (D), com més recombinacions més separats en el cromosoma. La distància entre dos loci dependrà de amb quanta freqüència estan separats per una recombinació meiòtica. D es mesura com la fracció de gàmetes recombinants (θ).
6 5. Identificació de gens associats a malalties - Patologia Hi ha una certa equivalència entre FR i distància genètica -> dos marcadors estaran separats per 1cM si tenen una FR = 1% (1cM equival a 1Mpb).
Exemple: mapa del cromosoma 12 en homes i dones Si mirem el mapa genètic del cr12 de les dones veiem que és molt més llarg, però s’han fet servir els mateixos marcadors genètics per estudiar el cr12 dels homes. En els homes veiem que les FR són molt més petites => la distància genètica també serà molt més petita (cM). Això és perquè els cromosomes dels homes recombinen molt menys que els de les dones. Com menys marcadors tinguem més errors estarem introduint.
Exemple: mapa genètic del cromosoma 16 A la part dreta tenim els mapes de lligament genètic i a la dreta hi ha els diferents marcadors. Tenim mapa genètic per homes i dones, les distàncies també són molt diferents. El què es fa és un mapa promig dels dos sexes. Després es farà l’equivalència entre mapes genètics i físics. També s’han col·locat 7 5. Identificació de gens associats a malalties - Patologia contigs i els punts de trencament (mapa citogenètic). Com més marcadors posem menys diferències hi haurà entre mapes.
Exemple: cromosomes acrocèntrics Cal tenir en compte doncs, que hi ha diferències molt importants entre els punts de recombinació entre homes i dones, per exemple. En el cas del cromosomes acrocèntrics (13-18-21), observem que els homes recombinen sobretot en els extrems, en els telòmers dels cromosomes, mentre que les dones en els centròmers => hi ha hot spots de recombinació. El perquè no se sap, són evidències experimentals que s’han vist en fer estudis de lligament genètic. Per tant, els mapes genètics ens donen una idea, però no una idea exacta.
El mapa genètic del cromosoma Y no es coneix.
Marcadors genètics Per això necessitem marcadors genètics que ens permetin posar el gen d’interès en una regió concreta del genoma.
Cada vegada n’hi ha més i són més fàcils d’analitzar. Han d’estar suficientment repartits en el genoma, separats màxim 10-20cM i necessitem uns quants centenars de marcadors per cobrir tot el genoma.
8 5. Identificació de gens associats a malalties - Patologia Idealment es poden analitzar per sistemes de screening molt millor perquè en una sola anàlisi tindrem molta informació. Al llarg de la història s’han obtingut molts marcadors.
Els primers que ens van permetre fer mapes genètics de qualitat van ser els VNTR microsatèl·lits. Ara fem servir els SNP (tot i que només tenen dos al·lels, n’hi ha moltíssims i pots fer screening per highthroughput).
Quants marcadors necessitem? Dependrà de la freqüència de recombinació entre dos loci. Com més gran és la distància, més recombinacions haurem d’analitzar per trobar evidència de lligament: o o Recombinació de zero: analitzar unes 10 meiosis informatives Recombinació elevades: analitzar unes 350 meiosis informatives (difícil per malalties rares) Microsatèl·lits Disseny de primers que flanquegin la zona. Repeticions de 2nt per exemple, permeten amplificar de manera única perquè els primers han d’estar en zones de seqüència única, el genoma amb aquests marcadors. Podem fer servir una fluorescència per cada marcador i així ho fem córrer en un gel per analitzar diferents microsatèl·lits en el mateix carril.
Variable Number Tandem Repeat (VNTR) Tenim que tots els individus són heterozigots per aquest al·lel, ho podem detectar fàcilment i ens dóna molta informació. Si ho fem combinant altres marcadors, fent per exemple una PCR múltiple, que fem servir fragments de PCR diferents i es combinen amb fluorescències diferents, podem analitzar molts microsatèl·lits diferents => podem analitzar diversos VNTR en una mateixa reacció. Important: posem els primers a les zones NO repetides de la seqüència (seqüència única). Correrem els fragments en un gel que té una resolució d’un nucleòtid. Podem dissenyar primers per diversos marcadors per un mateix individu. Per diferenciar-los, marcarem els primers amb un fluorocrom diferent => podrem veure cada al·lel de cada microsatèl·lit (abans es feia amb radioactivitat).
9 5. Identificació de gens associats a malalties - Patologia Ampliat veiem els al·lels transferits.
High-throughput genotyping: SNPs Amb els SNPs encara és més fàcil. Són menys informatius que els microsatèl·lits (només tenen dos al·lels diferents => o hi és el polimorfisme o no hi és), però hi ha quantitats molt més grans, se’n coneixen més i es poden fer microarrays que permeten analitzar 500.000 SNPs al mateix temps.
Dissenyen un primer que amplifiqui just fins el nucleòtid d’abans del polimorfisme (SNP) i es fa una PCR que s’afegeixen ddNTPs (no deoxinucleòtids) marcats amb diferent fluorescència. Quan s’incorpora el nucleòtid amb fluorescència ho sabrem perquè s’acaba la reacció, com que són ddNTPs no es poden incorporar més nucleòtids. Es gasta molta poca polimerasa perquè només hem d’afegir un nucleòtid.
Exemple analitzem tres polimorfismes diferents: SNP1, SNP2 i SNP3. En el 1, l’individu és homozigot per A, no té G => només incorporarà la T pels 2 cromosomes => només veiem color verd. Si fos heterozigot seria també vermell i tindríem doble color, com que només veiem verd l’individu és homozigot. En SNP2 veiem que és heterozigot, veiem G i C -> blau i vermell. Per SNP3 és homozigot, només veiem un sol color. Fàcilment i gràficament identifiquem individus.
L’altre sistema és fer servir primers específics, és com quan explicàvem que volíem detectar mutacions en primers específics. Identificació en primer específic de l’al·lel => sí que arriba fins el nt que pot estar canviat i determina el polimorfisme, de manera que a 3’ tenim el polimorfisme i tenim un primer per cada polimorfisme diferent i només s’amplificarà quan hi hagi un annealing específic. Només cal posar una fluorescència i veure on tindrem senyal. Si és homozigot senyal en dos, heterozigot en un, o cap senyal. És a dir, com que el primer té la mutació a 3’, només hi haurà elongació si hi ha el canvi també.
10 5. Identificació de gens associats a malalties - Patologia Malaltia autosòmica dominant No sempre és tan fàcil conèixer els recombinants. Tenim una malaltia dominant que s’hereta: (A) La dona ha heretat la mutació de la mare. Marcadors genètics: A1, A2, A3, A4. Veiem que A2 ve del pare i A1 de la mare. Mirem els fills, com que la seva parella és heterozigot per marcadors diferents, podem saber bé quin marcador prové del pare i quin de la mare => podem saber quin és el recombinant. Individus afectats per la malaltia tenen A1, menys un que té A2 => és recombinant.
(B) Per la mateixa família, ara no tenim el genotip dels avis => no sabem quin al·lel del marcador A li ha passat la dona de la generació I a la seva filla => no sabem si tenim tres o un recombinant, podria ser que el marcador estigués molt lluny del gen de la malaltia.
(C) No tenim informació i estenem la família. Trobem cosins. El germà està mort. La parella té A5 i A6 i els fills malalts han heretat A1, que serà del pare, però no sabem si és el mateix el del pare que el de la mare, podria ser que la senyora fos A1A1. Per tant, és molt més complicat que el cas (A), on sabíem exactament els marcadors dels avis i podíem determinar la fase del cromosoma malalt, l’al·lel A1 estava en fase amb la malaltia.
Probabilitats de lligament genètic: lod score (Z) Càlcul de les probabilitats de lligament genètic per lod score (Z): logaritme de la probabilitat de que dos loci estiguin lligats (amb una freqüència de recombinació θ) respecte a que no estiguin lligats (θ = 0,5).
11 5. Identificació de gens associats a malalties - Patologia Càlcul del lod score Mirem el cas (A) on teníem informació dels avis. Calculem Z: logaritme que els individus siguin no recombinants multiplicat pels recombinants. La FR és θ. Probabilitat que no siguin recombinants? És 1-θ i la probabilitat que siguin recombinants és 0,5 que és el màxim de θ. Quan tenim diferents valors de θ, de 0 a 0,5 veiem uns valors per Z. Si representem els valors de Z tenim un gràfic amb una corba, on la FR més probable és la que té una Z més gran, en aquest cas seria 0.2. Malgrat tot, Z no és més elevat que 3 ni més petit que -2 => no podem saber si hi ha o no lligament en aquesta família amb aquest marcador.
Això ho podem fer amb les altres famílies que hem vist. Quan fem aquestes representacions en funció de Z podem trobar diferents particularitats: (4) - Cas blau: el més senzill. Si Z està entre -2 i 3 és indeterminat, no sabem si hi ha lligament genètic o no -> per aquesta família no sabem si hi ha recombinació o no.
(1) - Ara bé, en el cas verd, quan representem Z per les diferents FR ens dóna una gràfica on trobem que per FR molt baixes tenim que Z s’acosta a infinit => és superior de 3 per FR molt baixes, sí que hi ha lligament genètic.
12 5. Identificació de gens associats a malalties - Patologia (3) - En el cas lila, a partir d’una FR de 0,12 veiem que els valors de Z són inferiors a -2 => no hi ha lligament => aquest gràfic ens està dient que per una FR inferior a 0,12 podem excloure el lligament genètic. És a dir, que a 12cM al voltant d’aquell marcador no hi ha lligament genètic entre el marcador i la malaltia que estem estudiant.
(2) - Finalment, en el cas vermell tenim vàries coses. Per valors de Z inferiors a 0,5, podem excloure el lligament genètic, però per valors de 0,17 i 0,3 sí que hi ha recombinació genètica, hi ha lligament => podem dir que hi ha recombinació entre 17 i 30cM. FR menors de 0,05 podem excloure el lligament.
Com més marcadors analitzem, més probabilitat tindrem de trobar lligament i més acurada serà la localització del gen.
Taula. Estudi de diferents marcadors situats al cr15 que mostren l’herència de la migranya amb aura Valors de Z a diferents FR, des de 0,001 fins a 0,4. Tenim quatre marcadors pintats amb verd que tenen FR molt elevades, tenim valors de +5 => concretament aquests tres marcadors tenen un patró molt semblant al de la línia verda del gràfic, el seu Z màxim era per valors de Z al voltant de 0 => hi ha lligament genètic per aquests quatre marcadors. El marcador D15S1012 té valors negatius per totes les FR!!! Són valors inferiors a -2 a partir de zeta = 0,1 => estaríem en el cas de la línia lila del gràfic, en el qual estem excloent lligament genètic a partir de FR de 0,1.
Multipoint mapping A la taula hem analitzat la malaltia amb diferents marcadors i veiem que alguns presenten lligament genètic i d’altres no. Aquestes estudis en veritat són més rellevants si enlloc de fer estudis de lod score (comparant el locus de la malaltia amb un marcador concret), es comparen TOTS els marcadors en el cromosoma de la malaltia, s’analitzen tots els marcadors entre ells, no només marcadors dos a dos i es mira el Z per si hi ha lligament genètic. Això es coneix amb el nom de multipoint mapping (al analitzar més de 2 loci simultàniament fa que l’anàlisi de lligament genètic sigui més eficient). En aquest cas Z ha de ser superior de 5.
13 5. Identificació de gens associats a malalties - Patologia Hem trobat valors de Z superiors a 5 en una regió del cromosoma, mentre que hi ha regions del cromosoma molt negatius, això vol dir que segurament D3S1271 -> hi ha una FR més elevada entre gen malaltia i aquest. Mentre que en els que estan amb Z per sobre de 5 no recombinants => el gen de la malaltia probablement està entre aquests marcadors (encerclats en vermell). *diferència amb genètica és que enlloc de posar el marcador posem la malaltia* Wide genome scan: permet analitzar tot el genoma amb marcadors que puguin estar lligats amb una malaltia. en aquesta regió d’unes 10Mb s’hi trobarà el nostre gen de la malaltia.
Fase 2: Identificació de gens a la regió crítica Els mapes físics ens permeten localitzar precisament la posició d’un gen determinat. Hi ha genoteques específiques de cada cromosoma amb vectors que permeten grans inserts (ex. BACs, YACs). S’havia de pescar els vectors que continguessin els inserts que volem estudiar.
Podem identificar el gen de la malaltia de diverses maneres:   Anàlisi de seqüències per ordinador Chromosome walking i jumping Chromosome walking. Tècniques que es feien servir sobretot quan no estava seqüenciat el genoma. Feien genoteques de tot un cromosoma sencer. Per exemple cr7 el tallaven i feien genoteca clonant-lo. Suposem que un marcador genètic ha donat lligament genètic amb el 14 5. Identificació de gens associats a malalties - Patologia nostre gen, però ha d’estar uns quants cM del nostre marcador genètic, hem d’anar cap al telòmer. Hem d’ordenar els diferents clons que tenim. Un dels clons el podem pescar perquè té el marcador, però a partir d’aquí hem de seqüenciar l’altre extrem o fer servir aquest com a sonda per trobar el clon solapant i així anem avançant al llarg del cromosoma fins a trobar el gen d’interès.
Només un petit % del cromosoma té seqüències codificants i de vegades és difícil clonar seqüències que són repetitives, etc. Per això fèiem servir altres tècniques com el chromosome jumping, on es pot passar d’un clon a un altre seqüenciant només els extrems d’aquests clons i per això el què es fa és que quan s’obté un d’aquests clons pel qual hem trobat lligament es digereix i es fa un annealing del mateix lligament.
    Tenim marcador A i trobem un clon que conté el marcador A en un plasmidi. Podem tallar pel fragment de DNA que forma part del cromosoma, relligar-lo i si tenim un primer que conté el marcador A, seqüenciar just la continuació, que anirà en sentit contrari, anirà de 5’ a 3’ i podrem seqüenciar un extrem, saltant-nos el fragment del mig. D’aquesta manera, anem fent primers per seqüenciar regions que es van apropant al gen en qüestió. Obtenim una nova seqüència, fem un nou primer i fem el mateix.
Identificació d’illes CpG Com sabem que hem trobat el gen? Es busquen regions promotores consens. Molts gens a la regió promotora hi tenen illes CG, pot estar unes quantes kb enllà, no immediatament hi ha d’haver el gen. Si el clon que creiem que conté el gen té illes CpG, aleshores és molt probable que contingui un gen. *gens housekeeping: s’expressen sempre a nivell basal i no són específics de cap teixit -> han de tenir illes CpG* Screening de genoteques de cDNA Exon trapping Zoo blotting Hibridació a la regió que creiem que serà un gen: la hibridem en una placa amb sondes d’altres organismes (zoo blotting). Si un gen és conservat, aleshores l’haurem de trobar en els altres -> veurem també si una seqüència està conservada. Tindran una certa homologia moltes espècies 15 5. Identificació de gens associats a malalties - Patologia semblants, en el nostre cas mamífers per exemple. Si és un gen, segurament aparegui banda d’hibridació en algun lloc (Southern).
04-03-15 Fase 3: confirmació de gens candidats Un cop tenim el gen cal confirmar:    Recerca de mutacions en pacients Recuperació del fenotip normal in vitro Estudi d’animals genèticament modificats Tecnologia de transgènics i knockouts pot permetre veure que un animal que té una mutació en un genotip concret té una similitud amb els animals normals. Model ratolí, rata, gos... ens permet fer assajos preclínics.
Tenim el gen, però possiblement no sabem amb quina proteïna està relacionada. Haurem de conèixer el lloc on s’expressa (exemple: SNC per esquizofrènia, si no s’expressa al SNC no serà el gen d’interès).
També hem de veure si la proteïna quadra amb la malaltia que nosaltres estem analitzant i tot i que quadri, això no vol dir que sigui la responsable => caldrà estudiar les famílies => seqüenciar el gen a tots els pacients i individus sans. Es poden fer estudis in vitro o in vivo.
Gens candidats Hi ha altres estratègies que ens permeten trobar gens propensos a causar malalties i una d’elles són els gens candidats de malalties. Tenim el genoma seqüenciat i sospitem que el gen x podria donar el patró de malaltia. Podem mirar:   Funció o patró d’expressió Mirar la funció de les proteïnes per les quals codifica i el patró d’expressió (si és patologia del SN, sistèmic...).
Homologia amb gens responsables de malaltia en animals models Veure si hi ha homologia entre aquell gen i gens que es troben en models animals de malaltia.
Malalties rares per aparellament entre germans i cosins, en poblacions amb poblats molt petits.
Van identificar una mutació en un gen que en principi no sabien que podia donar una malaltia, però mirant a la bibliografia, van trobar que molts vedells holandesos tenien una malaltia amb un fenotip molt semblant al d’aquella família. Les vaques a holanda tenen un efecte fundador: 16 5. Identificació de gens associats a malalties - Patologia  tenien un semental que va inseminar moltes vaques, aquest semental tenia una mutació just en aquest gen i al anar tenint descendència va anar apareixent en moltes vaques holandeses -> van trobar l’origen de la malaltia gràcies a les vaques holandeses que tenien un fenotip semblant => important fer recerca bibliogràfica per si ha estat identificat en altres espècies.
Homologia o relació funcional amb gens responsables de malalties amb fenotips similars Família de gens que codifiquen per una funció semblant.
Imatge recull històric: veiem que des dels anys 80 fins l’actualitat, gràcies a tots els avenços que s’han anat descobrint, tant a nivell del descobriment del genoma humà i tecnologies noves, l’evolució de l’estudi de malalties genètiques. A l’inici l’estudi de malalties genètiques hereditàries es feia mitjançant clonatge funcional, hi va haver una època que es feia sobretot per clonatge posicional. Actualment la localització de gens candidats localitzats al genoma gràcies a estudis de lligament (perquè ja tenim el genoma humà seqüenciat).
WHOLE EXOME SEQUENCING Una de les tècniques utilitzada també darrerament és la seqüenciació sencera de l’exoma. L’exoma és el recull de totes les seqüències codificants, de tots els exons. Tot i que sabem que hi ha mutacions que poden ser en altres regions, això comprèn la majoria de seqüències que poden causar mutacions i malalties. Aquesta tècnica s’està fent servir per identificar mutacions de malalties molt rares i en les quals hi ha molt poca informació de pacients, en aquests casos seqüencien els membres afectats per la malaltia en una família i comparen l’exoma amb individus sans, que n’hi ha molts en les bases de dades.
Obtenen DNA genòmic del pacient, ho digereixen i ho hibriden amb seqüències codificants per així aconseguir un enriquiment només d’aquests exons. Es renta, es captura el DNA hibridat i se seqüencia de manera massiva i es compara amb les bases de dades per veure si hi ha algun canvi detectable i que a més a més pugui donar una mutació.
17 5. Identificació de gens associats a malalties - Patologia Avantatges: sabem que les seqüències codificants només representen un 1% del genoma => hi ha molt menys a seqüenciar => més ràpid. I s’ha vist que la majoria de mutacions causants de malalties hereditàries estan en aquesta regió. Difícil en casos amb mutacions degut a més d’un gen. Inclou senyals consens de splicing i és barat i poc invasiu (només cal una mostra de DNA del pacient).
Desavantatges: hi ha regions del DNA (un 6%) que s’ha vist que és molt difícil de clonar, si tenim la mala sort que el nostre gen està en una d’aquestes regions, probablement no el detectarem. A més a més, en aquestes seqüenciacions hi ha molts errors => important comprovar que realment correspon a una mutació i no està a la població normal. Hi ha molts SNPs descrits, però no tots estan descrits. N’hi ha que s’han caracteritzat molt bé per algunes malalties, però pot ser que gens de malalties rares no tinguin els SNPs al voltant del gen ben caracteritzats. Cal identificar els símptomes de la malaltia i relacionar-ho amb mutacions que podrien causar-los => cal també l’experiència dels metges. I també cal rastrejar molt bé possibles falsos positius i negatius -> un cop tenim l’exoma seqüenciat assegurar-nos bé.
18 5. Identificació de gens associats a malalties - Patologia Resum del tema. Volem identificar el gen candidat per una malaltia que es transmet genèticament: com ho hem de fer? Tenim moltes tècniques. Podem fer servir organismes model (knockouts, a nivell cel·lular...; ex. malalties en gossos de raça degut a la consanguinitat -> ha ajudat molt per fer després estudis en humans). Buscar en totes les bases de dades que ja existeixen de gens, proteïnes, etc. Hem de conèixer molt bé quin és el fenotip clínic dels pacients per poder-ho relacionar amb la funció de la proteïna, i necessitem totes les proteïnes afectades per fer-ho bé. Comprovar que és mutació que no es troba en individus sans, no només en pacients.
19 ...