Genòmica- Tema 2 (2014)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 3º curso
Asignatura Bioinformática
Año del apunte 2014
Páginas 12
Fecha de subida 18/02/2015
Descargas 1
Subido por

Vista previa del texto

BI- Tema 2 TEMA  2:  RECONSTRUCCIÓ  FILOGENÈTICA  MOLECULAR   Implicacions  del  procés  evolutiu   L’evolució és el procés històric de transformació d’unes espècies en d’altres de descendents. Es produeix a través de canvis que succeeixen a l’atzar.
- Totes les espècies comparteixen un ancestre comú.
- La vida té una història Res té sentit en la biologia si no es sota el prisma de la evolució.
Què  és  una  filogènia?   Filogènia = Arbre filogenètic = Arbre evolutiu Construïm un arbre filogenètic o evolutiu que és un diagrama ramificat que mostra les relacions evolutives entre els taxons.
Premisses: - Evolució; es centra en que hi ha un avantpassat comú i que han anat succeint mutacions - Avantpassat comú - Transferència vertical: el material genètic es passa d’una generació a l’altra (node = cessament del flux genètic) La  revolució  molecular  en  la  classificació  dels  éssers  vius   Els arbres es creen gràcies a les similituds entre els taxons, si son més similars, seran més propers. Aquestes similituds antigament es basaven en característiques morfològiques, ecològiques... (fòssils) però fins fa poc es van començar a utilitzar les característiques moleculars, que d’entre els seus avantatges hi ha: - Universals - Evolucionen més uniformement - Mes adequades per a l’anàlisi quantitatiu, podem saber quantes mutacions s’han acumulat i es més fàcil quantificar les diferències - Molt més abundants         1   BI- Tema 2 Rellotge  molecular   La teoria del rellotge molecular es basa en que la taxa de substitució/posició/generació en el temps (λ) és constant en tots els llinatges. Per tant, l’acumulació de les mutacions serà més o menys constant en el temps.
La taxa de substitució es defineix amb la seguent fórmula: La seqüència del ancestre sempre s’haurà d’inferir, perquè no la coneixem.
La divergència és una estima mínima, si hi ha hagut molt temps entre la divergència entre espècies, pot ser que una base que era diferent hagués mutat mes d’una vegada, de manera que moltes mutacions no les podrem veure utilitzant la formula clàssica de la taxa de substitució.
Per tant per calcular la divergència aplicarem una correcció, la més típica és la correcció de Jukes i Cantor, on k, la taxa de substitució té la següent formula: La correcció es basa en que, passar d’una base a qualsevol altra té la mateixa probabilitat (mateixa probabilitat AàT; CàG, Gà A....), aquesta probabilitat és α.
Amb la correcció, la divergència de l’exemple passa del 20% al 23%   2   BI- Tema 2 Reconstrucció  filogenètica  molecular   Imaginem que volem saber les diferències entre 4 espècies, el primer que fem és seqüenciar les mateixes seqüències dels organismes(homòlogues).
A continuació alineem les seqüencies.
A partir de l’alineament crearem l’arbre (reconstrucció filogenètica), les seqüències més semblants seran més properes que les més diferents.
Arbre  filogenètic:  gràfic  de  nodes  i  branques   - Nodes: cadascun dels avantpassats comuns Branques: distància entre els nodes Els OTU són les unitats taxonòmiques operatives. No parlem d’espècies o organismes, sinó d’OTUs.
Els nodes externs (A, B...) són els OTUs més recents.
Arbres  arrelats  i  desarrelats   Tipus d’arbres: - Arbre arrelat (rooted tree): té un ancestre comú, a partir del qual es van produint les ramificacions.
- Arbre desarrelat (unrootd tree): no sabem quin és l’ancestre comú ni els externs.
Sempre hem de indicar quin és l’outgrup (taxó extern), a partir d’aquest es forma l’arbre arrelat.
  3   BI- Tema 2 Tipus  de  representacions  filogenètiques   Les dades es poden representar en: - Cladograma: es representen totes les especies en el mateix nivell, de manera que nomes podem veure les ramificacions que hi ha hagut, no si una espècie ha acumulat més canvis.
Només informa sobre la topologia - Filograma: la longitud de les branques és proporcional al nombre de mutacions, i per tant, a la divergència.
Els arbres desarrelats a vegades es presenten en cladogrames o filogrames, però hi ha programes que per defecte, a partir d’un arbre desarrelat, ens consideren l’outgrup un organisme que no és. Imaginem que en l’arbre anterior és Menura, llavors Menura serà l’extern i haurem de ficar la resta en funció d’aquest, de manera que els organismes més llunyans tindran branques més llargues   - Cronograma o arbre ultramèric: les longituds de les branques estan normalitzades pel temps, de manera que aquí s’assumeix la teoria del rellotge molecular. La longitud de les branques indica el temps que ha passat.
- Xarxa o mapa d’haplotips: cadascuna de les representacions no és un OTU, sinó un haplotip. La mida dels cercles indica la freqüència de l’haplotip entre les diferents 4   BI- Tema 2 espècies. A més, es representa de quin organisme prové l’haplotip i quins haplotips presenten les diferents espècies.
MÈTODES  DE  RECONSTRUCCIÓ  FILOGENÈTICA   A part del tipus d’arbre, també hem de tenir en compte quin mètode utilitzar per fer un arbre, hi ha diferents mètodes: - Basats ens matrius de distàncies genètiques: utilitzen un algorisme per convertir la matriu de distàncies (llargada de les branques) en un arbre.
o UPGMA, Neighbour – Joining, Distància transformada, Mínima evolució...
- Màxima parsimònia: es generen arbres i es considera que l’arbre més parsimoniós és aquell que comporta menys canvis evolutius, tot i que no té perquè ser el real.
- Màxima verosimulitud: el arbre més verosímil es el que té més probabilitat d’haver produït les nostres dades i està basat en un model d’evolució nucleotídica - Inferència bayesiana: es tenen en compte probabilitats. Es basa en la distribució de probabilitat posterior dels arbres.
Basats  en  matrius  de  distàncies   Començarem amb una matriu on es representa el nombre promig de substitucions nucleotídiques per 100 llocs. Representa les diferències entre els diferents organismes.
  5   BI- Tema 2 - Mètode UPGMA (Unweighted Pair Grouo Method with Artimetic mean) És una mitja no ponderada que es fa entre parelles de grups.
Aquest mètode va agafant parelles i va mirant quines diferències hi ha entre elles, anotant-les en una matriu. El nombre més petit d’aquest matriu ( hi ha hagut menys canvis) serà el del que partirem, perquè seran els organismes més semblants.
En l’exemple els organismes més semblants són H-C.
Per tant, el primer que fem es ajuntar aquests dos en l’arbre, partint les diferències entre ells (les dividim entre dos) entre les dues branques que els separen.
Per tal de saber quin és el següent grup a ajuntar formem una nova matriu on comparem aquesta primera parella (H-C) amb les altres.
o La diferència HC - G: s’obté de fer la mitja de les diferàncies H-G (1,51) i C-G (1,57) 1.51 + 1.57 = 1.54 2 o Igual per a la resta de grups o Acabem tenint una nova matriu de distàncies del grup HC amb la resta El que ens permet fer aquesta mitja és anar agrupant grups en nodes, de manera que acabem d’agrupar H amb C.
En aquesta matriu de distàncies buscarem, altra vegada, els OTUs més propers entre ells (menys diferències). En l’exemple es tracta de HC-G, per tant, posem afegim G a l’arbre i repartim les diferències entre les branques.
Per saber el següent individu més emparentat hem de fer la matriu en que comparem HCG amb la resta o HCG - O: mitja de les diferències H-O, C-O i G-O 2.98 + 2.94 + 3.04 = 2.99 3 o Igual per la resta de grups o Acabem tenint una nova matriu de distàncies del grup HCG amb la resta   6   BI- Tema 2 En aquesta matriu busquem el valor més petit, que és HCG-O, de manera que afegim O a l’arbre.
Per saber la longitud de la branca de Reshus (en l’exemple), hem de tornar a fer una nova matriu on fem la mitja de les diferències HCGO - R.
(examen) - Neighbour -joining: també tenim una matriu de distàncies però assumim que l’arbre del qual partim està en estrella. A partir d’aquí anirem agrupant però al final també acabarem en un arbre en estrella. el punt de partida és un arbre estrella.
La formula per calcular la suma de les branques és la següent: On S: distància S12 : suma distància d’1-2 amb la resta d’OTUS N: nombre d’OTUs dij: distància entre seqüencia i i j   7   BI- Tema 2 Calculem la menor distància entre nodes i generem un nou node (X), que ajunta 1 amb 2, llavors calcularem la distància d’X a 1 i 2, i a la resta d’OTUs.
Partim de la matriu de distàncies que es mostra, amb les diferències entre els segments.
La matriu de distàncies la passem a una matriu on les distàncies les passem a una formula, a Q. Aquesta fórmula és la següent: On d: distància dab : distància entre a i b dak : suma distància d’a amb la resta d’OTUs dbk : suma distància d’b amb la resta d’OTUS N: nombre d’OTUs Primer, calculem les distàncies d’a, b, c, d i e a tots els altres.
Després calculem la diferència entre a i b (Qab) que és: 𝑄 = 5 − 2 5 − 31 − 34 = −50   8   BI- Tema 2 també calculem la diferència de tots els altres termes de la matriu Q així doncs podem obtenir la següent matriu: Una vegada tenim aquesta matriu, hem de mirar els OTUS més propers. La distància més petita és la més negativa. Per tant primer agruparem a i b i generem el nou node u.
A continuació, calculem la distància de u-a, u-b i u-a la resta amb la següent formula.
La distància de u-a és: 1 1 𝑑!" =   · 5 +   31 − 34 = 2 2 2(5 − 2) La distància u-b: 𝑑!" = 𝑑!" − 𝑑!" I la distància de u a la resta (u-k): Una vegada tenim la segona de distancies, hem d’aconseguir la matriu que es calcula amb la formula de Q. A partir dels seus resultats busquem els OTUs més propers (en aquest cas són: u-c i d-e)   9   BI- Tema 2 Agrupem els OTUs més propers. Podem agrupar un o altre abans o després i el resultat serà el mateix.
L’arbre que ens dona no té arrel (arbre desarrelat), per tant, li haurem de dir l’outgrup i girar l’arbre.
L’outgrup serà l’espècie més allunyada de totes (si fem humans-ratolí-ximpanzé, l’outgrup seria ratolí). L’outgrup el definim nosaltres.
El mètode Neighbor - Joining • Es basa en un criteri d’evolució mínima • La topologia real de l’arbre pot no coincidir ja que l’arbre es construeix pas a pas • Mètode basat en distancies que aconsegueix millors resultats (hi ha mètodes millors) • Computacionalment eficient • En comparació amb UPGMA: o No assumeix que totes les branques evolucionen a la mateixa taxa o Produeix un arbre desarrelat per defecte   FORMAT  NEWICK   Ara veurem el resultat que ens donarà qualsevol programa. Els programa ens dona un arbre en format Newick que només dona les distàncies que ha calculat entre cadascun dels OTUs. Llavors podem agrupar els OTUs segons on posem els parèntesi.
En l’exemple H-C estan agrupats, aquest grup amb G. Tot el grup H-C-G està grupat amb O. Finalment, el grup H-C-G-O s’agrupa amb R.
• •   El primer format Newick que apareix només ens diu els grups que estan més propers però no la longitud de les branques Hi ha un altre format newick on podem saber els grups més propers i la longitud de les branques.
10   BI- Tema 2 (full llibreta diapo 21, exemples) Diferents  filogènies  de  primats:   • • La filogènia tradicional de primats (basada només en dades morfològiques) donava el resultat que es presenta a l’esquerra.
La filogènia actual està feta amb dades morfològiques i moleculars i dóna el resultat que es presenta a la dreta.
Exemples:     Origen  del  virus  del  VIH:   A continuació es mostren dades del virus del Sida d’humans i primats d’Àfrica.
L’arbre que es mostra, s’ha elaborat a partir de l’alineament de seqüències.
Aquest estudi va permetre veure que el virus del sida en humans va provenir del ximpanzé. A més hi ha un altre virus del sida que ve del Mangabei fosc. Ambdós variants de virus van saltar a humans.
Cas  dental  del  dentista  de  Florida:  Infecció  per  VIH   Una persona va contraure el sida sense tenir cap factor de risc, tot i que s’havia sotmès a una tècnica invasiva. Es va comprovar que el dentista que el va tractar tenia el Sida. Es van estudiar unes quantes persones i mitjançant la seqüencia de la proteïna del sida es va fer un estudi molecular amb pacients que tenien diferents factors de risc i la variació intra-persona també era diferent.
Es va veure que el dentista havia infectat als pacients que no tenien factors de risc.
Però els pacients que tenien factors de risc no, s’havien infectat per altres vies.
  11   BI- Tema 2 Són  els  neandertals  uns  dels  nostres?   Fer reconstruccions filogenètiques ens serveix per saber la nostra història. En l’estudi que es mostra, es va estudiar el parentiu amb els Neandertals, estudiant la variació a nivell mitocondrial. El que es va observar és que la variació d’humans amb neandertals és major.
En el següent estudi es van seqüenciar diferents persones de diferents regions, i a través de seqüències de neandertal es va estudiar les diferencies.
• • • • La primera hipòtesi suggereix que hi va haver transmissió de gens d’una espècie d’humans (H.erectus) amb els neandertals. Tot i això, aquesta hipòtesi no s’ha pogut demostrar. Si hi hagués hagut un flux gènic entre neandertals i humans, aquests haguessin acumulat algun tros de seqüencia d’humans (homo erectus) i per tant al comparar neandertal-humans, hi hauria una regió que hauria divergit molt més. Però amb aquestes dades no s’ha detectat cap cas d’aquests La segona hipòtesi és que els últims neandertals transmetessin informació als humans europeus. Però aquesta hipòtesi tampoc es va poder observar ja que no es detecta variació amb seqüències d’humans de fora d’Àfrica La tercera hipòtesi es que hi va haver flux entre els neandertals i els humans fora d’Àfrica, els resultats sí que confirmen aquesta hipòtesi.
La quarta hipòtesi es que la població humana té una subestructura, acumula diferències i comparteix algunes seqüències amb neandertals. Les dades no exclouen aquest hipòtesi, per tant no es descarta.
Els  neandertals  podien  parlar  com  nosaltres?   El gen FOXP2 està relacionat amb la parla.
En humans hi ha dues mutacions clau en el gen que son les que ens permeten la parla. En els neandertals es va veure que també hi havia aquestes mutacions de manera que es possible que siguéssin capaços de parlar.
De  quin  color  tenien  els  cabells?   Es va estudiar el gen del receptor de la melanocortina 1, MC1R. En el neandertal es va veure que hi havia unes mutacions diferents que en humans, que provocaven que s’expressés menys, de manera que això comporta que hi hagués menys varietat en el color, però generalment era de color pèl-roigs.
  12   ...