Tema 8. Filogènia molecular (2015)

Apunte Catalán
Universidad Universidad Pompeu Fabra (UPF)
Grado Medicina - 2º curso
Asignatura Evolució humana i salut
Año del apunte 2015
Páginas 4
Fecha de subida 04/02/2015
Descargas 4
Subido por

Vista previa del texto

Tema 8. Filogènia molecular 1. TERMINOLOGIA I TIPUS DE DADES La filogènia molecular és l’estudi de les relacions evolutives entre espècies o poblacions o entre regions del genoma a partir de dades moleculars. L’estudi del component genètic en lloc del fenotípic presenta avantatges com les entitats heretables, la descripció sense ambigüitats, el possible tractament numèric i amb models teòrics, el fàcil reconeixement d’homologies i la possibilitat d’estudiar des de petites diferències a tot l’arbre de la vida.
Alguna nomenclatura important en l’arbre filogènic és:  Node Punt de ramificació  Topologia Patrons de ramificació de l’arbre  Branca Defineix la relació entre taxons o individus pel que fa a descendència i ancestres  Longitud de branca En arbres escalats representa el nombre de canvis que han tingut lloc a una branca. Pot ser o no proporcional al temps.
 Arrel El putatiu ancestre comú de tots els taxons de l’arbre  Clada Grup de dos o més taxons o individus que inclou un ancestre comú i tots els seus descendents.
 Operational Taxonomic Unit (OTU) Nivell taxonòmic de mostratge seleccionat per ser usat en un estudi. Poden ser individus, espècies, poblacions, gèneres i fins i tot soques bacterianes.
En l’estudi dels arbres filogenètics es mirarà la topologia (proximitat entre OTUS) i la longitud de les branques (quantitat de diferència). Hi ha moltes maneres de dibuixar un arbre i es poden classificar en funció de si estan escalats i si estan arrelats.
Per la representació dels arbres s’utilitza el format de Newick.
En aquest cas A i B formen una clada (A,B). Aquests s’ajunten amb C formant una segona clada, per això ((A,B),C); i finalment aquests s’ajunten amb D (((A,B),C,D).
La longitud de cada branca podria escriure’s després de la lletra, separada amb dos punts. (((A:longA, B:longB), C:longC), D:longD).
33 Per l’exemple següent escriuríem: ((A:2.5, B:1.1):1.0,(C:2.0, D:0,8), 1.1, (E:1,2,F:2,4):1.0).
2. MÈTODES DE RECONSTRUCCIÓ D’ARBRES FILOGENÈTICS Per la reconstrucció d’arbres filogenètics podem utilitzar mètodes basats en distàncies genètiques: - UMGMA Unweighted Pair Group with Arithmetic Mean) - Neighbor-Joining - Fitch & Margoliash O basats en l’estat del caràcter: - Màxima parsimònia - Màxima versemblança (Maximum Likelihood) En el mètode UPGMA (Unweighted Pair Group Method with Arithmetic Mean) s’elabora una matriu de distàncies i es fan agrupaments seqüencials de taxa dos a dos.
El mètode Neighbor-Joining és més exacte perquè no assumeix que les taxes al llarg de les branques són iguals. Es comença també amb una matriu de distàncies i es busca l’arbre que té la longitud de branques més curtes, és a dir, es fa una aproximació a la mínima evolució.
S’utilitzen les fórmules: Arbres basats en l’estat de caràcter 34 L’arbre de màxima parsimònia és una aproximació a la mínima evolució i accepta l’arbre amb el menor nombre de canvis. Construeix totes les topologies possibles i determina quina implica el menys variacions.
Les diferents posicions es classificaran en variants i no variants i, entre les variants, en informatives o no informatives. Interessaran únicament les posicions variants informatives. Es compta el nombre de canvis necessaris per explicar cada arbre i es tria l’arbre que minimitzi el número de canvis. S’observa que el nombre d’arbres possibles creix enormement amb el nombre de taxons.
1.
2.
3.
4.
Construcció de totes les tipologies possibles Determinació de posicions: variants vs no variants; informatives vs no informatives Comptar el nombre de canvis necessaris per explicar cada arbre Triar l’arbre que minimitzi el nombre de canvis Posició variant 2: No informativa Posició variant 5: Informativa Posició variant 7: Informativa Posició variant 9: Informativa Per construir l’arbre de màxima versemblança es construeixen totes les topologies possibles, es calcula la probabilitat de cada arbre donades les seqüències (per suma de la probabilitat de cada branca) i es tria l’arbre de màxima probabilitat.
3. ARREL DE L’ARBRE : OUTGROUP I MIDPOINT 35 L’arrel d’un arbre indica quin es l’ancestre comú dels taxons representats. Un arbre arrelat aportarà sempre més informació que un arbre no arrelat.
En un arbre no arrelat, en funció d’on posem l’arrel obtindrem posicions evolutives diferents.
Per determinar l’arrel d’un arbre pot utilitzar-se un o més grups externs anomenats outgroups.
Un outgroup ha de ser un taxó més llunyà a la resta de taxons de l’arbre (ingroups) que no pas aquest entre si, però que a la vegada sigui tant proper com sigui possible. A priori es desconeix quin és el millor outgrup, per això es poden emprar diferents grups externs.
Una altra manera de determinar l’arrel és calcular el midpoint de la branca més llarga. Amb això s’assumeix una taxa d’evolució constant i que la branca més llarga és de les seqüències de divergència anterior.
4. ROBUSTESA D’UN ARBRE : BOOTSTRAP I ARBRE CONSENS El bootstrap d’un arbre dóna una idea de com de probable seria una branca si fossin accessibles més dades amb la mateixa distribució de variació i permet interpretar la robustesa de cada branca.
5. APLICACIONS DE LES FILOGÈNIES - Biòlegs evolutius en l’estudi de l’arbre de la vida Biòlegs sistemàtics en la classificació dels organismes Antropòlegs en l’estudi de l’origen de les poblacions humanes Parasitòlegs en l’estudi de la coevolució paràsit-presa Epidemiòlegs en l’estudi de la transmissió de malalties Genòmics i proteòmics en l’estudi de l’homologia de nous gens Forenses en l’estudi de la transmissió del VIH a una víctima de violació 36 ...