9) Tema 5 (2012)

Apunte Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Bioquímica y Biología Molecular - 2º curso
Asignatura Bioinformática
Año del apunte 2012
Páginas 4
Fecha de subida 18/01/2015
Descargas 13
Subido por

Vista previa del texto

Tema 5 17.05.12 Veurem com alinear més de dues seqüències. També parlarem dels arbres filogenètics.
L’objectiu d’un multialineament és obtenir l’alineament de múltiples proteïnes. Per a què ens pot servir? Primer de tot, fa referència a la utilitat d’un BLAST, buscar seqüències similars a les bases de dades. Si tenim una proteïna que es similar a una familia de proteïnes amb aquella que tenim, la funcionalitat pot ser la mateixa.
Si fem un Blast d’una seq que em obtingut al laboratori i ens dona tota una serie de serinproteases podem deduir que tindrà les mateixes caracteristiques. Sabem que els aas catalitics de les serin proteases son uns determinats, doncs comprovarem si te els mateixos aas, o similars i el domini catalitic al mateix lloc. Això ho podem veure en un alineament.
Pattern identification: hi ha bases de dades de motius conservats que estan conservats en families de proteïnes.
Una altra utilitat és la construccio d’un arbre filogenetic.
Tenim un grup de serin proteases determinades, que tenen el lloc actiu amb una serina sempre al domini catalític.
Trobar semblances per casualitat en nucleotids iguals es miolt mes facil que no pas en proteïnes. És molt més senzill fer alineaments múltiples de proteïnes que de nucleòtids. Per a fer un alineament multiple necessitem un minim de 3 sequencies, pero el limit no es conegut. S’aconsella començar per unes 10-15 sequencies. S’aconsella no fer servir fragments.
Diapo següent: 9 Només hauriem d’alinear seqüències que són homòlogues o que s’assemblin. Si tu li dones dues seqüències que no es poden alinear, igualment les alinearà, et donarà un resultat.
Hauriem d’asegurarnos i veure que les seqüències tenen homologia de seqüència, per estar segurs les hem de comparar, una manera de fer-ho és fer servir el resultat d’un BLAST. Si fem un BLAST.
A partir d’una seqüència fem un blast de tota les seqüències d’altres espècies que s’assemblen, aquelles seqüències que trobem al blast són les que alineem. Com fariem per alinear un arbre filogenètic, faria un blast, asseguraria que tingués seqüències homòlogues i seguiria els passos amb la base de dades.
Diapo següent. 10 Fiquem el llistat i amb un click tenim l’alineament de 150 vegades.
Diapo 11: Fer un alineament optim com feiem en paper, només es pot per a dues seqüències, hi ha un programa que t’ho fa.
D:12 Programes d’autoalineament.
Primer et fa una matriu Alinear per parelles totes les combinacions posibles que tenim de dos en dos. I calculem el % de similitud i podem construir la matriu.
Quan anem alineant van canviant el %.
Volem saber les proteïnes que s’assemblen més, 39. Les agafem i les alineem. Un cop alineades, busquem les dues seqüències següents que s’assemblen més, seria el 32.9. Anem afegint seqüències amb autoalineament.
Anem construint fins que tenim tota las sequència.
Using Clustal Fa alineaments múltiples, es pot utilitzar des de el firefox o l’explorer, o també es pot fer servi. Executem el programa remotament i el resultat es el multialineament.
ClustalW Es un programa que ens permet una mica més de control que d’anterior. Una versió no grafica que s’obre un terminal i li dones comandos.
ClustalX Existeix el ClustalX que té gràfics, és un tipus de programa dels que estem més acostumats.
Turning Your MSA into a LOGO Graph Si en una posició de l’alineament sempre hi ha una histidina, sempre hi haurà una H gegant. L’alineament d’on prové aquest logo sempre hi ha una Histidina. Si hi ha una columna que no té res, es perque pot dindre més d’una cosa.
Sintaxis de expresions regulares {G}= qualsevol menos la G [AT]= una seqüència concreta que ens mostra abaix.
Sintaxis de expresions .. elementos repetidos X(2-4) = qualsevol aminoàcid entre dos i quatre.
Prosite database (Diapo 23) Exemple d’una fitxa del prosite Consensus patterm: És útil perquè si nosaltres sequenciem una protien en el laboratori, podrem mirar si la seqüència conté aquest prosite, i així podrem dir que pertany a aquesta familia.
Sequencees known to ...: Si nosaltres tenim una protiena que té aquest prosite podem dir que forma part d’aquesta familia. Auest prosite només és la zona de l’alinement, però només et busca aminoàcis conservats (per exemple catalítics). Si canviem alguna d’aquestes la proteïna no tindrà la funció que té.
No tots els prosites estan associats a funció, hi ha alguns associats a motius de glicosilació.
Podem fer dos coses: Donat un codi d’un prosite, buscar la informació d’aquell motiu conservat.
Vemiem la informació que veiem a la diapsotiva.
Dintre tenim un link que ens ensenya els codis de l’uniprot que tenen aquest prosite.
Segona cosa Scan prosite: i podem ficar una seqüència o un codi i ens diran quins prosites de la base de dades coincideixen amb la seqüència.
TEMA NOU: ABRES FILOGENÈTICS Es construeixen a partir de seqüències de proteiens de DNA. Si dues espeècies tenen la mateixa seqüència vol dir que hi ha hagut una divergència entre aquestes espècies.
Darwin va escriure la primra seqüència.
Quina seqüència s’utilitzen per fer arbres filogenètics, doncs sequèncie smolt conservades com el RNA ribosòmic.
L’RNA ribosòmic té menys mutacions que altres proteïnes. Aquesta seria una bona molècula per fer aquestos arbres.
Case Study: Florida Dentist case 1990 Un cas real: El dentista tenia el virus i tallava amb un instrument als pacients, i els traspasava el sida. Com podem saber-ho, doncs agafem mostres del dentista i dels pacients, sequenciem algun tros del virus, el mateix per a tots, i comparem. Com que la seqüència del virus varis perquè es un retrovirus, igualment hauria semblança. Com a resultat veiem que tots són una agrupació i tots pertanyen al cas.
Mapa mundi: Va haver una serie de migracions, desde africa cap a europa, asia, america... aquestes hipòtesis les sabem mirant la variació genètica dels diferents individus.
Un abre filogenètic parlem de fulles, branques, i parlem d’arrel.
L’ancestre comú a totes les espècies és l’arrel. Els nodes representen ancestres comuns, per exemple el ratolí i l’home.
Pylogenetic tree Un exemple d’un abre, es pot mirar de dreta a esquerra o al inrevés.
The topology Al exemple de dalt, la longitud de les branques no ens informa de res, és com si estigués justificat, i quan relacionem dos, les relacionem a la mateixa alçada. Aquest tipus de represntació parlem d’agrupacions A la representació de sota: hi ha branques més llargues i branques més curtes. Ens informen de la semblança, com més semblança més curtes seran les branques.
La longitud de les branques, en aquest cas, és informativa.
The topology Hi ha uns exemples d’arbres que hem d’interpretar que són iguals. Segons si els mirem per darrere o els girem, són iguals. Hi ha un ancestre a tots, A, B i C divergeixen sequencialment.
Representacions diferents del mateix arbre: Més exemples.
Trees with and wiout root 1) tenim un abre de tres fulles sense arrel. Té tres arbres possibles en funció d’on posem l’arrel 1.1) Si posem l’arrel a la C, vol dir que hi ha un ancestre comú, primer es diferència c, després A i B.
1.2) Divergeix primer B, hi ha una ancestre comú en A i B que divergeix en A i C.
1.3) Si posem l’arrel a la A, primer divergeix A, hi ha un ancestre comú en B i C, i després divergeixen.
En funció d’on posem l’arrel la història evolutiva canvia.
Trees with and without root (per practicar) Si posem l’arrel en diferents llocs van canviant els resultats.
1) L’arrel al 1, vol dir que el que divergeix és H, anem avançant, C divergeix, anem avançant...
A partir de la comparació de seqüències: A partir de l’alineament podem tenir una matriu (matriu de distància, de semblances).
...