Seqüències nucleotídiques- Tema 6 (2014)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 3º curso
Asignatura Bioinformática
Año del apunte 2014
Páginas 3
Fecha de subida 18/02/2015
Descargas 2
Subido por

Vista previa del texto

BI-­‐Tema  6     Tema  6.  Alineament  múltiple     L’alineament  múltiple  comença  en  el  moment  que  tenim  una  tercera  seqüencia.  El   nostre  objectiu  serà  formar  una  taula  amb  n  seqüències  i  buscarem  els  llocs  iguals.   Per  a  l’alineament  múltiple  utilitzarem  la  programació  dinàmica,  que,  com  que  es   comparen  totes  les  seqüències  alhora,  per  3  seqüències  s’ha  de  tenir  3  dimensions.  A   continuació  es  computa  totes  les  comparacions  i  finalment  trobem  el  millor  camí   que  ens  indiqui  el  millor  alineament.    Però  hi  ha  un  problema  afegit  en  utilitzar  la   programació  dinàmica,  i  es  que  amb  programació  dinàmica  el  nombre  de   comparacions  incrementa  exponencialment  (depèn  del  nombre  de  seqüències  que   tenim)  i  el  temps,  també  incrementa  molt  ràpid  com  més  seqüències  tenim.     Alineament  progressiu:     Fonaments   Per  tant  hem  de  desenvolupar  un  mètode  que  ens  permeti  fer  tantes  comparacions   amb  menys  temps,  usarem  un  MÈTODE  D’ALINEAMENT  PROGRESSIU,  que  es  basa   en  comparar  les  seqüències  per  parelles  i  addicionar  a  aquest  alineament  les  altres   seqüències  progressivament.       Matrius  de  distància   Per  seleccionar  l’ordre  amb  el  qual  alinearem  les   seqüències,  elaborarem  una  matriu  de  distàncies  entre  cada   parella  de  seqüències.  La  matriu  de  distàncies,  en   bioinformàtica,  es  una  matriu  que  representa  les  distàncies   entre  cadascun  dels  parells  de  seqüències  que  es  volen   comparar.  A  partir  d’aquesta  dibuixarem  un  arbre  (arbre   guia)  que  ens  dirà  quines  seqüències  son  més  properes.   L’arbre  servirà  com  a  base  per  construir  l’alineament  múltiple.     1   BI-­‐Tema  6         Ex/  Unweighted  Pair  Group  Method  with  Arithmetic  Mean  (UPGMA)   L’arbre  ens  diu  que  la  seqüencia  C  és  propera  a  A  i  B,  que  la  resultant   d’aquestes  tres  a  D  i  E  i  que  la  resultant  de  totes  questes  a  F.           L’arbre  ens  servirà  llavors,  per  alinear  les  seqüències  més  properes  entre  elles   (Neighbor  joining)  i  trobar-­‐ne  una  seqüencia  consens  en  aquest  moment  si  que   utilitzarem  PROGRAMACIÓ  DINÀMICA.       En  l’exemple  que  hem  vist  primer  aparellarem  A  i  B  i  obtenim  una  seqüencia   consens,  llavors  com  que  C  es  la  més  propera  a  A  i  B,  comparem  la  seqüencia   consens  d’A  i  B  amb  la  C.  Independentment,  compararem  D  i  E  i  obtenim  una   seqüencia  consens  que  la  comparem  amb  la  que  hem  obtingut  de  la  comparació  de   A-­‐B  i  C.  Llavors  aquesta  seqüencia  la  compararem  amb  la  F.       Per  tant  es  va  aplicant  programació  dinàmica  pas  a  pas.    I  l’ordre  de  com  es  fa  ens   l’indica  l’arbre         2   BI-­‐Tema  6     Aquest  mètode  és  una  aproximació,  s’arriba  a  un  alineament  dels  millors  que   podem  obtenir,  però  té  problemes,  en  el  moment  que  obtenim  una  seqüencia   consens,  per  obtenir-­‐la  haurem  d’introduir  gaps.  En    els  mètodes  d’alineament   progressiu,  un  cop  introdueixo  un  gap  no  el  puc  modificar,  el  que  significa  que  no   ens  podem  equivocar,  i  l’hem  de  mantenir  fins  al  final.  Sempre  puc  introduir  nous   gaps  però  mai  canviar  els  ja  introduïts.     Tot  i  aquest  problema,  aquest  mètode  es  una  bona  aproximació.           El  programari  es  pot  executar  a  través  de  diferents  llocs.         Aplicacions  de  l’alineament  múltiple:   -­‐ -­‐ -­‐ -­‐ -­‐ -­‐ -­‐ -­‐ -­‐   Identificació  de  llocs  conservats  o  semi-­‐conservats     Detecció  de  motius  o  regions  conservades  amb  una  funció  comuna.  (així  podem   detectar  dominis)   Identificació  de  llocs  variables  dins  de  seqüències  conservades   Construcció  de  matrius  de  posició  o  pes  (Position  Weight  Matrices)  i  LOGOS  per   identificar  motius  en  altres  seqüències   Identificació  de  motius  proteics   Estructura  secundària  del  RNA   Establir  relacions  filogenètiques   Predicció  de  l’estructura   Detectar  regions  de  variabilitat  relacionades  amb  l’estructura   (fotos  i  exemples  a  les  diapositives)   3   ...