Seqüències nucleotídiques- Tema 2 (2014)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 3º curso
Asignatura Bioinformática
Año del apunte 2014
Páginas 10
Fecha de subida 18/02/2015
Descargas 2
Subido por

Vista previa del texto

BI-­‐  Tema  2   TEMA  2:  BASES  DE  DADES  BIBLIOGRÀFIQUES     Cerques  lògiques:   Les  bases  de  dades,  ens  permeten  fer  cerques  sobre  la  informació  que  volem  obtenir,  les  cerques  les   podem   fer   per   paraules   o   frases   mitjançant   els   operadors   lògics   o   estratègies   booleanes,   descrits   per   George  Boole.     Alguns  dels  operadors  booleans  són  els  següents:     -­‐ AND:   indica   els   dos   termes   es   troben   en   el   registre.   (Ex/   Virulence   AND   Bacteria   –   l’article   ha   de   contenir   aquests   dos   termes)   -­‐ OR:  indica  que  un  o  altre  terme  es  troba  dins  el  mateix  registre,   el   mateix   article.   (Ex/   Virulence   OR   Bacteria   –   l’article   ha   de   contenir  un  o  altre  terme)   -­‐ NOT:  indica  que  en  l’article  es  troba  un  registre  i  no  l’altre  (Ex/   Virulence  AND  Bacteria  –  l’article  no  ha  de  contenir  aquests  dos   termes)   -­‐ Comodins:   o *  :    Serveix  per  buscar  un  arxiu  que  contingui  el  terme  que  s’indica.    Per  exemple,  amb   l’arrel  “regulat”  trobarem:  regulatory,  regulation,  regulator,  regulators…   o ?   o $   -­‐ “”:  serveixen  per  buscar  una  frase.  Per  buscar-­‐la,  hem  d’incloure  els  nostres  termes  entre  les   cometes  (  Ex/  “virulent  bacteria”  –  ha  de  contenir  aquests  dos  termes  junts  i  en  aquest  ordre)   -­‐ ():   indica  a   PubMed   que   el   que   és  més  important,  per  tant   és  el  primer  que  es  busca  i  després   es  busca  la  resta.       El  metacercador  de   PubMed   utilitza  aquests  operadors  booleans  en  una  preferència  estipulada.   El   cercador   llegeix   d’esquerra   a   dreta,   de   manera   que   els   operadors   més   importants   són   els   de   l’esquerra.  Això  però,  si  posem  parèntesi  canvia.       Hi  ha  metacercadors  que  usen  altres  operadors   booleans   que  et  permeten  fer   cerques  mes  fines.  Però   alguns  són  de  pagament.     Altres  proveïdors,  la  majoria  de  pagament  permeten  construir  una  frase  on  el  primer  element  es  busca   primer  i  després  el  segon.                 1     BI-­‐  Tema  2   Un   d’aquests   metacercadors   de   pagament   és   ScienceDirect.   A   continuació   es   mostren   alguns   dels   operadors  booleans  que  utilitza:         MedLine,  PubMed  i  PubMedCentral:     -­‐ PubMed  (PM):   és   el   motor   de   cerca,   la   interfície   gràfica   que   conté   registres   indexats   d’una   base  de  dades  mantinguda  per  l’NCBI.     Els  articles  que  podem  trobar  al  PubMed  contenen:  el  títol,  abstract,  autors  i  la  seva  afiliació.     o Gairebé   tot   el   que   ens   interessa   referent   a   l’àmbit   “bio”   es   troba   a   PubMed.   Això   és   gràcies  a  que  es  comunica  amb  MedLine.     o PubMed  es  manté  a  través  de  l’NCBI.     PubMed   conté,   a   més   dels   articles   de   MedLine,   articles   que   encara   no   han   estat   inclosos   al   MedLine   però   que   l’editorial   X   ja   ha   acceptat   per   a   ser   publicats   (és   a   dir,   encara   no   han   aparegut   en  revistes).  Una  vegada  ja  s’hagi  publicat,  apareixerà  en  el  MedLine.   Des  del  PubMed  puc  seleccionar  els  treballs  de  text  complet  i  de  forma  lliure,  en  aquest  moment   ens   porta   al   PubMedCentral.   Així,   ens   apareixeran   el   nombre   de   treballs   que   hi   ha   d’aquest   tipus.   Igual  per  a  les  revisions  bibliogràfiques.  També  podem  posar  límits  de  dates.       -­‐ MedLine  (ML):   és     la   base   de   dades   bibliogràfica   de   la   National   Library   of   Medicine   on   es   troben  totes  les  publicacions.     o MedLine  s’alimenta  del  què  l’empresa  editorial  li  dóna.  I  és  mantinguda  per  la  NLM.       -­‐ PubMedCentral   (PMC):   subbase   de   dades   de   PubMed   que   conté   text   complet   (conté   el   cos   dels  treballs)  d’alguns  dels  articles  del  PubMed.   2     BI-­‐  Tema  2   Quina  és  la  diferència  entre  MedLine  i  Pubmed?   -­‐ PubMed:   o Cerca   sobre   5.500   revistes   i   en   23.580.682   registres.   Per   tant,   el   PM   conté  més  registres  que  el  ML.   o Cerca   no   sols   en   format   digital,   sinó   també   del   OldMedLine   (que   digitalitza   articles  dels  anys  40).     o L’avantatge   de   cercar   en   PubMed   és   que   les   cerves   cerques   fetes   a   través   del   portal   del   NCBI,   ens   dona   accés   a   altres   registres   relacionats   amb   el   registre   que   ens   interessa.   Per   tant   relaciona   una   registre  amb  altres  registres  que  hi  puguin   haver  en  altres  bases  de  dades.     o Els   registres   equivalents   al   PubMed   que   es   veuen   en   un   entorn   gràfic   (hipertext)   ,   estan  extrets  de  la  base  de  dades  del  MedLine,  on  els  registres  no  estan  en  hipertext   (sinó   com   un   arxiu   pla   que   conté   tots   els   camps).   És   a   dir,   el   que   canvi   es   el   format   (hipertext  o  no).   -­‐ MedLine:   o Conté  uns    menys  registres  que  el  PubMed.     o Els  registres  no  estan  en  hipertext.     Entorn  gràfic  d’un  registre  de  PubMed    (hipertext)     3     BI-­‐  Tema  2   Vista  d’un  registre  a  MedLine  (no  hipertext).  S’observen  els  camps  en  un  altre  format.       Tags   La  informació  de  la  base  de  dades  està  estructurada  en  una  sèrie  de  camps  (tags),  amb  uns  continguts   concrets   i   que   s’identifiquen   amb   una   etiqueta.   Així   doncs,   cada   registre   conté   una   sèrie   de   camps   i   cada  camp  conté  una  informació  concreta.     Els  tags,  que  els  han  predefinit  els  que  mantenen  la  base  de  dades  i  permeten  concentrar  la  cerca  en   un  camp  concret  (per  exemple,  cercar  un  terme  concret  en  un  camp  concret).     4     BI-­‐  Tema  2       Medical  Subject  Headings  (MeSH)   Moltes  vegades  la  cerca  la  fem  en  termes  sense  preveure  que  el  terme  pot  tenir  sinònims  o  pot  estar   relacionat  amb  altres  termes  que  ens  interessen  però  que  no  estem  buscant.    Per  tant  estem  obviant   dades.   Si   quan   fem   una   cerca   no   escrivim   aquesta   keyword   desconeguda   per   nosaltres,   el   cercador   no   ens  la  buscarà.  Si  volem  fer  una  cerca  que  contingui  tota  la  informació  relacionada  amb  dos  termes,   hem  d’escriure  els  dos  termes.   Per  a  solucionar  això,  s’ha  creat  una  mena  de  diccionari  (MeSH):   -­‐ Controla   el   vocabulari   que   emmagatzema:   Conté   jerarquitzats   els   termes   que   es   troben   relacionats  entre  ells.   -­‐ Garanteix  una  correcta  indexació  dels  documents.       -­‐ Facilita  les  serques  a  l’estendre  els  termes  a  tots  els  relacionats.  Gràcies  al  jerarquització  del   seu   vocabulari   permet   relacionat   el   nombre   terme   que   hem   buscat   a   altres   articles   que   contenen  termes  relacionats  amb  el  nostre.  Per  exemple,  si  escrivim  “virulència”,  el  terme  es   llença   en   una   base   de   dades   buscant   aquest   camp   en   el   diccionari   en   funció   dels   que   està   relacionat.  Així  doncs,  la  cerca  ens  donarà  els  articles  relacionats  amb  virulència  i  els  articles   relacionats   amb   el   camp   virulència   (com   els   que   per   exemple,   continguin   patogeneïcitat).   Això   està   bé,   però   pot   generar   molt   soroll   de   fons   (podem   trobar   molts   articles   que   no   ens   interessen).     Ex/   He   buscat   virulència   al   PubMed,   i   aquest,   per   defecte,   me   l’ha   traduït   a   altres   termes  separats  per  l’operador  OR  (com  patogeneïcitat)     En   el   cas   que   no   volgués   buscar   per   defecte     un   dels   termes   relacionats   amb   el   nostre   (com   “patogènesi”),  li  hauria  d’indicar  al  programari,  però  sinó,  ens  donarà  una  cerca  estesa.       -­‐ Per   fer   una   cerca   on   només   ens   busqui   un   terme   (com   “virulència”),   hauré   de   posar   entre   cometes,  “”,  el  terme  que  vull  cercar  (amb  això  evitaré  que  es  faci  una  cerca  estesa).       5     BI-­‐  Tema  2   -­‐ MeSH,   també   ens   permet   buscar   per   termes   relacionats,   en   un   camp   concret,   posant   [].   Però   si  no  li  posem  ens  relaciona  el  terme  amb  altres  termes  amb  camps  concrets.       6     BI-­‐  Tema  2   Cerca  exhaustiva  en  el  “cos”  de  les  publicacions   La  cerca  però,  també  la  podem  fer  sobre  el  text  complet.  Així  doncs,  la  cerca,  en  comptes  de  fer-­‐la  a   través   del   PubMed,   l’haurem   de   ser   sobre   el   PubMedCentral.   En   aquest   cas,   però,   estem   llençant   la  cerca  sobre  menys  nombre  d’articles  que  en  el  PubMed  (24  milions  d’articles  enfront  de  3  milions   al  PMC).     Els  articles  amb  text  complet  poden  estar  disponibles  ja  que  les  editorials  permeten  a  l’NCBI  que  els   guardi.     En  el  PubMedCentral,  també  podem  buscar  un  terme  en  els  peus  de  figures.         Hi  ha  molts  altres  cercadors  de  material  bibliogràfic:   -­‐ Europe  PubMed  Central:  És  una  versió  europea  del  PMC.  Llencem   consultes  sobre  els  mateixos  continguts  però  no  sobre  la  mateixa   base  de  dades  (no  és  el  mateix  motor  de  cerca  que  el  PMC).       -­‐ Google  Acadèmic     -­‐ -­‐ -­‐     BioMed   Central:   es   una   iniciativa   editorial   de   publicacions   obertes   (accés  lliure)  on  cada  cop  hi  ha  mes  nombre  de  revistes.     Elsevier:   Companyia   distribuïdora   de   material   bibliogràfic   científic.   Tenen   un   metacercador   molt   concret   (Science   Direct)   i   tècniques   d’anàlisi  de  qualitat  de  la  informació  (Scopus)  pròpies.       Scirus:  especialitzada  en  la  cerca  de  material  web       7     BI-­‐  Tema  2     BIBLIOMETRIA   La   bibliometria   es  una  part  de  la  cienciometria  que  aplica  mètodes  matemàtics  i  estadístics  a  tota   la   literatura   de   caràcter   científic   i   als   autors   que   la   produeixen,   amb   l’objectiu   d’estudiar   i   analitzar   l’activitat   científica.   Ens   permet   mesurar   l’impacte   d’una   publicació,   universitat...   a   través   d’índexs   d’impacte     Índex  d’impacte(IF)   L’impacte   d’una   publicació   es   mesura   a   través   de   l’índex   d’impacte,   tot   fent   un   anàlisi   quantitatiu  de  la  producció  científica  (nombre  d’articles  que  ha  fet  un  autor,  vegades  que  ha  estat  citat   un  article...).       -­‐ L’impacte   d’un   article   es   calcula     a   partir   del   nombre   de   citacions.   A   major   nombre   de   citacions,  més  qualitat  (impacte).     -­‐ L’impacte  d’un  article  publicat  recentment  es  calcula  diferent.  Pot  ser  que  un  article  sigui  molt   nou  i  no  hagi  pogut  estar  citat  gaires  vegades.  En  aquest  cas  mesurem  l’impacte  de  la  revista   on   s’ha   publicat   (IF,   impact   factor).   Si   s’ha   publicat   recentment   en   una   revista   de   gran   impacte,  podem  pensar  que  és  un  bon  article.     o El   que   determinarà   que   la   revista   estigui   en   una   posició   en   un   rànking   serà   un   valor   que  tindrà  en  compte:   § B:  El  nombre  de  treballs  publicats  en  aquesta  revista  (B)   § A:  El  nombre  de  cops  que  la  revista  apareix  citada  en  altres  articles  (A).   § Així  doncs,  l’IF  de  la  revista,  l’índex  d’impacte  de  la  revista  serà:       I=A/B     § A   més,   per   mesurar   aquest   impacte   de   l’article   nou   a   través   de   la   revista,   podem  posar  un  període  de  temps   A   la   revista   li   interessa   publicar   pocs   treballs   i   que   la   citin   moltes   vegades   (publicar   pocs   treballs  molt  bons,  de  manera  que  els  citin  moltes  vegades,  així  tenen  un  IF  molt  elevat).       En   l’IF   sempre   hi   ha   un   desplaçament   d’aproximadament   dos   anys.   Per   exemple,   ara   en   el   2013   ha   sortit  el  que  correspondria  al  2011-­‐2012       Índex  H   Es  pot  utilitzar  un  altre  indicador,  l’index  H:  que  ens  permet  mesurar  l’impacte  d’un  autor.  I  és  el     nombre  de  vegades  que  un  article  s’ha  citat  tenint  en  compte  autor,  centre...         8     BI-­‐  Tema  2     Per  obtenir  l’índex  H:   -­‐ Ordenem   els   treballs   en   funció   del   nombre   de   citacions   dels   treballs   (el   numero   1   és   el   que   n’ha   rebut   més).   L’índex   H   d’un   autor   és   el   nombre   d’articles   (h)   que   almenys   han   rebut   h   citacions.       L’índex  H:   -­‐ Quantifica  tant  la  producció  científica  en  revistes  i  l’impacte  científic.     -­‐ Es  pot  aplicar  a  científics,  països...   -­‐ Millor  es  una  autor  com  major  sigui  el  seu  índex  H.     Aquest  índex  el  calcularem  a  través  d’un  proveïdor,  els  journal  citation  reports  que  prové  de  la  Web   of   Knowledge.   Tot   i   que   no   és   l’únic   (però   si   el   més   utilitzat),   però   si   el   més   utilitzat.   Hi   ha   altres   proveïdors  que  publiquen  els  seus  propis  índex  o  mètodes  d’anàlisi  bibliogràfic,  com  Scopus.         Així  dons  tenim  3  maneres  de  mesurar  l’impacte,  a  través  de;   -­‐ -­‐ -­‐ Nombre  de  citacions   Índex  d’impacte  d’una  revista   Índex  H     Anàlisi  bibliomètric  d’una  revista   -­‐ Es   pot   fer   una   ordenació   de   les   revistes   segons   el   seu   impacte   o   bé   es   pot   fer   alternativament   fixant-­‐nos   en   quin   quartil   es   situa   la   nostra   revista   (mirar   si   està   entre   les   25   primeres).       9     BI-­‐  Tema  2     GESTORS  DE  REFERÈNCIES:     Hi  ha  molt  programari  que  ens  pot  ajudar  en  la  gestió  d’un  document,  les  nostres  referències.  Alguns   programes  son  de  pagament  i  els  altres  d’accés  lliure.       Els  gestors  de  referències  més  coneguts  són:   -­‐ Endnote   -­‐ RefWorks   è  Ambdós  són  de  pagament     Altres  versions  lliures  o  semilliures  són:   -­‐ Mendeley     -­‐ Zotero     10     ...