3) bases de dades de seqüències (2012)

Apunte Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Bioquímica y Biología Molecular - 2º curso
Asignatura Bioinformática
Año del apunte 2012
Páginas 4
Fecha de subida 18/01/2015
Descargas 15
Subido por

Vista previa del texto

19.04.2012 Treball bioinformàtica: Triar un tema, necessitem 25-30 referències bibliogràfiques i es valorarà com les has trobat, perquè les has escollit...
Valorarà: - índex d’impacte - fer estadística amb el GoPubMed (és unt ema actual o recent...)  impact factor, trend graph...
- que utilitzem termes Mesh BASES DE DADES DE SEQÜÈNCIES Protein sequences Proteïnes  les trobem de N-terminal a C-terminal, i amb abreviació d’una lletra.
DNA sequences What is the length of my sequence? Es van començar a recopilar les seqüències de proteïnes en llibres  la primera: 1965 (Atlas) on hi havia una seqüència de 65 proteïnes.
UniProt Bases de dades de seqüències de proteïnes = SwissProt + Trembl.
- SwissProt: anota manualment (les ha posat i revisat algú). Ens ho podem creure.
Base de dades NO REDUNDANT: si dos persones anoten la mateixa proteïna, només apareixerà un cop. Té menys fitxes.
- Trembl: s’anota automàticament i no està revisada.
Base de dades REDUNDANT: pot haver diferents vegades la mateixa proteïna. Té més fitxes, ja que s’anota automàticament.
TrEMBL  prové de EMBL: base de dades d’àcids nucleics.
La majoria de vegades hem descobert el gen que s’ha traduït a proteïna.
TrEMBL (proteïnes) [traducció]--Z EMBL (àcids nucleics) The Swiss-Prot Entry The SwissProt Entry: cada fitxa està dedicada a una proteïna: - Resumir el que se sap de cada proteïna.
- Enllaços al PDB sobre la proteïna cristal·litzada.
- En quina via metabòlica hi intervé Swiss-Prot Statistics  Va creixent amb el temps (Swiss-Prot).
Com que hi ha menys fitxes buscaré només a SwissProt i serà més fàcil; però si vull buscar diverses proteïnes d’una família buscaré també a tEMBL perquè hi ha més fitxes.
Typical Swiss-Prot Entry SwissProt: cercador semblant al PubMed. Amb els límits.
- Millor no busar només una paraula, així trobarem algo més concret.
- Ex: buscar la seqüència de la insulina humana.
1) Provem: insulin  t’ensenyarà les fitxes de tot l’UniProt que surt aquesta paraula (9000 i pico resultats).
2) Canviem i busquem: Protein name  surten menys resultats.
3) Organism [OS]  Human [9606].
4) Entrem a la fitxa (1a) de la insulina humana.
a. Si li dono a [text] em surt el document.
b. Per fer servir les seqüències hem de clicar [Fasta]. La primera línia és informació, les altres línies són els aminoàcids en codi d’una lletra.
c. History: Com s’ha anat creant la fitxa des de que es va crear. (!Qüestió: mirar el canvi de la versió 1 a la 2).
d. Pestanya Blast: buscar seqüències semblants a la de la insulina.
Amb el cercador avançat  Reviwer (SI / NO): se’ns redueix molt la cerca.
* ID Mapping (després de Retrieve): puc posar codis del UniProt que corresponen amb el PDB.
...