4) DNA Sequences (2012)

Apunte Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Bioquímica y Biología Molecular - 2º curso
Asignatura Bioinformática
Año del apunte 2012
Páginas 2
Fecha de subida 18/01/2015
Descargas 9
Subido por

Vista previa del texto

26.04.12 DNA Sequences Podem buscar seqüències similars d’àcids nucleics en les bases de dades.
What is the length of my sequence? Ho podem comprovar en funció de les bases, els parells de bases, els nucleòtids, els residus...
La llargada es pot expressar en bp (parells de bases), kb (1000), mb (1000000) i gb (10^9).
Què podem trobar a le seqüències de DNA? No només trobem la seqüència sino també les regions reguladores, els introns, les regions entre gens...Trobem més informació.
Hi ha diferents bases de dades, GenBank, EEUU; EMBL (europea amb seu a alemania); Fetching a DNA sequence at the NCBI (GENBANK) Els cercadors de les bases de dades no ens permeten fer una cerca tan extensa.
Si necessitenm una cerca d’un àcid nucleic anirem al uniprot, buscarem la proteïna, i a partir d’allà, buscarem l’enllaç per anar al GenBank o al EMBL. Busquem la proteïna i ella per si mateixa ja ens portarà al DNA.
EMBL i GENBANK són bases de dades redundants, és a dir que hi ha duplicats en quant a la mateixa informació. També és difícil que dos investigadors sequenciin el mateix.
En una sequencia d’una base de dades es interessant saber els introns, etc, no volem que manqui la informació, pero com son bases redundants, podem trobar diferents resultats a la base de dades, aleshores el mes practic es fer-ho a través d’UNIPROT.
El que si que hem de saber fer es interpretar la informaci´ño d’una fitxa del Genbank o del EMBL; ja que a part de la seqüència trobem altra informació. Trobem el codi, la llargada, etc.
Si hem seqüenciat una sequencia de DNA genòmic o ARNm o ARN t, ja que en funcio del que sequenciem trobarem una informacio o una altra.
Unexpected information you can find in these database: En el gen de la imatge tenim una sequencia de 124 pb de llargada de la planta del tabac Per fer-nos a la idea de lo gran que arriba a ser la base de dades tenim un gràfic que representa la quantitat de coses sequenciades.
http://moodle.urv.net/moodle/mod/resource/view.php?inpopup=true&id=721196 A la segona part trobem una fitxa del genbank i a part de la informacio sobre l’organisme que s’ha sequenciat tenim informacio dels gens que trobem en les diferents posicions, on hi ha un intró, i quqan sequenciem un fragment de DNA genomic podem sequenciar un fragment de DNA que contingui mes d’un gen, i en podem trobar de molt llargues.
Relacionat amb el que deiem de quina sequencia triar i quina de les dos cadenes hem de triar perque acabi en la base de dades.
Tenim dues cadenes complementaries, i per exemple la cadena que es transcriu per la DNA pol és la del 3’-5’.
...