Pràctica BIOEDIT (BIA) (Part genètica) (2017)

Apunte Catalán
Universidad Universidad de Girona (UdG)
Grado Biología - 3º curso
Asignatura Bioinformàtica Aplicada
Año del apunte 2017
Páginas 8
Fecha de subida 01/07/2017
Descargas 0
Subido por

Descripción

Inclou la pràctica corresponent a la sessió de BIOEDIT de la part genètica de l'assignatura de Bioinformàtica Aplicada (BIA) (Part genètica)

Vista previa del texto

Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA Pràctica BIOEDIT Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA En primer lloc, descarrega des de NCBI (http://www.ncbi.nlm.nih.gov/) la seqüència amb número d’accés JF990713 amb un arxiu que tingui format GenBank full (.gb).
Anomena el teu arxiu com a “Mostra_E” i desa’l.
1. Quina és l’anotació d’aquesta seqüència? Quin tipus de molècula estàs analitzant? Quina és la seva longitud? Anotació: Sequència de Mytilus galloprovincialis i és un aïllat de myticina C, mRNA i complete CDS  Mytilus galloprovincialis isolate 11_03 myticin C mRNA, complete cds Tipus de molècula: mRNA Longitud: 303 bp PopSet és una base de dades on s’agrupen col·leccions de seqüències, relació filogenètica, utilitzades en ecologia Bioedit -- > file > open > AMS.fas (all files) Dintre de la carpeta “Exercici_AMS” al Moodle, trobaràs dos arxius en format FASTA (.fas), una anomenat “AMS.fas” i un altre anomenat “Mostra_D.fas”. Obre tots dos arxius amb un editor de text (p.e. notepad).
2. Quantes seqüències hi ha a cadascun dels arxius? Quin tipus de molècula estàs analitzant? AMS: 6 seqüències Mostra D: 1 seqüència Obre el programa BioEdit. El trobaràs a: Inicio > Todos los Programas > Docència > BIOEDIT > BioEdit. Un cop obert el programa, carrega l’arxiu “AMS.fas”.
3. Indica quina ruta de comandes utilitzes.
Bioedit -- > file > open > AMS.fas (all files) Seleccionem la sequència que ens interessa>Sequence>edit sequence Un cop obert l’arxiu “AMS.fas”, obre els arxius “Mostra_D.fas” i “Mostra_E.gb” en la mateixa aplicació de BioEdit en la que has obert l’arxiu “AMS.fas. Quan tinguis tots els arxius oberts, compara la informació del arxius “Mostra_D.fas” i “Mostra_E.gb” seleccionant les diferents finestres que s’obren per cadascun del arxius. Selecciona la seqüència i fes doble click sobre ella o selecciona-la i utilitza la ruta: Sequence > Edit 1 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA sequence; per tal d’obrir la finestra d’edició de la seqüència. Desplega la finestra d’edició completament.
4. Observes diferències entre els dos formats d’arxius? Quin és més informatiu? Per què? Sí s’observen diferències entre els dos formats. És més informatiu en el format GenBank que no pas el FASTA. En funció del format al qual guardem la sequència dona més o menys informació. Perquè et mostra la seva filogenia...
Copia les seqüències de la “Mostra_D” i la “Mostra_E” i enganxa-les a l’arxiu “AMS.fas” 5. Indica quina ruta de comandes utilitzes.
Selecciona la seqüència d’interès, edit > copy i un cop estas a l’arxiu AMS edit > paste.
Un cop enganxades les seqüències “Mostra_D” i “Mostra_E”, compara les diferents seqüències que es troben incloses dins l’arxiu “AMS.fas”.
6. Quina és la longitud de les diferents seqüències incloses? Les dues primeres (seqüència A i B) tenen 291 pb i les altres tenen 303 pb.
Guarda l’arxiu amb totes les seqüències amb el nom “AMS_Nom_alumne.fas”.
7. Indica quina ruta de comandes utilitzes.
File > save as > AMS_NAMIGA.fas Realitza l’alineament múltiple de les teves seqüències utilitzant el programa ClustalW inclòs dintre del programa BioEdit (Important: perquè el programa realitzi l’alineament de totes les seqüències conjuntament han d’estar seleccionades).
8. Quina ruta de comandes utilitzes? Quins són els paràmetres per defecte que té el programa? Edit>select all>Accessory Application>ClustalW Multiple Alignment Per defecte fem un alineament complet amb bootstraps (probabilitat d’alineament) de 1000.
Un cop el programa “ClustalW” finalitzi l’alineament múltiple, BioEdit obrirà una nova finestra on es trobarà el AMS. Guarda aquest arxiu amb el nom “AMS_Nom_alumne_Clu.fas”.
A la posició 230 a les sequències A i B apareix un gap (quan mirem l’alineament) 2 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA 9. Quina ruta de comandes utilitzes? Quina és la longitud de les seqüències? File>Save as>AMS_NAMIGA_CLU.fas L’alineament té una longitud de 303 pb i en realitat tant la sequencia A com la B tenen una longitud de 291 pb.
10. Quina és la composició nucleotídica de cadascuna de les seqüències? Indica la ruta utilitzada per aconseguir aquests resultats.
Seleccionar la seqüència d’interès>Sequence>Nucleic Acid>Nucleotide Composition DNA molecule: A Length = 291 base pairs Molecular Weight = 87877,00 Daltons, single stranded Molecular Weight = 176484,00 Daltons, double stranded G+C content = 40,89% A+T content = 59,11% Nucleotide A C G T Number 85 51 68 87 Mol% 29,21 17,53 23,37 29,90 DNA molecule: B Length = 291 base pairs Molecular Weight = 87882,00 Daltons, single stranded Molecular Weight = 176654,00 Daltons, double stranded G+C content = 44,33% A+T content = 55,67% Nucleotide A C G T Number 80 54 75 82 Mol% 27,49 18,56 25,77 28,18 DNA molecule: C Length = 303 base pairs Molecular Weight = 91455,00 Daltons, single stranded Molecular Weight = 183865,00 Daltons, double stranded G+C content = 42,90% A+T content = 57,10% Nucleotide A C Number 85 54 Mol% 28,05 17,82 3 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA G T 76 88 25,08 29,04 DNA molecule: mostra_A Length = 303 base pairs Molecular Weight = 91446,00 Daltons, single stranded Molecular Weight = 183882,00 Daltons, double stranded G+C content = 43,23% A+T content = 56,77% Nucleotide A C G T Number 83 55 76 89 Mol% 27,39 18,15 25,08 29,37 DNA molecule: mostra_B Length = 303 base pairs Molecular Weight = 91554,00 Daltons, single stranded Molecular Weight = 183933,00 Daltons, double stranded G+C content = 44,22% A+T content = 55,78% Nucleotide A C G T Number 84 57 77 85 Mol% 27,72 18,81 25,41 28,05 DNA molecule: mostra_C Length = 303 base pairs Molecular Weight = 91438,00 Daltons, single stranded Molecular Weight = 183916,00 Daltons, double stranded G+C content = 43,89% A+T content = 56,11% Nucleotide A C G T Number 81 56 77 89 Mol% 26,73 18,48 25,41 29,37 DNA molecule: mostra_D Length = 303 base pairs Molecular Weight = 91438,00 Daltons, single stranded Molecular Weight = 183916,00 Daltons, double stranded G+C content = 43,89% 4 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA A+T content = 56,11% Nucleotide A C G T Number 81 56 77 89 Mol% 26,73 18,48 25,41 29,37 DNA molecule: Mostra E Length = 303 base pairs Molecular Weight = 91446,00 Daltons, single stranded Molecular Weight = 183882,00 Daltons, double stranded G+C content = 43,23% A+T content = 56,77% Nucleotide A C G T Number 83 55 76 89 Mol% 27,39 18,15 25,08 29,37 Compara les diferents seqüències utilitzant l’eina d’identitat per tal de visualitzar les posicions invariables (apareixen com un punt) i variables (apareixen mostrant la variant respecte a la seqüència en primera posició).
On hi ha un puntet és que són similars i les lletres és que són diferents.
A és la que agafa com a referència.
11. Quines seqüències penses que s’assemblen més entre elles? Quines són les més diferents? Sequence Difference Count Matrix Input Alignment File: C:\Users\alumnes\Desktop\AMS_NAMIGA_CLU.fas Seq-> A A ID B 48 C 96 mostra_A 98 mostra_B 103 mostra_C 96 mostra_D 97 Mostra E 98 B 48 ID 94 91 99 94 95 91 C 96 94 ID 14 23 4 4 14 mostra_A mostra_B mostra_C mostra_D Mostra E 98 103 96 97 98 91 99 94 95 91 14 23 4 4 14 ID 20 12 10 0 20 ID 23 23 20 12 23 ID 2 12 10 23 2 ID 10 0 20 12 10 ID Calcula la matriu d’identitat entre les diferents seqüències.
La mes semblant serà la mostra A amb la perquè tenen 0 diferencies i les més diferents la mostra B amb la A 12. Indica quina ruta de comandes utilitzes.
5 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA Alignment>Sequence difference count Matrix (diferencies absolutes, creem un fitxer) 13. Quin parell o parells de seqüències són les més semblants? I quines són les més divergents? Inclou la matriu d’identitat (utilitza el tipus de lletra Courier New per la matriu per tal que cada caràcter ocupi el mateix espai i la matriu quedi ben alineada) Crea una seqüència consens “AMS_Nom_alumne_Clu.fas”.
a partir de les seqüències de l’arxiu 14. Quina ruta de comandes utilitzes? Copia i enganxa la seqüència consens.
Alignment>create consensus sequence Seleccionar consensus>edit>copy sequences to clipboard (Fasta Format) >Consensus ATGAAGGCAACRATSTTGTTAGCWGTTSTAGTGGCWGTCWTTGTYGSAGKT MMRGAAGYYCAWYCRVWHSYTTGYRCATCRWMCTRSTGTRSYARGTTYTG TGGRWCTGCTRGTTGCWCAHDWTATSKATGYHRMVDWCTYCATCSYGGNA ARMTKTGCKHMTGYSTTCATTGYMGMAGRGYKRASWHYCCDTTBRSASYW WMTSRARDYGCTARRARTRTKAACGANHRGAACAAMGAGATGGAHWACW CTCCMRTRATGAAKKMGRTGGAAMAYTTGGACMAHGRAATGGAWATGTT HTAR 15. Un cop que has alineat totes les seqüències en un AMS, penses que totes les seqüències utilitzades tenen la mateixa anotació? Fes un BLAST (http://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastn&BLAST_PROGRAM S=megaBlast&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LO C=blasthome) per cadascuna d’elles i indica quina és la seva anotació i el número d’identificació GenBank de la seqüència amb la que tingui una homologia més elevada sobre la base de dades “Nucleotide collection (nr/nt)” (Nota: pots carregar el teu arxiu alineat a BLAST per tal de buscar totes les seqüències a la vegada).
BLAST>nucleotide blast>carregar arxiu AMS_NAMIGA.fas https://blast.ncbi.nlm.nih.gov/Blast.cgi 6 Natalia Mingorance García 3r Biologia – UdG UNYBOOK: nattymg23 BIOINFORMÀTICA APLICADA A que es correspon la seqüència, a qui te homologia, el primer blast que fa té homologia del 100%, el de myiticina A Podem anar seleccionant les altres seqüències (desplegable de dalt) 7 ...

Tags:
Comprar Previsualizar