BIO INF Tema 6.- Anotació de gens i dominis proteics (2015)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Biología - 3º curso
Asignatura Bioinformática
Profesor S.
Año del apunte 2015
Páginas 3
Fecha de subida 24/03/2015 (Actualizado: 24/03/2015)
Descargas 26
Subido por

Vista previa del texto

BIOINFORMÀTICA arokargomez 3r Biologia UAB Tema 6.- Anotació de gens i dominis proteics Dels nucleòtids a l’anotació de regions funcionals Estratègies de cerca de gens al DNA 1.- Cerca per homologia 2.- Cerca ab-initio. Simplement basada en la sequencia de nucleòtids descarregada.
3.- Cerca basada en l’anàlisi de l’expressió gènica. No treballarem amb aquesta part a les pràctiques. Serveix per veure quines sequencies s’estan transcribint a la cèlula en un moment determinat i si podem anotar-ho com a gen.
Open Reading Frames (ORFs) Són els senyals a la seqüència que indiquen la presència d’un gen. Es una sequencia que podem llegir de tres en tres entre un codó metionina (ATG) fins a un codó STOP. Aquest marc obert de lectura ha de tenir una mida mínima (normalment per a les proteines son uns 100 aminoàcids). Cercar ORFS es una estratègia útil per trobar gens en un genoma.es fa servir el programa Artemis. Per bacteris i virus és força vàlid ja que tenen proteines més curtes que les que considerariem mida mínima.
Son senyals a la seqüència que indiquen la presència d’un gen. A eucariotes el marc obert de lectura no està tot seguit a la cadena sino que està interromput per introns, de forma que una cerca d’ORFs no sempre és útil. Hem de fer servir programes que tinguin en compte l’estructura més complexa que tenen els eucariotes.
Predicció de gens ab-initio Les sequencies tenen altres caracteristiques que fan pensar que son exons interromputs per introns. Els dos primers nucleòtids dels introns sempre comencen per GT i acaben per AG, per tant utilitza aquests senyals de splicing per excloure els introns. També hi ha senyals d’inici de la transcripció que poden indicar l’inici del gen, el senyal de poliadenilació que indica que acaba, les illes CpG i els promotors es troben abans del codo d’inici.
BIOINFORMÀTICA arokargomez 3r Biologia UAB Cada espècie te una preferencia per un codo determinat per codificar un mateix aminoàcid, de forma que si una sequencia està enriquida amb els codons preferents segurament indiqui un gen.
Les 6 pautes de lectura del DNA Quan fem una cerca de gens en una cadena de DNA ho hem de fer en les 6 possibles pautes de lectura. Hi ha programes que ho detecten. La primera es la cadena del genoma del SARS i la segona és la cadena reversa complementària. Si llegim la cadena començant pel primer nucleòtid no donarà el mateix codi d’aminoàcids que si comencem a llegir pel segon nucleòtid.
Això ho fa amb tres posicions a la cadena codificant, i també amb les tres ultimes posicions (que seran les primeres) de la cadena reversa complementària.
QUIZ Pot estar un gen codificat a diferents pautes de lectura? I a les dues diferents cadenes del DNA? A la imatge hi ha una seqüeència bacteriana on cada gen està a una pauta de lectura diferent perque els gens no estan interromputs. Les sequencies eucariotiques estan interrompudes per introns, per tant cada vegada que es canvia d’exó es pot canviar de cadena i canviar per tant de marc de lectura.
Quan anem llegint de tres en tres, tot i que estigui interromput per introns, sempre es trobarà a la mateixa cadena (o a la forward o a la reverse).
Cerca de dominis proteics L’estructura d’una proteïna està directament relacionada amb la seva funció: Quan una proteina codifica per un domini que sabem que quan el gen es tradueixi els aionacids es plegaran formant dits de zinc ja sabem que aquella proteina estara implicada en el DNA.
BIOINFORMÀTICA arokargomez 3r Biologia UAB Cerca de dominis proteics per homologia amb InterProScan: Al programa busca dins de la sequencia proteica dominis proteics coneguts dins de la sequencia d’aminoacids.
Anotació funcional: Gene Ontology El Gene Ontology es un sistema de classificació dels gens en base a la seva funció. La determinació de la funció ve donada per dominis proteics i per similaritat amb gens estudiats en altres espècies. Hi hi tres tipus de classificacions: segons la funció molecular    Funcio molecular, per saber quin tipus de proteina es Procés biològics: per saber en quin procès intervé una proteina Component cel·lular: per saber l’estructura anatomica.
Una bona part dels gens (1/3) tenen una funcio molecular desconeguda, de forma que quan utilitzem aquesta base de dades no ens ha d’estranyar si no trobem resultats; però es una bona aproximació.
...