TEMA 11 - ORG. GENOMA (2015)

Apunte Catalán
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Biología - 2º curso
Asignatura genètica molecular
Año del apunte 2015
Páginas 6
Fecha de subida 14/01/2015
Descargas 35
Subido por

Vista previa del texto

ÈLIA RIUBUGENT CAMPS TEMA 11 ⟶ ORGANITZACIÓ DEL GENOMA EN EUCARIOTES • organització del genoma a nivell de seqüències del genoma. (quines hi ha) • seqüenciació del genoma⟶es cadascun dels mètodes de laboratori que tenen per objectiu determinar l'ordre dels nucleòtids d'adenina, guanina, citosina i timina en un fragment de DNA. El coneixement de les seqüències de DNA han estat indispensables per la recerca biològica, per altres branques de recerca i per camps aplicats com a diagnòstic.
-abans amb mètodes químics espectrofotomètrics es podia conèixer la quantitat del DNA però no la seva composició.
-s'ha progressat molt, ara a fer una seqüenciació es tarda poc.
_electroforograma: representació gràfica dels resultats de l'electroforesi. Cada una de les seves corbes de color representa la reacció evers un determinat nucleòtid.
_automated flourescent dye-terminator cycle sequencing _single gel lane-capillary tube -són alguns els aparells que s'utilitzen per a sequenicar el genoma.
-valor C, es defineix com la quantitat de DNA per genoma haploide (un sol joc cromosòmic) en un estat d'un cromàtic (en fase G1). En el cas de l'espècie humana amb 2n=46 cromosomes, espècie diploide (2m), amb dos jocs de cromosomes el valor c=23. (quantitat de DNA a les cèl·lules somàtiques = 2C) (es calcula del genoma haploide per poder-ho comprar directament amb el genoma bacterià).
• quan s'estudia el valor C de diferents espècies al llarg de l'escala evolutiva, s'observa que no hi ha cap relació entre el contingut en DNA i la posició que una espècie té en l'escala evolutiva. És a dir, especies com la humana tenen una menor quantitat de DNA que algunes espècies de salamandres, peixos teleostics i moltes plantes.
• hi ha una gran variació en la quantitat de DNA (valor C) entre especies pertanyents a famílies o grups filogenètics diferents, i a més a més, dins d'una mateixa família d'espècies també es troba una enorme variació en la quantitat de DNA. (foto: taula de valors) -ex. Arabidopsis thaliana, una planta que té molts gens • no obstant de cada família d'espècies (ex. els amfibis) escollim la que te menys quantitat de DNA i comparem aquest contingut amb el de les especies de menys valor de C dins de cada família o grup filogenètic. Trobem que la quantitat de DNA augmenta amb la complexitat evolutiva. Això ens podria portar a pensar que per pertànyer a un determinat grup taxonòmic es necessita una quantitat mínima de DNA.
• paradoxa del valor c⟶ sorgeix quan es compara la quantitat de DNA o dimensions del genoma amb les funcions per les que porten informació.
-la quantitat de DNA d'una espècie eucariota és molt superior que l'esperada per codificar enzims o proteïnes. En l'espècie humana s'estima que existeixen 100.000 gens diferents que codifiquen proteïnes, la 8 dimensió mitjana d'una proteïna humana és de 500AA (1.500pb), per tant necessitaríem 1,5x10 pb.
8 8 L'espècie humana té 2,8 picograms de DNA (cada picogram equival a 9,1x10 pb per tant, 1,5x9,1x10 = 8 25,48x10 pb). Només el 6% del DNA codifica proteïnes. No necessitem tants gens per fer les funcions que fem.
• densitat gènica⟶nº de gens per unitat de seqüència (megabases). Els humans tenim molt poca densitat gènica comparat amb llevats i les mosques Drosophila. La densitat del genoma té una relació inversament proporcional amb la complexitat de l'organisme. ↑complex⟶↓denistat gènica. (ex. bacteris 976 gnes/Mb). Hi ha molts gens junts⟶genoma compacte.
-quan la densitat és baixa les seqüències repetides que trobem son superiors que en el cas de que la densitat sigui alta.
• tipus de seqüències en el genoma eucariota (es pot classificar en gens d'una sola còpia, que són gens funcionals, DNA repetitiu, dins del qual trobem famílies de gens dispersos, famílies de gens en repetits en tàndem, transposons i retro-transposons o DNA espaiador, no se sap massa la funció que té, està relacionat amb l'estrucutra.) -seqüències úniques • gen codificant: porta informació per la síntesi d'una proteïna o gen d'RNA, és una ÈLIA RIUBUGENT CAMPS còpia simple funcional, gens d'una única còpia, codifiquen per un RNA funcional (ex. tRNA, rRNA, microRNA* o altres gens RNA no codificant.
-seqüències repetides: • moderadament repetides _famílies gèniques _transposons • altament repetides _DNA satèl·lit (centròmer) _minisatèl·lits (telòmers, VNTRs) _microsatèl·lits _seqüències (SINEs (Alu); LINE (L1) en humans) (recordem que els gens que codifiquen per proteïnes són aproximadament un 1%.
*MicroRNAs⟶difícils de detectar, actualment només es poden trobar a nivell experimental GENS DE SEQÜÈNCIA ÚNICA • identificació dels gens en un genoma sequenciat: es basa en les dades o informació que es té dels gens identificats d'aquell genoma al laboratori i es combina amb la bioinformàtica (anàlisi bioinformàtic) per predir si es possible o no que un determinat gen es trobi en una regió determinada. (predictiu). Al laboratori es fa l'anàlisi experimental per demostrar la predicció.
-els mecanismes o processos de predicció de gens són aquells que dins de l'àrea de la bioinformàtica, s'utilitzen per a la identificació algorísmica de trossos de seqüències biològicament funcionals (gens codificant de proteïnes, gens d'RNA o seqüències reguladores). Ens serveix per entendre el genoma d'una espècie un cop ha estat sequenciat.
-6 pautes de lectura en un DNA, (tres endavant i tres endarrere) si s'ha de codificar per una proteïna, només una ens donarà el pèptid correcte.
-l'ordinador començarà a llegir donant lloc a una seqüència de polipèptids, anteriorment haurem introduït uns paràmetres per indicar-li quina seqüència ens interessa. (ex. longitud abans d'arribar al codó STOP) ⟶ens dóna la pauta més correcta (la més probable).
• pauta de lectura oberta o ORF o marc obert de lectura -és una seqüència de nucleòtids que potencialment pot codificar a una proteïna ja que està compresa entre una seqüència d'inici (codó d'inci) i una seqüència de terminació (codó d'aturada o codó de stop). Ha de tenir una llargada coherent per una proteïna i els extrems de l'ORF no delimiten l'mRNA que sol ser més llarg perquè presenta altres regions no codificants.
-els ORFs es solen identificar amb eines bioinformàtiques a partir de la seqüenciació d'un genoma o d'un tros d'aquest amb l'objectiu de localitzar nous gens. Es fan servir algorismes que busquen codons d'inici (promotor si altres requeriments) en tota la seqüència del genoma senyalant els ORFs possibles en la seqüència estudiada.
-l'existència d'una ORF, especialment quan es tracta d'una seqüència llarga, és un bon indicador de la presencia d'una regió codificant en la seqüència estudiada. En aquest cas, l'ORF és la part de a seqüència que serà traduïda pels ribosomes.
-un cop el gen ha estat seqüència és important delimitar la pauta oberta de lectura correcta.
• densitat gènica dins del genoma -el genoma presenta una densitat de gens molt inferior a la que inicialment s'havia esperat, només un 1,5% de la seva longitud és constituïda per exons codificants de proteïnes. Un 70% està constituït per DNA extragènic i un 30% per seqüències relacionades amb gens. Del total del DNA extragènic, el 70% correspon a repeticions disperses, de manera que, més o menys, la meitat del genoma humà correspon a sequencies ÈLIA RIUBUGENT CAMPS repetitives de DNA. D'altra banda, del total de DNA relacionat amb els gens s'estima que el 95% correspon a DNA no codificant: pseudògens, fragments de gens, introns, seqüències UTR, etc.
-gens solapats: quan la densitat és elevada és freqüent que els gens es solapin. No són res més que parts d'una seqüència que serveix per més d'un gen. Els solapament entre gens acostumen a ser curts, com més llarg és un solapament entre dos gens, més risc hi ha que una mutació pugui afectar a dues proteïnes de la cèl·lula al mateix temps.
-gens dins de gens: (figura B) el gen NF1 representat pels exons 26 i 27 (són petits i estan separats per un intró que conté tres gens OGMP, EVI2B i EVI2A). La transcripció del gen que conté l'intró es d'esquerra a dreta però els tres gens de l'intró es transcriuen en la cadena antiparal·lela..
- El genoma dels llevats és un genoma amb una gran densitat gènica ja que gairebé tota la seqüència és codificant.
diapo 19 -dos esquemes, un fa referència a la funció dels gens en humans i l'altre fa una comparativa entre quants gens homòlegs hi ha entre grups diferents (un 1% es específic per cada espècie o organisme⟶defineix l'espècie.
DNA REPETITIU • moderadament repetides -famílies gèniques -transposons (no en parlarem, ja en vam parlar prou) • famílies gèniques -són grups de gens relacionats poden ser: 1. paràlegs⟶ es troben separades per un esdeveniment de duplicació. Si un gen d'un organisme es duplica per ocupar dues posicions diferents en el mateix genoma, llavors les dues còpies són parlàlogues. Tenen la mateixa funció o similar, no obstant, moltes vegades aquest no és el cas degut a que no existeix la mateixa força selectiva original sobre la còpia duplicada del gen, aquesta pot adquirir noves funcions per mutació i selecció⟶mouse α i β.
2. ortòlegs⟶son seqüències homologues que s'han separat per un esdeveniment d'especiació, quan una espècie divergeix en dues espècies separades, les copies divergents d'un mateix gen en les especies resultants es diu que són ortòlogues. Són les seqüències que es troben en diferents especies i que son altament similars degut a que s'han originat a partir d'un ancestre comú⟶mouseβ, chickβ i forgβ que venen d'un ancestre comú que tenia la β-chain gene.
-les famílies gèniques es formen a partir d'un procés de variació genètica. Els gens són homòlegs entre ells i si els comparem tenen un origen en comú (carly globin gene).
-les famílies gèniques poden ser: • gens repetits en tàndem • gens agrupats • gens dispersos ÈLIA RIUBUGENT CAMPS -gens repetits en tàndem (vàries repeticions seguides d'un gen (tots els gens tenen la mateixa funció i codifiquen per la mateixa els gens de les globines humanes constitueixen una família mutagènica proteïna).
que ha evolucionat a través de duplicacions gèniques successives.
_els seus productes són requerits en grans quantitats (ex. gens que codifiquen per rRNA, pot haver-hi fins a més de 800 còpies en un cromosoma).
-gens agrupats _tots els gens que codifiquen per un producte relacionat amb l'α-globina. En negre hi ha els que s'expressen i codifiquen per globines funcionals, rallades hi ha els pseudògens que s'expressen i de color blanc els pseudògens.
_pseudògen: gen inactiu, si s'expressa ens dóna DNA no funcional.
_en la regió on s'agrupen els gens (duplicacions seriades, s'obtenen diferents molècules (variació gènica) que els ha tornat no funcionals (pseudògens per adquisició)).
_es troben a una regió específica del genoma.
-gens dispersos (ex. actina, creatines..) _es troben un gen a un cromosoma i l'altre a l'extrem oposat.
• altament repetides -DNA satèl·lit -minisatel·lits -microsatel·lits -seqüències Alu (humans) -una seqüència altament repetida es troba més de 100 vegades al genoma. Han perdut la capacitat de mobilitzar-se perquè han perdut els seus extrems o bé perquè no poden generar els enzims necessàris per la transcripció. Són molt variables.
1. DNA satèl·lit -seqüència complexa, són entre 5 i diversos centenars de nucleòtids que es repeteixen en tàndem milers de vegades generant regions repetides amb grandàries que oscil·len entre 100kb (100.000 nucleòtids) fins a diverses megabases.
-reben el seu nom d'observacions inicials de centrifugacions en gradient de densitat del DNA genòmic fragmentat, que reportaven una banda principal corresponent a la major part del genoma i tres bandes satèl·lit de menor densitat. (degut a que les regions satèl·lit tenen una riquesa en A+T superiors a la mitjana del genoma i en conseqüència són menys denses) -es troben en els centròmers dels cromosomes (seqüències més difícils de seqüenciar dels genomes⟶↑compactes).
Mini satèl·lits de 6-25 nucleòtids que es repeteixen en tàndem generant sequencies d'entre 100 i 20.000pb.
-s'ha relacionat els mini satèl·lits amb processos de regulació de l'expressió gènica, com le control del nivell de transcricpió, l'splicing alternatiu, etc.
-s'han associat amb punts de fragilitat cromosòmica atès a que es situen propers a llocs preferents de trencament cromosòmic, translocació i recombinació mitòtica.
-hi ha minisatel·lits (10%) que són hipermutables, tenen una taxa mitja de mutació en les cèl·lules de la línia germinal, sent així les regions m´s inestables del genoma humà.
-el 90% dels mini satèl·lits es troben als telòmers dels cromosomes. I la seqüència bàsica de sis nucleòtids TTAGGG ÈLIA RIUBUGENT CAMPS es repeteix milers de vegades en tàndem, generant regions que ens formen els telòmers.
-degut a la seva inestabilitat presenten una notable variabilitat entre individus diferents. Es consideren polimorfismes multial·lèlics, atès que poden presentar-se en un nº molt variable, i es denominen VNTR (Variable number tandem repeat). Són marcadors molt utilitzats en genètica forense, ja que permeten establir una petjada genètica característica de cada individu, i són identificables mitjançant transferència d'RNA i hibridació d'àcids nucleics.
Micro satèl·lits de 2-4 nucleòtids, la repetició dels quals en tàndem origina frequentment seuqencies de menys de 150 nucleotids. (ex. dinucleòtid CA i tinucleòtid CAG).
-són polimorfismes multial·lèlics, denominats STR (short tandem repeat) i poden identificar-se a través d'una PCR, de manera ràpida i senzilla.
-es distribueixen de manera homogènia en tot el genoma, el que fa que siguin més informatius que els mini satèl·lits.
-variabilitat dels microsatèl·lits poden tenir diferents tipus de seqüències i un mononucleòtid (AAAAAAA) o un dinucleòtid (CACACACACA) que prové de la replicació d’aquestes seqüències durant la síntesis del DNA abans de la divisió cel·lular.
-la primera regió que es replicarà, si és normal, sorgiran dues copies idèntiques però durant la replicació es pot donar també un desplaçament de la DNApolimerasa o slippage en una cadena o en l’altre (una fa de motlle i l’altre es desplaça). Si el plegament està en una cadena, fins dues generacions per sota, no es veuria l’inserció de la unitat de repetició addicional. Es dóna a cada cicle.
• HapMap -projecte internacional creat per desenvolupar un mapa d'haplotips* del genoma humà, en el que poder catalogar les regions amb similituds i diferencies genètiques entre individuis per poden entendre millor la relacio entre el genoma i la salut humana.
-les variacions genetiques comunes (=polimorfismes) que estan presents en l'especie humana és el que es cataloga al HapMap.
-el seu contingut descriu en què consisteixen aquestes variacions, en quins llos del genoma succeeixen i com es distribueixen en les diferents poblacions, -les variacions més comunes són els polimorfismes de nucleòtid simple o SNPs (single Nucleotide Polymorfism) que consisteix en una variació d'un únic nucleòtid de la seqüència. S'estima que hi ha al voltant de 10 milions de SNPs al genoma humà.
-la seva importància es basa en que poden estar associats a altres SNPs responsables de malalties o associats a un major risc de patir alguna anomalia de la salut, pel que poden actuar com a marcadors per localitzar gens responsables en les seqüències.
El projecte HapMap vol estudiar la gran majoria d'aquests SNPs i com estan organitzats en els cromosomes. Així es podrien establir els haplotips o regions cromosòmiques de polimorfismes associats. Per la seva proximitat en el genoma tendeixen a heredar-se de manera conjunta, perquè hi ha una probabilitat molt reduïda de que passin esdeveniments de recombinació entre ells. Seguidament es podrien identificar els SNPs que siguin marcadors exclusius d'aquests haplotips, anomenats "tagging SNPs".
ÈLIA RIUBUGENT CAMPS *haplotips: és un conjunt de polimorfismes d'un sol nucleòtid (SNP) en un cromosoma particular que estan estadísticament associats.
...