Proteómica Tema 2 Estructura de proteínas (2015)

Apunte Español
Universidad Universidad de Lleida (UdL)
Grado Ciencias Biomédicas - 2º curso
Asignatura Proteómica
Año del apunte 2015
Páginas 34
Fecha de subida 08/04/2016
Descargas 7
Subido por

Vista previa del texto

2º C. Biomédicas (UdL) Irene LV INGENIERÍA DE PROTEÍNAS Y PROTEÓMICA TEMA 2 Estructura de proteínas Las proteínas son polímeros de aminoácidos. Existen unos 20 aminoácidos diferentes con los que se generan infinitas combinaciones ya que las proteínas pueden tener incluso más de 1000 aminoácidos.
Por tanto, se generan muchas proteínas diferentes con diferentes funciones, formas y tamaños.
Como vemos en la imagen, podemos encontrar péptidos como la insulina, enzimas (que generalmente tienen un mayor número de aminoácidos), … AMINOÁCIDOS: estructura y propiedades Como su propio nombre indica, son moléculas que tienen un grupo ácido (-COOH) y un grupo amino (NH2). Son los α- aminoácidos los que componen las proteínas.
Además de la estructura básica, común a todos ellos, tienen una cadena lateral que les confiere distintas propiedades.
Los aminoácidos pueden polimerizar: mediante la interacción entre el grupo ácido y el amino de la molécula siguiente se forma el enlace peptídico.
1 Estructura de proteínas La denominación más común, aunque no oficial para las cadenas de aminoácidos es la siguiente: Péptidos  secuencias cortas.
Polipéptidos  secuencias más largas Proteínas  péptido plegado Como es lógico, en un extremo del polipéptido queda libre el grupo ácido -carboxiterminal- y en el otro extremo queda libre el amino -aminoterminal.
Normalmente, al escribir la secuencia se empieza por el extremo aminoterminal (N-terminal).
Las CADENAS LATERALES de los aminoácidos definen sus propiedades y determinan su clasificación en función a características de polaridad y carga.
Aminoácidos no polares neutros No pueden establecer puentes de H - no tienen capacidad para interaccionar con el agua o con disolventes polares.
Aminoácidos polares neutros Son aquellos que tienen capacidad para establecer puentes de H e interaccionar con sustancias polares.
Suelen tener grupos -OH.
2 2º C. Biomédicas (UdL) Irene LV Aminoácidos con carga: los hay ácidos y básicos.
Los aminoácidos pueden ordenarse en función de su polaridad: de más polares a menos polares. Es decir, se ordenan en función del índice de hidropatía. Hay distintas escalas de hidropatía ya que son realizadas por personas o grupos particulares que han llegado a conclusiones diferentes empleando distintos métodos.
Las que se muestran en la imagen son las más populares.
Los índices de hidropatía se emplean para realizar cálculos. Por ejemplo, si tenemos la secuencia de proteínas pero no conocemos su estructura - sabemos por ejemplo dónde tienen tendencia a situarse los aminoácidos más hidrofóbicos, por lo que los índices de hidrofobicidad nos pueden dar una idea de la estructura.
3 Estructura de proteínas Un protein hydropathicy plot es un método empleado para predecir la estructura de la proteína en base a las regiones hidrofílicas e hidrofóbicas. Podemos deducir que las regiones en las que se acumulan muchos aminoácidos hidrofóbicos son regiones transmembrana.
Otras clasificaciones o propiedades a considerar Aminoácidos con propiedades redox Son la cisteína, la selenocisteína, la tirosina, el triptófano y la metionina.
Se trata de aminoácidos con facilidad para reducirse y oxidarse.
Destacan las cisteínas, que tienen un grupo tiol que se oxida y se reduce muy fácilmente, formándose puentes disulfuro.
La selenocisteína es en realidad el aminoácido 21 (no es del todo cierto por tanto, que hay 20 aa). Lo que ocurre es que este aminoácido se encuentra en muy pocas proteínas. Es idéntico a la cisteína pero con selenio en lugar de azufre. Por lo tanto tiene propiedades muy similares a las de la cisteína: puede oxidarse y reducirse.
Al contrario de la cisteína, no parece que la selenocisteína tenga propiedades estructurales. Este aminoácido es codificado por el codón UGA, interpretado durante muchos años como codón de STOP: esto se debe a que, cuando el organismo está privado de selenio, la proteína se termina (el codón UGA actúa en este caso como codón de STOP).
4 2º C. Biomédicas (UdL) Irene LV A los aminoácidos triptófano y tirosina también se les ha atribuido propiedades redox: son aminoácidos aromáticos que pueden perder un electrón. Se ha observado que esto es muy importante para la catálisis de muchas enzimas.
Aminoácidos aromáticos Tienen la propiedad de absorber luz ultravioleta (en torno a 280 nanómetros).
En función del tamaño No todos los aminoácidos tienen el mismo tamaño. Por lo general, los aminoácido más hidrofóbicos no polares sin carga tienen cadenas laterales de distinto tamaño.
Con los aminoácidos más pequeños se emplea el término tiny.
5 Estructura de proteínas En la siguiente imagen se muestra un resumen de las propiedades de los aminoácidos (tiene algunos errores).
Nomenclatura de los aminoácidos 6 2º C. Biomédicas (UdL) Irene LV Las proteínas contienen α-aminoácidos en la forma isomérica L.
ENLACE PEPTÍDICO Como ya se ha comentado, se establece entre el grupo ácido de un aminoácido y el amino del siguiente. Se trata de un enlace de tipo amida: carbonilo-amina. Es un enlace resonante y plano.
Tiene características intermedias entre enlace simple y doble (la resonancia le da el carácter parcial de doble enlace, sin llegar a ser tan rígido como éste): - No puede rotar - Prácticamente siempre en forma trans - Es radial en plano es decir, los 6 átomos que se encuentran alrededor del enlace forman un plano.
Entre dos de estos planos queda un Cα, por lo que los planos tienen capacidad de rotar. Según las disposición que tome el Cα respecto a los planos se generan ángulos llamado phi o psy.
7 Estructura de proteínas Se ha comprobado que los ángulos phi y psy no pueden tomar todos los valores: el Ramachandran plot representa todos los ángulos que toman los distintos aminoácidos.
En general, tienden a repetirse combinaciones concretas de phi y psy.
La mayoría de estas combinaciones corresponden a las estructuras secundarias más comunes.
ESTRUCTURA DE PROTEÍNAS Estructura primaria  Estructura secundaria  Estructura terciaria  Estructura cuaternaria - Estructura primaria: consiste en la secuencia de aminoácidos. Podemos encontrarla en bases de datos.
- Estructura secundaria: patrones generales de plegamiento que se repiten diversas veces en una determinada proteína. Hélice α y hoja β.
- Estructura terciaria: disposición tridimensional de todos los aminoácidos de una cadena polipeptídica.
- Estructura cuaternaria: organización tridimensional de las diferentes subunidades que constituyen la proteína.
Estructura primaria Como ya se ha dicho, consiste en la secuencia de aminoácidos que forma la proteína.
La estructura primaria de la proteína puede encontrarse en bases de datos que contienen las secuencias conocidas. Actualmente existen dos grandes bases de datos universales: UniProt (de origen europeo) NCBI (de origen estadounidense) Anteriormente existía una tercera base de datos importante: IPI (International Protein Index) que cerró después de 10 años de servicio.
 También existen otras bases de datos específicas de organismo.
8 2º C. Biomédicas (UdL) Irene LV A partir de ahora nos vamos a centrar en UniProt Es un organismo público, mantenido con fondos públicos europeos.
Se estructura en dos secciones: TREMBL: sección de secuencias no revisadas.
SwissProt: todas las secuencias que se encuentran en esta sección han sido revisadas.
Cómo funciona UniProt Esta base de datos intenta contener todas las secuencias de proteínas posibles. Más del 95% de estas secuencias son enviadas por investigadores o grupos de investigación particulares. Cuando un investigador envía una proteína a UniProt, ésta pasa a formar parte directamente de TREMBL.
En la base de datos también pueden obtener secuencias de PDP (base de datos de estructuras de proteínas) y de secuencias de proteínas obtenidas directamente de secuenciar la proteína en lugar de ser obtenidas tras secuenciar el DNA. Otras fuentes de UniProt son, por ejemplo, las revistas científicas.
Una vez se encuentra la secuencia no revisada en TREMBL, los trabajadores de UniProt realizan un cribaje: van revisando las secuencias de TREMBL y, una vez las han depurado, las cuelgan en la sección SwissProt. Buscan si las secuencias están repetidas (es habitual que una misma secuencia, con pequeñas variaciones se encuentre más de una vez en TREMBL) y juntan las secuencias repetidas en una sola con variaciones.
Además, analizan la secuencia para encontrar motivos similares a otras proteínas, como sitios de unión, centros activos, ... y buscan información bibliográfica sobre la proteína. Así, acaban elaborando una entrada en SwissProt con toda la información conocida sobre la proteína.
Búsqueda de secuencias similares Las bases de datos de secuencias de proteínas tienen habitualmente ayudas para, entre otras cosas, localizar proteínas similares a la proteína en cuestión. Una de estas ayudas de búsqueda es BLAST.
Por tanto, es posible realizar una búsqueda de proteínas similares a la que nos interesa. BLAST localiza las secuencias de nuestra proteína que se parezcan a otras proteínas ya secuenciadas.
La herramienta asigna una serie de valores que nos indican cuánto son de similares dos proteínas: - Identidad (Identity): indica el % de aminoácidos que son iguales en la región señalada.
- E-value: probabilidad de obtener un alineamiento igual de bueno por casualidad . Cuando menor sea el E-value, mejor es el alineamiento en cuestión, es decir, las proteínas estarán evolutivamente relacionadas.
- Puntuación (Score): valor obtenido a partir del análisis mediante una matriz. Al realizar los alineamientos, BLAST trabaja con una matriz (como la que se muestra en la imagen) que va dando diferentes scores o puntuaciones en función de los aminoácidos que se encuentran en cada posición (compara el aminoácido de nuestra proteína con el aminoácido de la proteína similar en cada posición). La suma de todos los valores da el score. El valor del score da información sobre cuánto están las proteínas relacionadas evolutivamente. Por ejemplo, considera un alineamiento positivo cuando el cambio (de un aminoácido por otro) está indicado como valor positivo en la matriz.
9 Estructura de proteínas El signo del alineamiento no depende del carácter de los aminoácidos, ya que se puede tener valores positivos en cambios de un aa ácido por un aa básico.
Hay diversas matrices de este tipo, desarrolladas por bioinformáticos que han estudiado los cambios que, evolutivamente se han producido con mayor frecuencia (los cambios menos comunes tendrán asignados valores negativos).
Para llevar a cabo un alineamiento o comparación más funcional pueden ponerse puntos para representar los alineamientos (como puede verse en la imagen): cuando hay un solo punto indica que estamos ante aminoácidos del mismo tipo:; dos puntos indican identidad.
10 2º C. Biomédicas (UdL) Irene LV Conceptos de homología y similitud Dos proteínas HOMÓLOGAS, en un principio, son dos proteínas relacionadas evolutivamente.
Dos proteínas SIMILARES se parecen, sin necesidad de relación evolutiva.
En la práctica, hay muy poca diferencia entre estos conceptos ya que dos proteínas muy similares suelen ser homólogas.
Dos proteínas homólogas no siempre realizan la misma función. Existe un término para proteínas que, bien en organismos diferentes o bien en tejidos diferentes, realizan la misma función: proteínas ORTÓLOGAS. Éstas también pueden ser homólogas (dos proteínas pueden tener la misma función por estar evolutivamente relacionadas).
Por otro lado, tenemos las proteínas PARÁLOGAS: se trata de proteínas, que en principio se encuentran en un mismo organismo, que son homólogas pero no realizan la misma función.
Plegamiento de proteínas: de la estructura secundaria a los dominios Las estructuras secundarias más conocidas son la hélice α y la hoja β.
HÉLICE α Los aminoácidos se encuentran en disposición helicoidal.
Esta estructura se estabiliza a través de puentes de hidrógeno entre grupos carbonilo y NH.
Una peculiaridad de la hélice α es que las cadenas laterales de los aminoácidos sobresalen hacia el exterior (mientras que el esqueleto de queda en el interior de la hélice).
Hay 3,6 aminoácidos por vuelta.
En principio, la hélice α tiene aminoácidos que encajan mejor y se encuentran con mayor frecuencia  aminoácidos α-helix friendly. Estos aminoácidos son A (alanina), E (ácido glutámico), L (leucina), M (metionina).
11 Estructura de proteínas Por el contrario, hay aminoácidos que raramente se encuentran en esta disposición espacial, los aminoácidos non- α-helix friendly: P (prolina), G (glicina), Y (tirosina), S (serina).
La prolina por ejemplo, provoca una torsión ya que, por su disposición, no se pueden formar los puentes de H.
La hélice α fue descubierta por Linus Pauling (Premio Nobel de Química; Premio Nobel de la Paz).
De forma estricta, la hélice α es dextrógira pero, en una pequeña proporción pueden montarse de forma levógira (normalmente, son trozos muy cortos de la proteína los que presentan esta disposición).
Cuando las hélices giran hacia la derecha, la cadena lateral queda en un espacio relativamente vacío en el giro que hace cada aminoácido respecto al siguiente. Es decir, el C queda lejos del O.
Cuando giran hacia la izquierda (hélice left handed), el átomo de C queda muy próximo al átomo de O.
Solo hay unos pocos aminoácidos que no molesten al oxígeno y, por tanto, que puedan presentar esta disposición - la mayoría de los aminoácidos provoca condicionantes estéricos.
12 2º C. Biomédicas (UdL) Irene LV También se han descrito dos tipos de hélices distintas: Hélice 310 - una vuelta cada tres aminoácidos.
Hélice pi - 4'4 aminoácidos por cada vuelta. Es aún más rara.
La nomenclatura de las hélices nos aporta información sobre su estructura: 310, 3,613 (hélice α normal), 4,416. El número principal se corresponde con los aminoácidos por vuelta y el subíndice corresponde con el número de átomos que hay entre los dos extremos de un puente de H.
HOJA O LÁMINA β Las cadenas de aminoácidos se disponen en paralelo y se establecen puentes de H entre los átomos de C (del C=O) y los H (de los N-H).
Las cadenas laterales salen hacia arriba y hacia abajo.
Las hojas β pueden ser: Paralelas Antiparalelas Mixtas 13 Estructura de proteínas Entre las estructuras secundarias y las terciarias encontramos: estructuras supersecundarias, motivos, patrones de plegamiento y dominios. las definiciones de estos términos no quedan muy claras ya que no existe acuerdo sobre su uso.
Estructura supersecundaria Se trata de un tipo de organización concreta que se encuentra en diversas proteínas. Por ejemplo, la mano EF o EF hand, frecuente en dominios de unión a calcio.
Consiste (como puede verse en la imagen) en una hélice α seguida de un sitio de unión a calcio, una lámina β y finalmente otra hélice.
Dominio Dentro de una proteína, pueden distinguirse zonas distintas en función del plegamiento. Cada una de estas zonas constituye un dominio.
Las siguientes estructuras han sido definidas como estructuras supersecundarias, aunque no queda del todo claro cuál es el límite con el motivo.
- Coiled coil: consiste en dos hélices α enrolladas.
- Cremallera de leucinas: dos hélices α con una zona rica en leucina. Se trata de un sitio de unión al DNA.
- Barril β, estructura frecuente en porinas.
- Horquilla β: consiste en dos láminas β con una especie de giro entre ellas.
14 2º C. Biomédicas (UdL) Irene LV Según Michael G. Rossmann: - El dominio es una estructura con función específica que se puede encontrar en diferentes proteínas.
Dominios similares deben tener un origen evolutivo común.
- La estructura supersecundaria surgió para representar combinaciones de estructuras secundarias que pueden ser unidades de plegamiento fáciles, es decir, estructuras que se forman fácilmente.
Motivos y patrones de plegamiento son prácticamente sinónimos.
Un ejemplo de patrón de plegamiento es el plegamiento tioredoxina: Consiste en una seria de láminas β envueltas por hélices α. Se ha encontrado en muchas proteínas. Es una estructura a medio camino del dominio, de hecho, es prácticamente un dominio por sí misma: este motivo puede abarcar un dominio entero (es decir, constituir un dominio por sí mismo) o ser una parte de él.
En la siguiente imagen se muestra un esquema de la jerarquía a la que se tiende al hablar de estas estructuras a medio camino entre las estructuras secundarias y las terciarias: Esta es la tendencia general de la comunidad científica, aunque por ejemplo, Rossmann definió el motivo que lleva su nombre como un tipo de estructura supersecundaria.
15 Estructura de proteínas Dominios proteicos Vamos a profundizar más en el concepto de dominio.
En organismos procariotas, 2/3 de las proteínas contienen más de un dominio y existen, aproximadamente 400 tipos de dominios diferentes.
Cuando hablamos de organismos eucariotas esta cifra aumenta significativamente: 3/4 de las proteínas contienen más de un dominio y se han descrito aproximadamente 700 tipos de dominios diferentes.
Encontramos ejemplos de dominio en las inmunoglobulinas (Ig). Se trata de proteínas formadas por 4 cadenas: 2 cadenas pesadas y 2 cadenas ligeras, en las que se pueden distinguir muy bien los dominios.
Las cadenas pesadas tienen 4 dominios mientras que las cadenas ligeras tienen 2 dominios.
Cada dominio consta de hojas β dispuestas una al lado de la otra. Este dominio es conocido como dominio Ig ya que fue descrito por primera vez en estas proteínas, aunque hay proteínas con función diferente que tienen el mismo tipo de estructura.
Las proteínas suelen tener diversos dominios de distinto tipo - parece que estén formadas por la combinación de distintas piezas. Parece como si a lo largo de la evolución se hubieran combinado los distintos tipos de dominios para formar las proteínas.
Partimos de proteínas primigenias con un solo dominio y función determinada. A lo largo de la evolución, por la fusión de estas proteínas primigenias, ha surgido una proteína con dos dominios. Además, las proteínas han podido duplicar sus dominios, pudiendo aparecer mutaciones que confieran a éstos distintas propiedades (cuando uno de los dominios ya cumple con la función que le toca, el otro está disponible para mutar y experimentar variaciones).
16 2º C. Biomédicas (UdL) Irene LV Por ejemplo, la proteína Yhb1 de S. cerevisiae tiene tres dominios.
Podemos buscar en BLAST secuencias que se le parezcan:  Si buscamos contra bacterias (partimos de Yhb1, una proteína de levadura) encontramos proteínas que se parecen en la totalidad de la proteína, es decir, en toda la secuencia.
 Al buscar contra humanos, encontramos que esta proteína es similar a dominios de proteínas humanas, no a proteínas enteras.
Por tanto, podemos deducir que, a lo largo de la evolución, la proteína bacteriana se ha conservado en levaduras y en los humanos se han conservado algunos dominios.
Otro ejemplo: proteína Grx4 de levadura (de S. cerevisiae). Esta proteína tiene dos dominios: uno similar a tioredoxina y otro similar a glutaredoxina. Estructuralmente, la proteína resulta como una fusión de dos proteínas.
17 Estructura de proteínas TÉCNICAS DE ANÁLISIS DE LA ESTRUCTURA DE PROTEÍNAS Existen unos pasos a seguir para poder deducir la estructura secundaria de las proteínas. En primer lugar, la proteína se clona y se expresa en algún organismo. Después, la proteína expresada por el organismo se purifica.
A partir de la proteína purificada se puede intentar resolver la estructura. Existen dos aproximaciones: Cristalografía de rayos X Resonancia magnética Además, se puede aplicar un atajo que permite conocer la estructura sin expresar la proteína en un organismo: la modelización in silico, a través de programas informáticos. Este tipo de modelización no siempre funciona.
Una vez conocida la estructura de la proteína, estos datos se depositan en bases de datos como PBD (Protein Data Bank).Hay básicamente tres bases de datos: la americana (RCSB PBD), la europea (PBDe) y la japonesa (PBDj).
Todas las estructuras conocidas acaban formando parte de las tres bases de datos.
PBD es más que un repositorio de estructuras de proteínas, ya que podemos encontrar material didáctico, revisiones de proteínas, etc.
Al buscar una proteína, encontramos todas las estructuras que se han enviado de la proteína , es decir, las estructuras no se agrupan como ocurre en SwissProt. En cada proteína aparecen muchas estructuras, ya que muchos investigadores se han dedicado a investigar una misma proteína y a resolver su estructura. Junto con las diversas estructuras encontradas para la misma proteína, también encontramos por ejemplo, la imagen de la estructura de la proteína enganchada a un inhibidor. Por tanto, podemos encontrar entradas sobre cosas relacionadas con la proteína (interacción con inhibidores, interacción con ligandos, …).
La cantidad de estructuras nuevas que aparece cada año no ha aumentado tanto como se esperaba en un principio. Esto se debe a que, resolver estructuras es más complejo de lo que parece. Además, las estructuras más básicas ya han sido resueltas, por lo que quedan sin resolver aquellas estructuras más complejas.
18 2º C. Biomédicas (UdL) Irene LV Entre los extras divulgativos podemos encontrar por ejemplo, la molécula del mes.
CRISTALOGRAFÍA DE RAYOS X Se basa en aprovechar una fuente de rayos X con la que se irradia un cristal de proteína. Es necesario ver separados elementos que realmente están separados por muy pocos Amstrongs. Como ya sabemos, para ver estructuras muy pequeñas, se necesita una longitud de onda (λ) muy pequeña, por lo que los rayos X resultan una radiación apropiada para ello.
Las proteínas deben estar cristalizadas (formando un cristal) para que estén más quietas.
Cuando las radiaciones impactan en las zonas donde hay densidad electrónica son bifractadas y quedan grabadas en un film. Se calcula cómo se han desviado las trayectorias para deducir un mapa de densidad electrónica o mapa de carga; así, se sitúan los electrones en el espacio.
El principal problema es el problema de fase: la interpretación del film para transformar esta información en un mapa de densidad. Existen distintas maneras de resolverlo: - Incluyendo metales pesados, de gran densidad electrónica, en la estructura. Éstos actúan como referencia y permiten cuadrar los números. Es por esto por lo que, en las estructuras de los PBD podemos encontrar átomos de algún metal en proteínas que no los necesitan como cofactor.
- Jugado con diferentes longitudes de onda y diferentes ángulos.
-… 19 Estructura de proteínas Cristalización de proteínas Cristalizar la proteína no es sencillo: hay proteínas que cristalizan muy fácilmente pero otras presentan anaritas1993@hotmail.comUn método empleado para cristalizar es el hanging-drop method: consiste en situar un reservorio con un líquido, un disolvente, que tapan con material de vidrio. Se pone en el vidrio (de la manera en la que se muestra en la imagen) una gota con la solución de la proteína muy pura. El disolvente se va evaporando poco a poco, haciendo que la solución de proteína pierda agua hasta llegar a la supersaturación. Esto promueve la formación de cristales.
Es muy importante tener muy controlada la temperatura.
Determinadas proteínas, que presentan una gran dificultad para cristalizar se han intentado cristalizar a bordo de estaciones espaciales.
En la imagen podemos ver el resultado de la cristalización de diferentes proteínas. Como podemos comprobar, las proteínas cristalizadas presentan estructuras muy diversas.
Fuentes de rayos X 20 2º C. Biomédicas (UdL) Irene LV Como ya se ha comentado, para obtener datos el cristal de proteína debe ser irradiado con un haz de rayos X monocromático.
La más frecuente es el ánodo rotador. Con esta fuente es necesario que los cristales de proteína sean muy grandes.
Desde hace unos años se han comenzado a emplear los sincontrones. Se trata de generadores de electrones. Se genera una radiación, un tipo de luz que puede filtrarse para obtener una longitud de onda concreta - se han conseguido filtrar rayos X que pueden ser utilizados para irradiar los cristales de proteína. El uso del sincotrón permite usar cristales de menor tamaño.
Lo último que ha salido en lo que respecta a las fuentes de rayos X es una fuente basada en un láser - Femtosecond nanocrystallography. Por otro lado, aparte de este láser, este método consiste en generar un rayo en el que se envía una solución con cristales pequeños (nanocristales) de proteínas.
Es decir, por un lado hay un láser que envía rayos X y por otro hay un flujo de cristales de proteína. Esta técnica representa una gran ventaja frente al ánodo rotador y los sincotrones ya que permite utilizar cristales muy pequeños.
Las primeras proteínas resueltas (de las que se conoció la estructura) fueron la hemoglobina y la mioglobina.
La resolución con la que se resuelven las proteínas se mide en Å (Amstrongs). Cuanto más bajo sea el valor, mejor, ya que este valor indica la mínima distancia entre dos átomos que ha sido posible diferenciar.
En la siguiente tabla se muestra qué puede verse de forma correcta a diferentes resoluciones: 21 Estructura de proteínas Estructura Resolución (Amstrongs) 5Å 3Å 2,5 Å 2Å 1,5 Å Esqueleto - Débil Bien Bien Bien Secundaria Débil Débil Bien Bien Bien Conformación cadenas laterales - - Débil Bien Bien Átomos hidrógeno visibles - - - Bien - RESONANCIA MAGNÉTICA NUCLEAR Se trata de una técnica con muchas utilidades. En química y bioquímica permite analizar proteínas pequeñas en solución, es decir, NO hace falta cristalizar, lo que representa una gran ventaja La principal desventaja de esta técnica es el tamaño: no es posible analizar proteínas grandes, por lo que puede aplicarse en un número relativamente bajo de proteínas.
Se basa en el espín o momento magnético de determinados núcleos. Cada partícula subatómica (protón, neutrón, electrón) tiene un momento magnético. A nivel del núcleo (donde hay protones y neutrones) ocurre lo siguiente: si tenemos un número par de neutrones y protones el espín total es 0, por lo que no puede hacerse resonancia magnética nuclear.
Cuando la suma de protones y neutrones es impar sí puede emplearse esta técnica . Los protones pueden tener espín 1/2 o -1/2. Energéticamente, ambos estados (1/2 y -1/2) son indiferentes.
Cuando la muestra es sometida a un campo magnético, dejan de serlo ya que, uno de los dos estará energéticamente a favor del campo magnético (posición favorecida) y el otro, estará en contra (posición desfavorecida). El espín se encarará o posicionará en un sentido u otro (en función de su signo) a no ser que le proporcionemos la energía suficiente que le haga cambiar - debe ser la energía justa (ni mucho ni poco).
En la siguiente tabla se muestra el nivel energético del espín de un protón en función del campo magnético (Teslas).
Como podemos observar, cuando no hay campo magnético, ambos espines tienen la misma energía.
Cuando se aplica un campo magnético aparecen diferencias, que van ampliándose conforme aumenta el campo magnético.
A un determinado campo, estaremos suministrando la energía justa al núcleo para que entre en resonancia. El núcleo absorbe la energía y cambia el espín (tal y como se ha explicado anteriormente).
22 2º C. Biomédicas (UdL) Irene LV El campo magnético se puede hacer variar por lo que habrá un momento en que los protones absorban la energía y esta absorción podrá ser captada. Cada protón absorberá a una intensidad de radiofrecuencia distinta.
Como es el caso de las proteínas, tenemos los H dentro de una molécula, la energía absorbida por estos H dependerá de su entorno.
Cada molécula tendrá un patrón de absorción característico: cada molécula absorbe a diferentes intensidades de campo magnético, por lo que es posible identificar las diferentes sustancias. En la imagen siguiente se muestra el patrón de absorción del etanol.
Se utiliza el concepto de Chemical Shift para estandarizar entre diferentes aparatos o condiciones.
Es la diferencia (en ppm) entre el valor de un compuesto de referencia y el problema.
23 Estructura de proteínas Los picos representan un H con su entorno. De este gráfico no se puede extraer información espacial, por lo que no es suficiente para resolver la estructura de la proteína. En proteínas, la resonancia magnética unidireccional puede permitir comparar diferentes condiciones.
Para tratar de resolver la estructura de la proteína se emplea resonancia magnética nuclear bidireccional. Existen diferentes maneras de aplicar la resonancia magnética bidireccional, aunque la más común en la llamada 2D NOESY.
Esta técnica representa un efecto que se produce cuando se magnetiza un átomo. La magnetización se transfiere del núcleo excitado a los átomos próximos (no excitados) permitiendo obtener con este tipo de aproximaciones más información espacial. Este efecto es conocido como Efecto Nuclear Overhauser (NOE): una interacción entre núcleos proporcional a la distancia entre los protones.
Cuando se realiza una resonancia magnética bidireccional obtenemos una señal por cada uno de los H excitados y señales adicionales provenientes de los H próximos, por lo que acabamos obteniendo una gran cantidad de señales.
Estas técnicas también pueden servir para detectar cambios en la estructura de la proteína tras un estímulo.
Existen otros tipos de resonancia magnética en 2D, como COSY (correlation spectroscopy), que también se basa en el efecto de unos H sobre los H próximos. La diferencia es que COSY busca la distancia en cantidad de enlaces 24 2º C. Biomédicas (UdL) Irene LV covalentes que hay entre los H, es decir, mide los átomos de H unidos covalentemente entre otros dos átomos.
Resonancia magnética nuclear en 3D y 4D Se trabaja con otros núcleos distintos del H, como por ejemplo, N o C. Para trabajar con estos átomos debe incluirse un isótopo pesado ya que la base de estas técnicas de resonancia magnética (para que esto se pueda detectar) es que la suma de protones y neutrones resulte un número impar.
 Si se incluye uno de los dos, es decir, o C o N (13C o 15N) hablamos de resonancia magnética en 3D.
 Si se incluyen ambos átomos hablamos de resonancia magnética cuatridimensional.
Como ya se ha comentado, la resonancia magnética nuclear se realiza con proteínas en solución. Al no estar cristalizadas se trata de estructuras dinámicas. La resonancia magnética nuclear detecta estos movimientos por lo que las proteínas resueltas por RMN presentan múltiples capas (layers). Toda la información obtenida del estudio de la proteína en sus distintos estados conformacionales se superponen, resultando esta estructura con capas que se puede ver en la imagen.
A veces también interesa detectar si la estructura de la proteína ha sufrido cambios por ejemplo al añadir un ligando o un inhibidor, en lugar de resolver toda la estructura.
Otras ayudas espectroscópicas para analizar cambios en la estructura de proteínas: 1. DICROISMO CIRCULAR Se basa en que cualquier molécula quiral absorbe de forma diferente luz polarizada circularmente hacia la derecha o hacia la izquierda.
Existen sistemas ópticos para hacer la polarización de la luz de forma circular, pudiéndose polarizar hacia la izquierda o hacia la derecha.
Las moléculas no quirales absorben de igual manera la luz polarizada circularmente, ya esté polarizada hacia la derecha o hacia la izquierda.
Por el contrario, las proteínas quirales sí presentan diferencias de absorción en función del sentido de polarización circular.
Las proteínas están llenas de moléculas quirales, por lo que podemos medir la absorción de la luz polarizada hacia la derecha y hacia la izquierda a diferentes longitudes de onda. En función de la estructura secundaria de la proteína, ésta presentará unas diferencias entre luz polarizada hacia la derecha y hacia la izquierda distintas (características).
En la siguiente gráfica podemos observar como las distintas estructuras secundarias (hélice α, lámina β, giros, …) presentan distintos patrones de absorción.
25 Estructura de proteínas Esta técnica se emplea para observar si hay cambios en la estructura de la proteína. Por ejemplo, si al crear un mutante obtenemos un espectro idéntico en proteína salvaje y proteína mutante la mutación no ha afectado a la estructura (aunque puede haber afectado a la función). La siguiente gráfica es un ejemplo de cómo pueden estudiarse los cambios conformacionales que sufre la proteína al unirse a un cofactor o a un ligando: cada curva representa el espectro de absorción de la misma proteína con diferentes concentraciones de cobre.
26 2º C. Biomédicas (UdL) Irene LV 2. ESPECTROSCOPÍA DE FLUORESCENCIA o espectrofluorometría Esta técnica emplea un fluorímetro que es un aparato muy similar al espectrofotómetro que mide fluorescencia. Se basa en la propiedad que tienen algunos compuestos de emitir luz a una longitud de onda distinta a la de la luz que absorben (con la que son irradiados). No todos los compuestos tienen esta capacidad.
El fluorímetro tiene una lámpara con la que excita la muestra. Los rayos atraviesan un monocromador que filtra la luz para que ésta tenga una longitud de onda determinada (que nosotros seleccionamos).
La muestra absorbe la luz y, si tiene capacidad de hacerlo, emite fluorescencia (emite luz a una longitud de onda distinta), que se detecta con un detector. Se puede medir la intensidad de fluorescencia a diferentes longitudes de onda.
Sobre todo dos aminoácidos son los que presentan fluorescencia: triptófano y tirosina (trp es el que más fluorescencia emite de los dos).
En las proteínas se produce el siguiente fenómeno: la fluorescencia puede variar en función de la estructura de la proteína. La molécula emitirá menos fluorescencia si los aminoácidos triptófano y tirosina (que son los que más fluorescencia emiten) se encuentran ocultos en el interior de la molécula. Por el contrario, si los aminoácidos que emiten fluorescencia se encuentran muy expuestos, la proteína emitirá fluorescencia con mayor intensidad.
Esta técnica se utiliza para comprobar si la función de la proteína provoca cambios en su estructura.
En la gráfica se muestran los cambios e la proteína αB cristalina en presencia y ausencia de ATP.
27 Estructura de proteínas También se usa para comparar distintos mutantes de una misma proteína.
Como se ha dicho anteriormente, existe una forma de conocer la estructura de la proteína sin necesidad de tener que expresar dicha proteína en un organismo: la modelización in silico, que se realiza a través de programas informáticos.
Gracias a ayudas informáticas, es posible deducir la estructura de la proteína a partir de su secuencia.
Hay dos maneras de hacerlo: - Por comparación: se intenta comparar con estructuras que ya se conocen.
- Ab initio (sin comparar con ninguna otra proteína) Se asume que la información de la estructura de la proteína se encuentra en su secuencia, es decir, que la secuencia determina el plegamiento. La proteínas buscan la conformación o plegamiento en la que se encuentran más cómodas, que es aquel de mínima energía y que depende de la estructura primaria.
La idea es que, con ayuda de herramientas informáticas de puede predecir cuál será este punto de mínima energía. Esto no es tan fácil ya que, el número de combinaciones posibles que se puede realizar con la secuencia de cada proteína es tan grande que la capacidad de computación no es suficiente.
Modelización por comparación (template-based modeling, homology modeling) Conociendo la secuencia se busca una secuencia similar en alguna proteína con estructura conocida. Cuantas más dificultades haya a la hora de encontrar una proteína parecida, más difícil será deducir la estructura (la proteína que se ha encontrado no se parecerá lo suficiente).
Cuanto más distinta sea la proteína modelo, habrá mayor error en la predicción. Por el contrario, como es lógico, cuanto más se parezcan las proteínas, el error será más bajo.
28 2º C. Biomédicas (UdL) Irene LV Para hacer un modelo de este tipo (es decir, para modelar por comparación) existen distintos software de modelización.
Además, es importante tener en cuenta el concepto de dominio a la hora de modelizar una proteína: cuando buscamos una proteína similar a la proteína con la que estamos trabajando, es difícil encontrar un proteína de estructura conocida que sea similar en la totalidad de la secuencia/estructura. Sin embargo, es más sencillo encontrar proteínas que se parezcan a los dominios de nuestra proteína (o dominios que se parezcan a los dominios) que tengan la estructura resuelta. Por tanto, deducir la estructura de los dominios por separado es una buena opción a la hora de modelizar la proteína y nos puede proporcionar resultados más exactos (si logramos ensamblar después las estructuras de los distintos dominios).
29 Estructura de proteínas En la base de datos "The Protein Model Portal" podemos encontrar estructuras de proteínas que ha hecho la gente mediante métodos de modelización comparativa.
En la imagen aparecen los resultados de la búsqueda de una proteína. La mayor parte de las estructuras deducidas por particulares han sido modelizadas por dominios (solo en tres casos se ha modelizado la proteína entera). Además, como puede verse en la imagen, son estas modelizaciones (hechas por dominios) las que han obtenido un mejor resultado.
Modelización Ab Initio (free modeling; predicción de novo) Existen diversas estrategias: - Por ejemplo, se puede intentar prever cuál será el punto de mínima energía. Para evitar tener que probar todas las combinaciones posibles, se intenta predecir el plegamiento de la proteína basándose en los campos de fuerza o en las hidrofobicidades.
Este método requiere una gran capacidad de computación, para lo que se recurre al uso de supercomputadoras.
- Folding at home (http://folding.stanford.edu/English/HomePage) Se trata de un programa de libre acceso en el que el propio ordenador va calculando los plegamientos de las proteínas en el momento en que deja de emplearse. Cuando el usuario no está utilizando el ordenador, el programa se conecta automáticamente.
- Para intentar minimizar el tiempo de computación se buscan fragmentos de unos cuantos aminoácidos que se parezcan a proteínas de secuencia conocida. Se supone que nuestra secuencia (corta) de aminoácidos tendrá la misma conformación. A este método de modelizar proteínas comparando múltiples secuencias cortas (con PBDs) se le llama Fragment Assembly.
- La última estrategia para modelizar proteínas Ab Initio es empelando la intuición humana. Con este fin se desarrolló el juego Foldit en el cual te van dando secuencias de péptidos en nivel de dificultad ascendente para tratar de deducir su estructura.
Además, existe una competición bianual de deducción de estructura de proteínas: CASP. En ella participan diversos grupos a los que se les da la secuencia de una proteína a partir de la cual, mediante el uso de programas informáticos, deben deducir la estructura. Los equipos que participan deben resolver 30 2º C. Biomédicas (UdL) Irene LV estructuras de dificultad ascendente (es decir, primero resuelven proteínas de estructura fácil y la dificultad de la estructura va aumentando). Las proteínas tienen estructuras similares resueltas.
En la siguiente imagen podemos ver la actuación de los equipos ante una proteína: En rojo aparece la estructura real de la proteína (resuelta de manera experimental) y en azul la predicción de los participantes.
Además en la gráfica se muestran los resultados (calidad del modelo) en función de los distintos algoritmos empleados para modelar la proteína (Rosetta y HHpred son los que mejores resultados obtienen).
ESTRATEGIAS DE CUANTIFICACIÓN DE PROTEÍNAS La cuantificación consiste en saber la cantidad de proteína total que contiene una muestra. Existen varias formas de hacerlo; las más importantes son las que se muestran en siguiente esquema: 31 Estructura de proteínas El análisis de aminoácidos no es una técnica que se haga de rutina, por lo que no vamos a hablar de ella.
- Análisis colorimétrico o fluorimétrico A la proteína se le añade un reactivo que reaccione con ella . En las condiciones adecuadas se producirá la reacción y aparecerá un producto que emite luz a una longitud de onda determinada. En los métodos fluorimétricos la proteína reacciona con un fluoróforo y emite fluorescencia.
Estas técnicas de análisis se tratan del método más habitual.
El reactivo de Biuret se utiliza para detectar la presencia de proteínas, péptidos u otros compuestos con al menos dos enlaces peptídicos en sustancias de composición desconocida. El reactivo es de color azul, cambia a color violeta en presencia de proteínas y vira a rosa al combinarse con péptidos de cadena corta.
El ensayo de Biuret es un método colorimétrico que permite determinar la concentración de proteínas en una muestra.
Por otro lado, tenemos el método de Bradford que se basa en la unión del colorante Comassie brilliant blue G-250 a las proteínas. El reactivo de Bradford es hidrofóbico, por lo que reaccionará con los aminoácidos hidrofóbicos de la proteína.
A partir de los resultados que se obtienen con estos reactivos se elabora una recta patrón.
En estos métodos, hay varios compuestos que pueden interferir como por ejemplo, el SDS.
En la siguiente imagen se muestra una lista elaborada por BioRad (que emplea el método de Bradford) con las sustancias o las concentraciones que no se pueden medir.
32 2º C. Biomédicas (UdL) Irene LV Cabe destacar que se trata de ensayos que no tienen la verdad absoluta. Esto puede comprobarse en la siguiente tabla, en la que podemos observar que se obtienen resultados distintos al medir la misma cantidad de proteína (a concentración de 10mg/ml) con los distintos métodos (Biuret, Lowry o Bradford, que es el método que usan en Bio-Rad).
Los ensayos con estos reactivos se basan en la reacción de un compuesto con enlace peptídico, aminoácidos aromáticos, zonas hidrofóbicas, etc. pero no todas las proteínas son iguales. Esto implica que la reactividad de cada proteína será diferente. Por tanto, estos ensayos van muy bien para comparar entre muestras pero no tanto para saber cuánta proteína hay (el resultado no da una cuantificación absoluta).
- Ayudas espectroscópicas: radiación UV y radiación infrarroja Se aprovecha la capacidad de que tienen las proteínas de absorber determinadas radiaciones electromagnéticas. Los aminoácidos no absorben la luz en la región visible (por eso no los podemos ver) pero sí en la región UV y en la región infrarroja.
Radiación UV Como ya se ha comentado anteriormente, son los aminoácidos aromáticos los que absorben radiación UV (los nucleótidos por ejemplo también tienen esta capacidad).
En el espectrofotómetro la muestra es atravesada por rayos de luz y se mide la cantidad de luz que la muestra no absorbe. El espectrofotómetro puede ser e luz visible o de luz no visible, que permite emitir luz UV (280nm). Esto permite conocer la concentración de la proteína: C= ABS ε 33 Estructura de proteínas Esta técnica presenta problemas: Puede funcionar con proteína pura pero, cuando tenemos un lisado tenemos también DNA y otros elementos que también absorben luz UV y que, por tanto, interfieren en el resultado.
 La ventaja es que nos permite trabajar con SDS.
En el otro extremo del espectro visible encontramos la radiación infrarroja Prácticamente todos los tipos de enlaces tienen capacidad de absorber en esta zona del espectro.
Las energías asociadas con la radiación infrarroja inducen excitación vibratoria de los átomos y grupos que se encuentran unidos covalentemente. La energía de las radiaciones de esta región puede ser absorbida por los enlaces en una región característica de cada tipo de enlace (y por tanto, característica de cada tipo de molécula) lo que nos puede permitir identificar/distinguir las moléculas en función del patrón de absorción.
El enlace amida (el enlace peptídico corresponde a este tipo) entre un grupo carbonil y una amina presenta una zona de absorción característica en la zona infrarroja: resultan dos picos de absorción ya que se producen vibraciones en dos puntos del enlace. La altura del pico es proporcional a la cantidad de enlace, y por tanto de proteína, de la muestra. La cantidad de absorción se puede aprovechar para medir la cantidad de proteína en una sustancia con un menor número de interferencias, ya que moléculas como nucleótidos o detergentes no absorben a esta longitud de onda.
*Los espectofotómetros no tienen capacidad de emitir a estas longitudes de onda, por lo que hay que recurrir a aparatos especiales.
34 ...