Tema 7 (2014)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Bioquímica - 2º curso
Asignatura Química i Enginyeria de proteïnes
Año del apunte 2014
Páginas 29
Fecha de subida 14/10/2014
Descargas 30
Subido por

Vista previa del texto

Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 ENGINYERIA DE PROTEÏNES I DISSENY CONCEPTES DE ENGINYERIA DE PROTEÏNES I DISSENY PROTEIC Aquests dos conceptes són conceptes totalment diferents:  Enginyeria de proteïnes: són processos que implica modificar la proteïna, normalment modifiquem la seva seqüència natural i com que sabem que la seqüència codifica l’estructura podem relacionar aquests canvis amb funcions, és a dir, podem canviar la funcionalitat.
 Disseny proteic: són processos relacionats amb la síntesis de novo d’una proteïna e manera que hem de dissenyar-a completament o bé una part de la proteïna que no existeix a la natura per tal de trobar una funció determinada.
La relació que s’estableix entre els dos camps és que tot el disseny proteic necessita d’enginyeria.
CICLE DE L’ENGINYERIA Els dos processos esmentats anteriorment són difícils i mai no encertaràs a la primera amb allò que vols. Existeix el que denominem el cicle de l’enginyeria: Necessito conèixer al màxim l’estructura de la proteïna, necessito tenir un clon que contingui el seu cDNA (perquè d’una altra manera no el podré expressar) i necessito tenir la seqüència del gen.
1 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 La informació que presenta el gràfic anterior és molt important i val la pena passar-se mesos recavant informació per després no perdre-la en els següents passos. Una vegada tinc aquesta informació, la conec, he de prendre una decisió. He de decidir quins canvis vull fer. Aquests canvis d’aminoàcids els faré sempre en el DNA, perquè després expressaré una proteïna que tingui una seqüència gènica modificada, el que m’expressarà una proteïna modificada.
Introduiré aquests canvis, això és el què s’anomena mutagènesi dirigida (vol dir fer els passos de disseny necessaris per canviar l’aminoàcid que jo vull i modificar de manera específica). Aquest gen l’expresso normalment en un organisme senzill (normalment una bactèria o un llevat, tot i que també puc fer-ho amb cèl·lules de mamífer, de retrovirus... Normalment és un organisme que jo pugui controlar) i purifico la proteïna. Ara tenim tècniques de purificació molt senzilles, com la cua d’histidina, que consisteix en addicionar sis histidines al final de la seqüència proteica, aquestes sis histidines queden els bivalents, el coure sobre tot, i tinc columnes carregades amb coure i la proteïna queda enganxada. Com que no hi ha cap proteïna natural que tingui sis histidines consecutives, només s’enganxa la meva proteïna.
Faig anàlisi estructural i funcional i miro si he aconseguit allò que volia, generalment no ho aconsegueixo a la primera vegada e intento eliminar els errors comesos anteriorment; algunes mutacions em permetran aprendre, d’altres no em permetran aprendre res. tornem a re-dissenyar un nou exeperiment. i aquest cicle el puc repetir tantes vegades (límit econòmic).
Decisions sobre els reemplaçaments a efectuar Anem a veure una mica de decisions que us poden ajudar a re-dissenyar. En primer lloc heu de decidir quins tipus de canvis voleu introduir i essencialment tindreu dos tipus de canvis:  Conservador: consisteix en canviar un aminoàcid per un altre que tingui propietats similars, però que sospiteu que a nivell global dóna avantatges (ex. alanina per valina per augmentar la hidrofobicitat del nucli).
 Disjuntor / transductors: normalment es fan per provar una propietat (ex. veure si Val 35 és important; la canvio per una alanina i fem un canvi pertorbador que fa perdre una propietat i veure com afecta, per exemple, en el plegament).
Quan hem de re-dissenyar i no volem fer canvis pertorbadors, hem de saber que sempre que puguem introduïm els canvis llaços, en els loops. De fet, no fem més que el que fa la natura, els canvis, les proteïnes, evolucionen essencialment per canvis en els loops. Les estructures secundàries regulars intentem no tocar-les ja que són el resultat de molts anys d’evolució.
Si els canvis són conservadors no només s’ha de mantenir el caràcter, sinó que també s’ha d’intentar mantenir la mida. Han d’intentar ser isostèrics. La mida és molt important, recordeu que quan avaluàvem els aminoàcids un dels criteris que avaluàvem era la mida. La mida és important perquè les proteïnes estan molt ben empaquetades.
Si canviem càrrega o polaritat hem de tenir en compte que això serà disjuntor, hem de decidir si ho volem realment fer o no.
Un canvi de càrrega o de polaritat normalment no serà innocu.
2 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Independentment que tingui estructura secundària regular o no, les regions molt conservades són difícils de modificar. En alguns casos, no sabem per què, però si aquesta regió no s’ha tocat en el llarg de l’evolució vol dir no que sigui difícil fer canvis, sinó que és difícil mantenir-los. En general, hi ha molt poques regles de compliment assegurat, això és una mica l’esperit. Una persona es considera que en sap quan porta uns deu anys treballant d’això.
En general hem de seguir aquestes decisions sobre els canvis a efectuar:  Decidir el tipus de canvi (conservador/pertorabador)  Determinar si el canfi pot afectar al plegament de la proteïna  Els canvis en els llaços o loops són tolerats millor  No convé desestabiltizar les estructures secundàries regulars  Convé elaborar canvis isostèrics  Els canvis de càrrega i polartiat solen ser més pertorbadors que els que ls mantenen  La modificació de regions molt conservadores és delicada Canvis freqüents  Aspàrtic per asparagina i glutàmic per glutamina: ens permet valorar de forma exclusiva el paper de la càrrega, ens permet saber que fa la càrrega negativa dins l’estructura  Cisteïna per serina o alanina. La cisteïna ens permet valorar el paper del pont disulfur. Quan canviem la cisteïna, normalment no en canviem una, sinó que canviem les dues del pont disulfur per no deixar cisteïnes lliures. Si el pont disulfur està amagat el canviarem per alanina, si està exposat per serina (recordem que la diferència entre els dos aminoàcids és que la serina té un grup –OH menter que la alanina no presenta aquest grup però si té la mateixa mida).
 Serina i tirosina per alanina. Normalment tirosina per fenilalanina per valorar només l’hidroxil en l’estructura  La histidina té molt pocs substituents perquè no hi ha teòricament cap aminoàcid equivalent, però els més neutres són glutamina i asparagina. Aquest canvi ens permet valorar el paper de l’anell d’imidazola.
En general, si no sabem per quin canviar canviem per alanina. L’alanina és el més modelable dels aminoàcids en el nostre cas.
3 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 FINALITATS DE L’ENGINYERIA DE PROTEÏNES L’enginyera de proteïnes té diverses finalitats:  Dissenyar proteïnes amb una certa funció: Puc voler dissenyar proteïnes amb una funció que no existeix o per generar una via que no existeix. És possible que hi hagi organismes que tinguin tots els enzims d’una via, però que els falti algun (intentar posar una proteïna amb aquesta funció).
 Alteració de la Km d’enzims, augmentar l’activitat: S’utilitza molt pels enzims, això és bastant fàcil, alterar la cadena dels enzims. Quan altero la cadena augmento l’afinitat pel substrat i fa que la reacció sigui més reactiva. És molt més fàcil alterar la Km que la velocitat.
 Alteració de l’estabilitat tèrmica o en front del pH: Una altra cosa que és molt freqüent que us demanin és canviar l’estabilitat tècnica o el front del pH. Per què es vol? Perquè moltes companyies fan processos a temperatures mitjanament elevades. Sabeu que les proteïnes són metastables. Això no vol dir que no puguin ser optimitzades, sinó que essencialment no han estat optimitzades.
 Obtenir enzims actius en medis no aquosos: Això és molt important. Sabeu que la majoria d’enzims treballen en medi aquós, però hi ha condicions en les quals ens interessen tenir enzims. És molt important en vessaments d’hidrocarburs per degradar hidrocarburs. En aquests vessaments s’estan explotant bacteris que expressen enzims capaços de treballar en un medi no aquós i degradar-los. Per això cal modificar la polaritat de la molècula, de manera que estigui còmoda en un medi no aquós.
 Modificar l’especificitat variant el lloc d’unió als substrats (molt semblant a l’alteració de la Km)  Augmentar la resistència a proteases cel·lulars: És molt important. Les proteases que trobem a l’organisme estan dissenyades per degradar proteïnes que no són nostres, per tant, fàrmacs proteics. Si puc augmentar la seva resistència a proteases augmento la seva vida mitja i augmento la duració o efectivitat del tractament.
 Alterar la regulació al·lostèrica: És una altra cosa molt venuda actualment. No consisteix en tocar el centre actiu, sinó que es tracta de tocar un centre secundari que modifica l’activitat de l’enzim. Això és molt bo perquè pots tocar l’enzim sense tocar a dins, el pots activar i inactivar.
4 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 EXEMPLES D’ENGINYERIA I DISSENY Exemple 1: només es coneix la seqüència de la proteïna a muntar El mínim que puc conèixer per fer enginyeria de proteïnes és la seqüència. Si no sé la seqüència no puc mutar res. Això vol dir que no només he de conèixer la seqüència de la proteïna, sinó que també cal conèixer la seqüència del gen.
Per fer els canvis els faré en el gen. Si conec només la seqüència de la proteïna tampoc tinc gaires problemes, perquè ara mateix jo puc demanar gens sintètics. Si vull expressar la proteïna en E. Coli, el què faig és dir-li a la companyia que vols una proteïna que sigui així i que et posi el codó d’E. Coli. I a on posa metionina a allà em posaran el codó més abundant en E. Coli.
De manera que en cada posició hi haurà el codó més abundant en Coli. Arginina és un cas molt clar, en el qual tenim un codó que és molt poc utilitzat en bacteris, però molt utilitzat en humans. Si jo colo la seqüència humana directament i l’expresso en bacteri, quan arribi en aquest codó tindré molts pocs anticodons. Per tant, la síntesi d’aquí s’atura?. Si muto això i ho canvio pel codó que fa servir el bacteri tirarà?. Però en general això no ho faig, a no ser que tingui un lloc crític codificat per un codó estrany. En general colo el gen i l’expresso.
Això és un treball on treballen amb glucanases (degraden fusta -> aplicació industrial) i tenien només seqüències. Tenien només aquestes seqüències i no hi havia cap estructura disponible en aquell moment, però ells tenien molt clara una cosa: pel mecanisme enzimàtic de la glucanasa al centre actiu hi ha d’haver un o més residus carregats negativament perquè el substrat té càrrega positiva. Aleshores, es van plantejar és que si mitjançant enginyeria de proteïnes podrien identificar el centre actiu de l’enzim, sense tenir idea dels residus implicats. Això conceptualment és fàcil, només cal mutar els residus glutàmic i aspàrtic. Van agafar aquesta seqüència d’aquí, la van alinear amb les d’altres espècies conegudes i van mirar quins residus carregats negativament estaven conservats.
5 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Aquells que estaven conservats en les espècies eren importants, però podien ser importants des del punt de vista estructural o des del punt de vista funcional. I així amb la seqüència és impossible saber-ho. Van mutar aspàrtic per asparagina i glutàmic per glutamina.
Hi ha un assaig que és molt maco, que és que això quan ho expressen en Coli aquesta proteïna secreta i surt del bacteri. Si tu tens el substrat a fora, el substrat té color vermell (en la imatge), quan es produeix aquesta proteïna, se secreta a fora, si això és la colònia de bacteris, la difusió de l’enzim fa que es mengi el substrat. Es queda un alus gran i l’enzim més funcional. Wild type, la proteïna original, és aquesta d’aquí (imatge).
El primer que han de comprovar és que els nivells d’expressió de totes les proteïnes, això és un Western (és una dimuro? detecció sobre una membrana en una electroforesis; tenyim amb un altre agent enlloc de tenyir amb cumàcid?). Heu de veure que les bandes tenen aproximadament la mateixa intensitat perquè pot ser que no tingueu activitat senzillament perquè no s’expressi. Per tant, sempre heu de comprovar que les proteïnes recombinants re-dissenyades s’expressen bé. Una vegada sé que la proteïna s’expressa igual, això té diferents mutants, el que fan és fer un assaig d’activitat. Fixeu-vos que l’únic que he de mirar és la mida de el alus. Fixeu-vos que glutàmic 134 per glutamina, 138 per glutamina, aspàrtic 136 per asparagina, fan que l’activitat sigui molt baixa. Els altres pràcticament no afecten l’activitat. D’aquesta manera és quan sabré que el centre actiu està definit en la regió 134-138.
Posteriorment es va resoldre l’estructura i es va veure que efectivament això és així. Faig canvis puntuals, després purifico l’enzim i miro l’activitat. Fixeu-vos que quan muten 134, 136 i 138 l’activitat és pràcticament nul·la, qualsevol d’ells és indispensable. És, de fet, la tríada catalítica, que uneixen el substrat. Els altres són estructurals, de manera que quan els canvio per asparagina pràcticament no passa res. Si jo sé quin tipus d’aminoàcid he de substituir, amb la seqüència en principi m’és suficient.
6 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Exemple 2: tenim informació 3D parcial Aquest exemple ja l’heu vist altres vegades, això és una pro-carboxipeptidasa. Això és el zinc (lila), l’enzim actiu i el pro-enzim.En aquest cas teníem aquesta estructura, però no teníem l’estructura de la proteïna amb la qual estàvem treballant, que és un homòleg d’aquesta. Estàvem fent re-disseny d’aquesta regió d’aquí, que és el domini d’activació (encerclat en lila). Com que és un domini el puc produir de forma recombinant i al llarg es plega, és soluble, és globular... El què es va fer és un model (el primer que fem és que si no tenim informació estructural fem un model). Es va fer un model de com la seqüència es plegaria en l’espai (això és un model basat en l’altre): Hi hauria unes fulles β (4) i dues hèlix molt grans. Com sabem la topologia, l’acumulem a sobre de l’estructura i a aquí la idea era fer re-disseny de proteïnes per canviar l’estabilitat. Fixeu-vos que en aquest cas jo no tinc els contactes moleculars, estic parlant només de cadena principal. Però com que en les estructures secundàries jo sé quins aminoàcids les afavoreixen i quins no, no em cal tenir els detalls a nivell de resolució atòmica. Si els tinc molt millor, però en aquest cas no em cal.
Què van fer? Van re-dissenyar les hèlix alfa. Sempre us he dit que és molt més fàcil predir hèlix alfa que beta, de la mateixa manera és molt més fàcil re-dissenyar alfes que beta. Com puc augmentar l’estabilitat d’una hèlix alfa? Augmentant les interaccions entre cadenes laterals. I això és el què van fer. A aquí hi havia una asparagina i una glutamina, que si estan properes és fantàstic, són molt bons, però si tinc una lisina i un glutàmic molt millor perquè formen pont salí i si estan a quatre posicions encara molt millor. I si aquest està a tres d’aquesta d’aquí també. Estic millorant les interaccions que són importants per millorar l’hèlix alfa (i+4, i+3). A aquí tinc una glutamina que va molt bé amb la lisina (perquè té càrrega, és polar), però si poso un glutàmic molt millor perquè forma un pont salí. Tinc valina, que no és un excel·lent formador d’alfa, però l’alanina sí que ho és i té la mida molt semblant i caràcter idèntic. Per tant, es tracta d’anar a aquelles taules i mirar quins són els millor residus de cada posició i com puc augmentar les interaccions i+3/i+4. Cada vegada que canvio un he de mirar què tinc al davant i què tinc al darrere, no sigui cas que en formi una i em carregui un altre.
7 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 REDISSENY DEL NUCLI HIDROFÒBIC DE LES PROTEÏNES Lisozim del bacteriòfag T4 L’únic que faltava per redissenyar era el nucli hidrofòbic de la proteïna. La idea és que el que hem de fer amb el nucli és empaquetar-lo. Queden alguns forats que hem d’intentar evitar i que a partir de canvis en els aminoàcids, utilitzant uns més voluminosos, intentarem tapar.
Un dels redissenys del nucli hidrofòbic es va amb el lisozim del bacteriòfag T4. El resultat va ser que mutants que omplen les cavitats en el nucli hidrofòbic no estabilitzen significativament el lisozim. Això és degut que fer mutants puntuals en el nucli hidrofòbic és molt difícil ja que aquesta és una de les regions més conservades a les proteïnes. Així doncs, és molt difícil redissenyar un nucli hidrofòbic només tocant un o dos residus perquè està tot lligat.
Domini SH3 El redisseny del nucli hidrofòbic ha estat un problema fins que un té les eines que ens permeten modelar mutacions globalment, és a dir, totes a la vegada. El SH3 domini va ser el primer nucli hidrofòbic redissenyat. Aquest domini el trobem a l’espectrina.
A la imatge podem observar que el N i el C – terminal es troben a prop. Té un nucli hidrofòbic assequible, de 9 residus, de manera que els podem intentar canviar. En cada posició del nucli hidrofòbic podíem trobar: Val, Leu, Ile, Trp, Ala i Phe. Amb 6 això obtenim una combinació de 9 tipus de nuclis possibles, i 531.441 seqüències possibles.
No només volien redissenyar el nucli hidrofòbic sinó que també es preguntaven una altra cosa. Els nuclis hidrofòbics estan molt conservats de manera que són molt importants, la idea és que si les proteïnes actuals tenen el millor nucli hidrofòbic possible i que per això estan conservats o bé es tracta d’un nucli hidrofòbic qualsevol que és vàlid perquè és capaç de fer la funció. Per tant, la natura té dues opcions: tenir el millor nucli hidrofòbic possible o bé tenir un bon nucli hidrofòbic que faci la funció.
Es van realitzar la pregunta que qüestionava si hi ha nuclis hidrofòbics que no estan a la natura i que poden funcionar igual o millor que els que no hi són. Posteriorment veurem tècniques més noves per tal de saber això ja que experimentalment no podem fer mig milió de nuclis diferents.
Al grup de treball del nostre professor hi havia un algoritme anomenat PERLA que feia un algoritme mediant una modelació.
El que feia era mutar els residus del core per cada combinació i fer una minimització de l’energia teòrica i amb això obteníem una referència.
8 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Agafàvem seqüències no relacionades evolutivament amb les que trobem a la natura però que tinguessin energies similars a les del wild type. Escollint aquestes seqüències van elaborar un arbre evolutiu on les seqüències que trobem en vermell són les redissenyades. La proteïna original és la SPCA HUMAN que la veiem a la part superior de l’arbre.
Dels redissenys que eren estables només hi havia un que estava relacionat amb l’humà (MAX-W) i té aquest nom perquè conté el màxim de triptòfan possible.
Les proteïnes vermelles estan situades on estan perquè no s’assemblen en res. Mai no han estat vistes a la natura. Es van qüestionar si aquestes proteïnes redissenyades podien funcionar realment, ja que tenien una energia teòrica semblant al wild type.
Plegament de les proteïnes redissenyades Es va veure que les proteïnes redissenyades pleguen i tenen unes energies semblants al wild type.
Algunes de les proteïnes eren fins i tot una mica millor. De fet, es pot considera que totes són iguals. Així doncs, sí que existeixen nuclis hidrofòbics que no trobem a la natura i són iguals d’eficaços que els que sí que trobem.
9 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Podrien ser SH3- naturals Es van adonar que els mutants que havien fet s’assemblaven molt entre ells. Si ens fixem en a, b i c veiem que s’assemblen bastant però el d hi ha una part que no és igual. En aquests casos, la cadena principal s’ha mogut cap a fora i això vol dir que l’algoritme és bo però no és perfecte. (encerclat en verd).
Així doncs, l’algoritme ens dóna més empaquetament del que realment aguanta la proteïna, és a dir, diu que aguanta més coses del que realment hi cap. Els cores redissenyats en teoria són més hidrofòbics reals.
Concretament, l’algoritme s’equivoca d’un metil. Sabent això, la solució és molt fàcil: com que tenim isoleuciones el que farem és mutar-les a valina (aquests dos aminoàcids difereixen en un metil). Quan es produeix aquesta mutació el que obtenim és el tipus d on la cadena es col·loca en el lloc correcte.
Millor empaquetats que SH3- naturals En la imatge trobem un esbós del dibuix anterior. El A fa referència al wildtype, el B al segon mutant, el C al primer mutant i la D la que es va canviar una isoleucina a valina.
El core està més empaquetat al d més que cap en altre nucli a la natura de manera que ara hi cap perfectament.
10 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Funció de les proteïnes redissenyades Com a resultat van obtenir que totes les proteïnes són funcionals. Cal tenir present que si una proteïna és estabñe però no és funcional no és viable. Així doncs, es va assajar la funció de la proteïna que és unir triptòfan situat a la superfície d’uns pèptids. Quan s’uneix el pèptid, la florescència baixa ja que tapa el triptòfan.
Estabilitat de les proteïnes redissenyades Es va veure que els nous mutants són molt més estables que la forma original. Són diferents mutants d’isoleucina a valina. De manera que la resposta és clara: les proteïnes a la natura no tenen perquè tenir el millor nucli hidrofòbic.
Per tal d’aconseguir un millor nucli hidrofòbic han hagut d’empaquetar el core molt més de manera que les noves proteïnes pleguen més ràpidament que l’original ja que té més hidrofobicitat i per tant col·lapsa més ràpidament. El nou nucli hidrofòbic redissenyat no s’assembla al que trobem a la natura.
11 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 INTERRELACIÓ ESTRUCTURA LOCAL /ESTRUCTURA GLOBAL Experimentació amb el domini GB1 Amb aquest l’experiment següent volien mirar què és important per la formació d’una estructura secundaria. Ens fixem en una proteïna, concretament en el domini G. Es tracta d’una proteïna molt utlitzada en redisseny de proteïnes perquè té les dues estructures bàsiques tot i ser petita: és una alfa dormint en un llit de betes.
Volen saber si podem aconseguir que la alfa del mig es converteixi en una beta. Des del punt de vista teòric, només hem de canviar els residus que tenen propensitat d’alfa per uns que tenen propensitat a formar beta. Per tal de mirar la conversió d’alfa a beta es fa per dicroisme circular.
Es va fer una sèrie de mutacions assajades i es va resoldre la millor estructura de les variants que s’esperaven. A la imatge veiem en blau el wild type i en vermell el mutant. La imatge és d’estereoscòpia.
Veiem que tot i seleccionar els millors residus per ser una beta, continua sent una alfa. Això ens està indicant que l’estructura secundària no només depèn dels contactes locals sinó que també depèn de la topologia de la molècula i amb que contacte.
Així doncs, les cadenes laterals de la fulla beta, tal i com estan disposades faran que es formi una alfa.
La proteïna és molt poc estable ja que la hèlix alfa del mutant té tendència a ser beta i per tant la estabilitat és menor, concretament 20 KJ/mol menys estable.
D’això és va aprendre que és difícil canviar la natura i que els contactes locals condicionen l’estabilitat de la proteïna, però és la topologia del plegament natiu i els aminoàcids involucrats en les interaccions terciàries qui determina com serà el plegament final.
Cal tenir present que és més fàcil convertir una estructura totalment alfa a beta que d’una estructura determinada canviar un determinat element ja que està dissenyat perquè sigui d’una determinada manera.
12 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 ESTRATÈGIES GENERALS PER FER ENGINYERIA DE PROTEÏNES Hi ha dues estratègies generals per tal d’elaborar enginyeria de proteïnes. Per una banda tenim el disseny racional on se suposa que sabem de proteïnes o que tenim eines computacionals, com ara PERLA, que en saben de proteïnes.
L’altra estratègia és l’evolució dirigida que inclou mètodes combinatorials de llarg abast. Generen una gran quantitat de seqüències, fins a 10 milions de seqüències diferents. Requereixen d’alguna cosa que les seleccioni. Per exemple, generem 10.000 seqüències diferents i mirem quina s’uneix a l’anticòs. Amb aquestes tècniques no cal conèixer res, només cal fer una gran quantitat de mutants i després mirar quins són els que ens interessen.
Enginyeria de proteïnes utilitzant llibreries combinatorials Per fer enginyeria de proteïnes necessitem generar variabilitat, és a dir, moltes seqüències diferents. Quanta més variabilitat generem, com més gran sigui la llibreria de seqüències, més possibilitats tindrem d’escollir una bona proteïna. Cal tenir present que en aquest cas serà més difícil seleccionar-ho ja que hi ha una quantitat més gran.
Un cop tenim les diferents seqüències, necessitem un mètode de selecció que normalment sol ser la funció perquè és fàcil d’examinar. Avui dia no es pot seleccionar per estabilitat i disseny. Podem tenir un efecte a la mateixa proteïna on ho expressem o bé pot tenir un efecte in vitro, com per exemple la unió a una columna.
Imaginem un llevat que en certes condicions només viurà si té un enzim que catalitza la via de síntesi de glucòsids que el llevat no té. Generem seqüències de la proteïna motlle que nosaltres pensem que pot realitzar aquesta funció i li implantem al llevat. Si obtenim algun llevat que sobrevisqui serà perquè ho ha incorporat. Aconseguir això és molt difícil de manera que no se sol fer molt.
Generar variabilitat Mètode 1 per generar variabilitat: mutagènesi dirigida Quan volem mutagenitzar una regió determinada, no volem canviar tota la proteïna sinó que, per exemple, volem que la nova activitat aparegui en un loop. Aquesta funció la podem intentar redissenyar o fer-la per mètodes combinatorials. Farem servir mutagenesi dirigida.
El que fem és recórrer a una casa comercial i demanem que generin pèptids on en cada posició s’introdueixin les 4 bases a la barreja, en comptes de posar l’aminoàcid directament, de manera que en aquestes posicions tenim els 20 aminoàcids possibles.
Cal tenir present que mai no podem seleccionar per funció negativa ja que pot ser que haguem introduït un codó d’stop. Així doncs, tenim totes les combinacions possibles d’aminoàcids en totes les regions. Això si ho féssim en bacteris, cada un només tindria com a màxim una seqüència.
13 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Mètode 2 per generar variabilitat: error – prone PCR Quan volem generar variabilitat en una regió qualsevol de la proteïna, aleshores el que fem servir és un error – prone PCR. La PCR en fa errors però fa molt pocs. Tot i això podem posar la polimerasa en condicions en les quals s’equivoqui moltíssim. Per exemple, podem afegir sal, temperatura baixa... De manera que quan aquesta estigui copiant la seqüència original, s’equivoqui.
Com que les ampliacions son de 10 20 vegades, s’acumula un gran nombre de mutacions. De manera que el gen que tenim s’assembla a l’inicial però hi ha una acumulació de mutacions important.
Mètode 3 per generar variabilitat: DNA shuffling El error – prone PCR es pot complicar si una vegada hem fet les primeres amplificacions amb el mètode anterior el que fem és tallar-lo en trossos petits i fer que s’anellin entre ells de forma complementària. Al final de l’ampliació PCR, les dues cadenes estan mutades però són idèntiques, llavors el que podem aconseguir amb això és que encara hi hagi més variabilitat.
Amb l’error – prone podem aconseguir tenir 5 milions de mutacions diferents però les dues cadenes són iguals, però al fer el DNA shuffling no seran iguals i per tant obtindrem moltes més seqüències amb mutacions diferents.
Amb això aconseguirem moltes proteïnes, on la gran majoria tindran problemes: no seran funcionals, no plegaran, etc. Però pot ser generem alguna que sí que fa el que volem.
14 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Selecció de les seqüències que ens interessen Un cop hem generat variabilitat, hem de seleccionar les seqüències que ens interessen. El que fem és introduir les seqüències en bacteriòfags (no en bacteris). Recordem que el bacteriòfag té dos tipus de proteïnes a la seva coberta: per una banda proteïnes del tipus GIIIP, de les quals només hi ha 5 i després trobem GVII que es troben disposades a tota la coberta i hi ha unes 2700, que li permet unir-se al bacteri.
Podem seleccionar amb dos tipus de mètode: d’alta exposició o bé de baixa exposició.
En els dos casos el que fem és introduir plàsmids que ara codifiquen per fusions de la proteïna que el fag esposa a la superfície amb la nostra proteïna. Aleshores, forcem al fag a fer un dosplay de la nostra proteïna a la superfície. Trobarem que el fag tindrà moltes còpies de la nostra proteïna exposades a la superfície ja que el que estem fent és substituir la proteïna del fag natural per una proteïna de fusió que conté la del fag més la nostra, mirant cap enfora.
Cada fag l’haurem transformat amb un plasmidi i cadascun d’ells contindrà una variant, així doncs, tindrem una gran quantitat de fags. Cal tenir present que els plasmidis poden difererir en un únic aminoàcid.
A continuació realitzem un panneling, en el qual tenim una superfície on hi ha un lligand per la proteïna que volem. Fem passar els fags per la superfície, de manera que aquells que hagin generat una variant capaç d’unir-se a la proteïna d’interès, quedaran fixats i els altres seran rentats. Cal tenir present que els rentats es poden fer en condicions molt o poc restringents.
Normalment cal repetir el procés unes 6 o 7 vegades. Realment es com una cromatografia d’afinitat però amb el fag i també es pot fer en columna.
Un cop la proteïna està unida, el problema està en saber quina és aquesta proteïna. Amb un masses – masses no es pot fer ja que únicament tenim una còpia. La solució és amplificar els fags amb bacteris, de manera que codifiquem el plasmidi ja que si el fag s’amplifica, el plasmidi també ho fa.
Normalment, això fa falta fer-ho més d’una vegada. Se sol pannelar, infectar, es torna a pannelar en condicions més restringents i es torna a infectar, etc. En un principi s’uniran una gran quantitat de proteïnes i que a l’mplificar i al tornar a unir ho farà una menor quantitat. Amb això aconseguim quedar-nos amb els millors i extreure una seqüència consens.
Habitualment s’assemblen bastant i si no ho fan vol dir que aquell amionàcid no és important.
15 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Generació d’una proteïna que reconegui un nou substrat Imaginem que volem generar un enzim que reconegui un substrat que ningú pot reconèixer (TSA). Òbviament no podem ferho a la valenta, hem d’agafar algun enzim que mínimament pensem que té un centre actiu que sigui acomodoable a un substrat. Ja que generar-ho de nou és molt complex.
A continuació, generem un display. Tenim la proteïna del fag, la nostra proteïna i al mig col·loquem una seqüència que és tallable per una proteasa (proteolisi limitada). Una proteïna bona per fer aquest procediment podria ser factor X o trombina ja que poden ser tallats en un lloc específic.
Seguidament fem una matriu o una columna en la qual tenim covalentment unit el substrat, que és molt petit. Fem passar la llibreria de fags per la matriu. Pot ser que alguns dels mutants, dels quals desconeixem la seqüència, s’uneixin. A partir d’aquí tenim dues formes de seleccionar-los.
Primera manera de seleccionar els mutants: Baixa afinitat Per tal de seleccionar els que s’uneixen amb baixa afinitat el que hem de fer és competir-los. Anem passant el substrat de forma aïllada en la columna, anomenat substrat fred. Com que està a una concentració major que el que tenim unit, s’unirà al que passem i per tant, es desuneix de la columna.
El fag el posem a un bacteri i amb això aconseguim amplificar el mutant.
Segona manera de seleccionar els mutants: Alta afinitat En aquest mètode seguim tenint la mateixa construcció però en aquest cas, el susbtrat en comptes d’estar unit a la columna, està lliure. Aquest substrat lliure es troba unit a la biotina. Afegim a la solució la llibreria de fags, de manera que aquells que tinguin afinitat quedaran units al substrat i per tant, també tindran la biotina. Se sap que la interacció biotina – estreptavidina és una de les interaccions proteïna – proteïna més fortes que hi ha a la natura.
Seguidament fem passar això per una columna que té estreptavidina, de manera que s’unirà la biotina i el fag. A continuació eluim per competició o bé per proteases.
16 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 L’avantatge d’utilitzar aquesta manera és que el substrat l’afegim líquid. Això és un motiu, fonamentalment, econòmic ja que col·locar un substrat en solució marcat amb biotina és molt més barat que no fer una columna o una matriu amb un determinat substrat.
Les tècniques que veurem a continuació són tècniques molt bones i que no necessiten ni de bacteris ni de fags. Al final sempre hem de tenir una cosa a partir de la qual puguem seleccionar (anticòs, substrat...). Així doncs, tenim una columna per on sortirà el que volem.
Ribosome display En ribosome display el que fem és generar els vectors, una gran quantitat, però no els transforma ningú. En aquest cas el que fem és una transcripció in vitro. Tenim el vector i el que hem d’afegir és la polimerasa per tal de generar un missatger, com a mínim, per a cada vector. Aquest missatger té una propietat específica i és que el seu extrem 3’ és especial ja que està codificat al plasmidi.
El que fem és que in vitro col·loquem tota la maquinària de traducció i els ribosomes i es va llegint el nostre missatger i pel túnel anirà sortint la proteïna, com en un procés normal. Quan arriba a 3’ té una seqüència que fa que el mRNA quedi unit al ribosoma i això impedeix que la proteïna se’n vagi del ribosoma. Llavors tenim una construcció que conté: missatger + ribosoma + proteïna. Cal tenir present que ens ho muntarem de manera que la part que quedi unida al ribosoma no sigui important.
Amb aquest complex fem panneling contra un substrat o una columna. Algunes d’aquestes proteïnes s’uniran. Per tal de recuperar el fenotip el que fem és afegir un agent caotròpic que obrirà el ribosoma. Quan s’obre el ribosoma tenim el missatger de manera que a partir de retrotranscripció podem obtenir la seqüència i la PCR ens permetrà amplicar-la. Així doncs, amb aquest mètode no cal infectar a cap bacteri i es produeix molt ràpidament.
17 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 mRNA display El mRNA display és una tècnica millor que l’anterior. En aquest cas es fa servir una molècula que és estàndard, és a dir, igual per a qualsevol experiment. Aquesta molècula és puromycin linker (P). El que fem és unir P als nostres missatgers, dels quals hi ha una gran quantitat i els hem generat a partir de plàsmids o de cada DNA.
Hi ha una reacció química molt senzilla que els uneix i queda marcat. El resultat d’aquesta marca és que quan nosaltres llegim la seqüència i produïm la proteïna, la purimicina queda unida covalentment a l’extrem C- terminal de la proteïna. Ara ja podem desfer-nos del ribosoma ja que tenim la mateixa molècula. Així doncs, tenim: el missatger, un linker i la proteïna per la qual codifica el missatger.
A continuació fem transcripció inversa a partir de la qual obtenim el gen per amplificació. Aquest mètode és més ràpid fins i tot que l’anterior.
Exemple de display Actualment, la gent combina el disseny racional amb el display. Kunitz inhibitor és una BPTI (bovine pancreatic trypsin inhibitor). Aquesta proteïna no té un gran interès comercial ja que es pot purificar del pàncrees la vaca i la seva funció principal és inhibir la tripsina.
Tenim una molècula que està dissenyada per inhibir tripsina. Hi ha molècules diana que s’assemblen a la tripsina en estructura però no la reconeixen. De manera, que volen dissenyar el BPTI per inhibir dues proteïnes de la cascada de coagulació. Aquest és un exemple fàcil perquè sabem que l’activitat està en el loop taronja, per tant sabem que hi ha un loop que és reconegut per la proteasa. El que podem fer és redisseny per tal d’agafar l’estructura de la proteïna i del ppti i intentar redissenyar, tot i que és més pràctic fer display.
El que van fer és agafar dos inhibidors semblants al BPTI (per interès biotecnològic) i van fer feix display. En les posicions del primari binding loop i secundari loop deixem que hi hagi qualsevol cosa. Ara la nostra columna té kallikrein. La topologia ja fa que s’uneixi pel loop i això ens permet seleccionar la seqüència. La seqüència que seleccionen és la de Ki= 40 ·10 -12 M. Aquest és un inhibidor molt fort. També es va fer servir el mateix sccaffold però amb la proteïna APPI que es troba en una Ki= 15·10 - 12 M.
18 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Així doncs, es parteixen de seqüències diferents, però que tenen alguna cosa en comú, i després de fer feix display es va arribant a una seqüència pràcticament igual (partint de proteïnes diferents). Es va veure que únicament difereixen d’una histidina i d’una tirosina. En aquest cas es pannelen dues proteïnes diferents però únicament recuperem una seqüència, això es tracta d’una evolució dirigida on només hi ha una seqüència que s’acomoda correctament.
Cal tenir present que també podem pannelar contra dos substrats: TF - VIIa i kallikrein. Primerament pannelem a baixa afinitat i després rempannelem amb cadascun d’ells a alta afinitat. D’aquesta manera aconseguim tenir un específic per -9 cadascun d’els amb un valor de Ki= 10 M.
Per disseny mai no s’hagués arribat a aquesta evolució dirigida. En aquest cas forcem a la natura a trobar la òptima i aquestes coincideixen.
Reducció de la mida i manteniment de la funció Una qüestió que es van plantejar és si podem reduir una estructura en mida que ha estat sotmesa a evolució i és òptima per la seva funció. Ja hem vist que podem estabilitzar més una proteïna ja que a la natura no estan optimitzades per ser estables, però una altra cosa és si la mida de la proteïna també es pot reduir.
Es va fer un experiment amb la proteïna bacteriana A on volien eliminar una hèlix de les 3 que té i que la proteïna continués sent estable, soluble i funcional. Aquesta proteïna és reconeguda per un anticòs i ells volien generar una versió de dos hèlix que continués sent reconeguda. El problema està en què el que ens serveix per reconèixer l’anticòs no necessariament és el mateix que el que ens serveix per donar estructura i funció.
Si eliminem la hèlix 3, els hidrofòbics quedaran exposats a solvent. Per tal de saber si això serà estable o si agregarà el que es fa són gels de display en diferents zones: exoface, intraface i interface.
19 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Exoface La exoface fa referència a la cara que mira cap en fora. Se seleccionen regions en 4 posicions on es farà el display per tal de recuperar les seqüències. En les posicions grogues el que fem es recuperar les seqüències amb baixa afinitat per l’anticòs, i en els casos blaus es recupera la seqüència salvatge.
En els aminoàcids grocs es recuperen les proteïnes que no contenien els aminoàcids de la seqüència salvatge, en un cas la leucina ha estat canviada per aspàrtic i la fenilalanina per lisina?. De manera que la proteïna ha seleccionat que dos residus que estan cap a fora estiguin carregats, la qual cosa dóna solubilitat.
Intraface Ara necessitem, no només que sigui soluble sinó que les dues hèlix tinguin contacte. Perquè abans contactaven amb la terera però ara s’ha eliminat. A aquesta zona se li anomena intraface.
En aquest cas tornem a recuperar els residus que pensaven que es perdien, però tenim residus nous que en general el que canvien és la topologia de la regió hidrofòbica.
Ara tenim una proteïna soluble i estable ja que les hèlix estan interaccionant.
Interface La interface és la regió que toca l’anticòs. En aquest cas, els canvis són molts més. Els blaus són els que es fixen però veiem que en groc hi ha molts canvis. De manera que obtenim una molècula nova amb una nova topologia. Així doncs, l’anticòs s’ha d’unir de manera diferent però amb una afinitat semblant a la inicial.
Fent displays de forma racional aconseguim una molècula proteïna petita i nova que és més barata, més difusible,etc. I per tant, aconsegueixen una cosa positiva.
20 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Disseny a partir de principis bàsics Recordem que el disseny de proteïnes el podem abordar des d’un punt de vista racional o bé combinatorial (tècniques vistes anteriorment). Això ens permet seleccionar molècules amb seqüències noves sempre i quan tinguem una funció per la que 9 seleccionar i també sempre i quan la llibreria no sigui molt gran ( 10 o 10 12 seqüències diferents són acceptables). Quan tenim llibreries molt grans hem de recórrer a mètodes computacionals.
Experiment 1: Dit de zinc sense zinc A continuació veurem un exemple de redisseny d’una proteïna que manté l’estructura però en la qual canviem una part molt significativa de la seqüència. Volien dissenyar un dit de Zn sense Zn.
El dit de Zn té 28 aminoàcids, és a dir, és una proteïna molt petita i que no té ponts disulfur. De manera que perquè es plegui s’ha de coordinar amb el Zn, això és el que permet que l’estructura es compacti. Se sap que els dits de Zn coordinen el Zn a partir de dos tipus de residus: histidines i cisteïnes.
A la imatge podem veure la seqüència original de la proteïna on hi ha histidines i cisteïnes que coordinaran el Zn.
Quan posem un quelant ( quelcom que remou els divalents), la proteïna es desplega completament ja que el zinc és eliminat.
Per tal de redissenyar aquesta proteïna van utilitzar un algoritme que utilitzava la força bruta. Van mirar que estava a la superfície i què a l’interior i també el que estava al límit.
El que estava a l’interior ho van canviar per residus de caràcter hidrofòbic, de manera que van crear un nou nucli hidrofòbic.
Recordem que la histidina i la cisteïna quan no formen ponts disulfurs són polars. En el core d’aquesta proteïna que és molt petit (7 aminoàcids) van generar diferents combinacions en les quals els residus interiors podien ser substituïts per: valina, isoleucina, leucina i aromàtics.
A la superfície hi ha 20 posicions i en cadascuna d’aquestes van deixar com a únic hidrofòbic la alanina. Ka resta eren treonines, serines, glutàmic, glutamina, lisina i tota la resta de polars.
A la interfase no van deixar que hi hagués prolina ja que hi ha dues hèlix i una beta. Com que no volem que es formin ponts disulfur i tampoc coordinació amb el zinc, es va evitar que hi haguessin cisteïnes. Per una altra banda, també van evitar la metionina ja que aquesta és molt rígida.
27 El fet de tenir 7 residus en el core i 20 a la superfície dóna 10 seqüències possibles. De manera que no és possible assajar amb tècniques experimentals. El pes de tots els pèptids seria superior a 12.000 Kg, així doncs no és viable.
21 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Llavors, el que es fa és simular a l’ordinador (Com van fer amb PERLA). Fan servir un camp de forces que ens diu si l’estructura pot estar plegada o no, donant les coordenades dels àtoms i així saber si el plegament serà correcte. Per tal de fer-ho hem de dir quina és la contribució entàlpica i la entròpica. Necessitem termes que ens doni informació sobre: forces de Van der Waals, ponts d’hidrogen, estructura secundaria i solapació. Amb això podem fer un camp de forces i el que fem és requerir que l’energia resultant sigui semblant a la del dit de Zinc.
Van obtenir una seqüència. Els residus del core que veiem a la imatge de la seqüència en color verd, quan hi havia un hidrofòbic s’ha mantingut. Però s’ha produït el canvi de dues histidines que estaven amagades per dos residus hidrofòbics grans, la qual cosa ens aporta compactació. De les dues cisteïnes hi ha una cap a dins i una altra cap a fora si no tenim el Zinc, la que està cap a fora és canviada per una lisina i la que està cap endins per una alanina o valina.
En aquest moment, aquesta proteïna era la proteïna més petita que s’havia dissenyat sense cap àtom metàl·lic ni ponts disulfur, de manera que és un gran èxit del disseny.
La proteïna dissenyada és idèntica, amb poques excepcions. Un canvi és loop que trobem a la part inferior de la imatge.
El que van fer és un problema de plegament invers, és a dir, es troba una nova seqüència que s’acomoda a una seqüència coneguda. Això és molt més fàcil que endevinar quina seqüència es plegarà en un tipus d’estructura.
Aquest experiment tenia una gran expectació perquè aquesta estructura és nova i no té homologia en res i per tant és patentable. Això demostra que un pot generar una nova proteïna que es plegui en una estructura tridimensional Recordem que les estructures no estan protegides però les seqüències sí. Així doncs, es tracta de generar seqüències noves, demostrar qeu no s’assembla a res, comprovant-ho a la base de dades.
22 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Experiment 2: Dissenyant de novo una fulla plegada β Els dissenys que hem vist fins ara tenen una hèlix alfa i això és degut que aquestes són més fàcils de dissenyar que les fulles beta. Recordem que en una hèlix alfa tenim els contactes locals molt ben definits (i+3 o i+4) que podem dissenyar o eliminar.
En canvi, el fet de dissenyar una fulla beta és més complicat.
A la imatge veiem la fulla Betanova, que és la primera proteïna petita amb fulla beta (1998). Concretament la fulla beta nova té 21 aminoàcids. Aquesta proteïna té un problema i és que la fulla beta és la mínima, té únicament 3 cadenes (meandre de beta). Això és difícil de dissenyar ja que hi ha molt poques interaccions entre les dues cadenes de la fulla- Cal tenir present que aquesta proteïna en aigua només pobla l’estructura nativa una petita proporció. Aquest fet suposa un problema ja que s’havia dissenyat una molècula petita amb aquesta estructura però en solvent aquós era poc estable.
Al 2001, el mateix laboratori va dissenyar una millora de la proteïna que era una mica més estable. Van intentar dissenyar una Betanova que aguantés en aigua. En aquest moment se sabien més coses que van poder contribuir a aquesta millora. Per una banda es coneixia el domini WW que es tracta d’un domini de 3 cadenes. Aquesta és una estructura molt semblant a la dels dominis SH3 ja que tenen a prop N i C terminal i està unit a quinases que s’encarreguen de la unió.
La fb28wwdomain és més gran que la Betanova i té més capacitat per mantenir-se de forma plegada en aigua ja que és més gran. Així doncs, van intentar veure que tenia aquesta proteïna que la Betanova no tingués.
A la imatge podem veure una superposició de les dues cadenes. Observem que les fulla beta dissenyades de forma artificial en un camp de forces i el disseny de la natura són molt semblants. La proteïna Betanova té 21 residus i el domini WW uns 40, de manera que el seu camp és més llarg i té avantatges ja que hi ha més contactes i els girs són més relaxats.
23 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 En principi, un podria intentar imitar les interaccions que hi ha en la regió blava de l’esquerra. Es van intentar generar nous contactes a partir de canvis de residus que estaven inspirats en la natura. Hi havia uns residus molt conservats en els dominis WW. Així doncs, es van generar una sèrie de variants i la proteïna redissenyada cada vegada s’assemblava més al dominiWW.
El que havíem de fer era agafar les que menys s’assemblessin ja que estaven intentar dissenyar una cosa nova.
La introducció d’una tirosina va ser suficient per generar una variant que, en principi, semblava que en aigua era més estable.
La imatge següent mostra un estudi de dicroisme circular. Quan hi ha inflexió fa referència al domini WW i quan no hi ha inflexió a la proteïna Betanova. La nova variant té molta més inflexió que qualsevol de les anteriors en aigua. Per tant això, podria dir probablement que aquesta variant poblava l’estructura més freqüent quan tenim aigua.
Un cop tenim clar que això és així, s’intenta resoldre l’estructura tridimensional. En aquestes proteïnes només es pot fer per RMN. El que veiem a la imatge de l’esquerra és la seqüència de Betanova WWY i a la dreta un model de la proteïna.
El que es fa és posar un dibuix de com un ha fet el disseny. Un cop fet això, s’havia de confirmar que el nou model i estructura són correctes. Hi ha una sèrie de contactes que s’han de donar obligatòriament si això és correcte: ha d’haver-hi interaccions entre carbonils i N-terminals. La RMN ens diu si dos residus estan a prop o no a l’espai. Cada fletxa que veiem a la imatge superior esquerra fa referència a una dada experimental. La única forma que estiguin a prop a l’espai és que estiguin formant interaccions.
El primer beta hairpin de Betanova ja era molt bo, el següent era pitjor. En base a aquestes distàncies es fa un model (imatge superior dreta) d’una fulla beta de tres cadenes. Aquest fet encara no té cap importància ja que només era un dibuix.
24 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Si partíem d’una fulla beta de 3 cadenes, el fet d’arribar a una altra fulla beta de 3 cadenes no és cap cosa estranya. Hem de mirar si la nova fulla beta és més estable en aigua que l’original. Per fer-ho mirem l’estabilitat dels dos beta turns. En els dos hi haurà una lisina, situada en les posicions 9 i 15. El que podem fer és mirar com de freqüentment aquesta lisina està poblant la posició d’un gir en el Ramachandran. De manera que si ho fa freqüentment, hem encertat.
Al gràfic veiem com el primer gir és millor que el segon, sempre ho ha sigut. Quan aquesta proteïna la posem en solvent orgànic la seva estabilitat millorar molt. A WWY no fa falta ficar-ho en solvent orgànic. Així doncs, hem originat una molècula que ara sí que poblava preferentment en fulla beta de 3 cadenes.
Moltes vegades, les solucions a disseny s’han de fer mirant que ha fet la natura ja que aquestes han estat evolucionant durant anys. Fent un únic canvi que ha estat conservat en tots els dominis WW s’ha aconseguit que aquesta proteïna fos més estable.
Hi ha una gran quantitat de gent que dissenya al revés, és a dir, el que fan és que quan volen dissenyar alguna cosa alineen totes les seqüències naturals i miren que està totalment conservat i això ho deixen tal qual. Si això és un 20% de la seqüència, doncs mantenen el 20% i s’ho estalvien en la recerca.
25 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 REPTE DE PARACELSUS Es va proposar un premi a aquell grup de disseny que fos capaç de convertir un plegament en un altre (tot alfa, alfa/beta, alfa+beta, tot beta) mantenint una identitat seqüencial del 50 %. Això és un gran repte ja que nosaltres assumim constantment que les proteïnes amb una identitat en la seqüència del 30% plegaran de manera igual.
Van haver-hi molts grups que ho van fer per prestigi. Ho va aconseguir el grup de L. Regan que van canviar l'estructura de la proteïna G (B1) que era majoritària en fulla beta per un Rop (dos coiled coils, un enfront de l’altre). Si nosaltres alineem B1 i Rop, només tenen en comú 3 aminoàcids, de manera que no s’assemblaven, Això és molt bo i molt intel·ligent ja que si tenim molts aminoàcids en comú tenim poc marge de canvi. Es podien canviar 28 residus i continuar mantenint un 50% d’homologia.
Els residus que veiem en vermell són residus que van canviar perquè siguin idèntics. Cal tenir present que Janus és la proteïna dissenyada i Rop és la proteïna a la que volien arribar en estructura. Els canvis que es feien en cada posició eren canvis de bon formadors de beta per bons formadors d'alfa. Es tractava de trencar la predisposició de formar beta i guanyar la d’alfa.
Els altres canvis blaus eren canvis de disseny, per exemple per disminuir la mida de la cadena. És a dir, son canvis sobre estructura tridimensional. Es dissenya un coiled coil.
Hi ha dues interaccions molt importants a l’hora de modelar. Per una banda heptead repeat, on les posicions importants són a i d i per una altra banda (per aquest motiu a la seqüència els aminoàcids estan canviats cada cert temps), la formació de ponts salins que orienti els dos coiled coil. Ells van dissenyar una única molècula que després s’acobla per formar un dímer.
26 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 GEOMETRIES DE RESIDUS NO IDÈNTICS Els únics residus que hi ha diferents en aquestes estructures són els que hi ha representats en color vermell. En aquestes proteïnes hi ha una homologia del 80% i es tracten d’estructures completament diferents.
Concretament, la diferència és de 5 residus.
Per tal de realitzar això calen programes molt més sofisticats on és possible revertir el plegament amb estructures molt similars.
Quan les proteïnes estan plegant, no tots els residus són igual d’importants. Hi ha uns residus que tenen una fi de 1 i altres que tenen una fi de 0. Si a més a més de tocar els que són importants per l’estructura, toquem els que tenen fi de 1 (aquells que són importants per assolir aquell tipus d’estructura) i sabem que en aquesta estructura, per tenir la fi de 1 hem de tenir un residu aromàtic en una determinada posició, amb això el que fem no és només canviar l’estructura final sinó canviar el camí de plegament per aquesta estructura. Per tant, batejaven a nivell de residu l’estat de transició. No només toquen el final sinó que també modifiquen el camí de transició.
DISSENY DE PROTEÏNES Dissenyar proteïnes de novo Ja s’ha vist que hi ha grups de treball que aconsegueixen canviar un fold per un altre mantenint un 80% d’homologia. El següent que ens podem plantejar després d’això és aconseguir un plegament que no existeix a la natura i que sigui estable.
Per tal de dissenyar un fragment de nou necessitem un camp de forces que em pugui validar el meu disseny. El camp de forces més de moda, més bo, es el que presenta Roseta. És un algoritme que em presenta un camp de forces que no es més que la suma de ponts d’hidrogen, Van der Waals, hidrostàtiques, solvatació, secundària.. que permet fer disseny.
Dissenyar és pràcticament el mateix que predir estructures. Tan com per predir una estructura a partir d’una seqüència com per dissenyar una nova proteïna jo necessito el mateix.
Ells el que van fer va ser dissenyar aquest camp de forces per predir estructures, assumint que quan tinguessin un bon camp de forces per predir estructures sobre seqüències ja conegudes, podrien utilitzar-los per fer disseny de noves proteïnes.
27 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Això que veieu aquí a l’esquerra, són proteïnes reals d’aquest concurs que es diu “cast” en el quan la gent resol estructures però no les deixa anar, i desprès hi ha un concurs de veure qui es el que prediu millor l’estructura a partir de la seqüència.
Doncs això es Roseta, roseta es el core en el qual està incrementat folding, folding esta incrementat sobre de roseta, roseta es el camp de forces. Funciona de forma jeràrquica.
Es van adonar que no te sentit intentar predir tota la seqüència en quin estructura es formarà sinó el que fan ells es modelar segments. Agafen segments de la proteïna i van donant-li la millor estructura secundaria segons el seu camp de forces, una vegada tenen aquests segments els comencen a combinar i tornen a calcular. Mirem primer estructura secundaria, motius estructurals, dominis i proteïnes. Van step per step.
Aquestes estructures d’aquí s’assemblen molt però no són idèntiques, la homologia es inferior al 30% amb qualsevol altre proteïna coneguda, això es predir del que anomenem “scrash” fent servir un camp de forces. Òbviament aquest es el resultat dels que van guanyar el concurs.
Top7 El que van fer es que si això era tan bo per predir estructures a partir de seq naturals, també ho podien fer servir per dissenyar la primera proteïna artificial, no present a la natura.
El que veieu en vermell i en blau ( no se que es el que hi ha en vermell i que hi ha en blau de forma correcta) imagineu-vos que el que hi ha en vermell es el disseny experimental que ells van fer insidicus amb l’ordinador (el que et dona la pantalla), i en blau es l’estructura tridimensional resolta, fixeu-vos que el seu algoritme es tan bo que són capaços d’encertar-ho pràcticament tot. La diferència es de 1,5 A.
Com ho van fer: Van fer servir el mateix que es fa servir per predir estructura, van fer servir Roseta. Van dissenyar una topologia. Van decidir que seria aquesta d’aquí. Una fulla beta de 5 cadenes en disposició antiparal·lela i van agafar l’equivalent a un coiled-coil. Així van muntar la topologia. Després van agafar fragments, el bacbone (esquelet carbonatat) i construir 5 models en el qual els loops de connexió són de la llibreria de loops, els que millor encaixaven per connectar les estructures. En aquests casos només havien de donar flexibilitat. Aquest model el vestien amb cadenes laterals. Tot i que tenen una gran potència de càlcul i això es el seu avantatge , segueixen les regles que vosaltres ja sabeu, a dintre hidrofòbics, aquí polars.. Els col·loquen i tenen un esquelet carbonatat fixa i les cadenes laterals minimitzades. Quan calculen l’energia el que els hi dona es una proteïna que no s’aguantarà perquè les cadenes laterals no omplen tot l’espai si l’esquelet carbonatat es rígid.
28 Judith Gonzàlez Gallego Química i enginyeria de proteïnes T7 Una vegada tenen això, el que fan es modelar l’esquelet carbonatat sobre aquesta mateixa seqüència. Fixeu-vos que això és predir, tenen la seqüència ja i el que fan es acomodar un backbone, això els hi dona una estructura nova, les cadenes laterals que tenen ara no són bones, perquè tu has mogut l’esquelet carbonatat i les has buscat per un backbone anterior. Tornen a buscar cadenes laterals, les fixen, mouen el backbone, tornen a canviar cadenes laterals, mouen el backbone.. i això ho van fent de manera reiterativa. Per cada backbone (i en teníem 5) van analitzar seqüències, on n=150.
És un espai conformacional gairebé complert, van explorar tot allò que era explorable per això van obtenir una solució.
Tenen una energia que és l’energia de les proteïnes naturals, com teníem nosaltres amb el nostre nucli, i quan arriben a aquest mínim es decideixen experimentar-les, 6 fallen, però la setena funciona. Per això es diu Top seven. Es una proteïna estable, és funcional que te totes les propietats que tindria una proteïna natural. Roseta es accessible, es free, vosaltres el podeu fer servir.
Hi ha grans àrees de “l’univers proteic” que no han estat explorats per la natura, perquè no els ha fa falta. Si veiem un altre plegament que fa la funció ja no fa falta. Però si apareix una nova funció que no tenim podem seguir dos camins, el camí difícil es anar unificant seqüències per obtenir la funció, el camí ràpid es dissenyar-les a propòsit.
De moment em vist com podem partir des de fer canvis molt puntuals, quan canviàvem només Asp i Glu a Asn i Gln, fins a canviar proteïnes complertes, fins a dissenyar les proteïnes.
L’EP EN L’ESTUDI DE MALALTIES CONFORMACIONALS podem fer servir enginyeria de proteïnes per estudiar malalties conformacionals, aquest exemple us l’he ensenyat ja, es el domini SH3 (del nostre grup), es un domini que forma fibres amiloids, per tant es altament tòxic, tenim moltes formes de modular la seva tendència a agregar. Tot això són mutants que vam fer per fer que aquesta proteïna que normalment agrega deixes d’agregar. Vam explotar tot allò que us he explicat. L’efecte repulsiu de carregues, el dissenyar propensitats alfes en regions que s’havien d’enssemblar per lo tant com són alfes no s’uneixen, el dissenyar ponts d’hidrogen intermoleculars de manera que formin dimers i no s’uneixen... tot això que us he explicat es pot utilitzar per dissenyar proteïnes que tinguin propietats agregatives molt inferiors a les naturals. Això en principi ho vam fer a mà amb totes les lleis físiques que us he explicat, ara nosaltres i molts altres grups tenim algoritmes que ens permeten modificar la tendència d’agregar de les proteïnes amb l’ordinador, fent servir això que vosaltres ja sabeu ni més ni menys.
Quin interès té això entre d’altres, ho pots fer servir per exemple anticossos recombinants més fiables. Fins ara em aconseguit canviar les propietats fins a un 40%. Tot això que veieu no es teòric sinó que a més a més es pot utilitzar.
29 ...