Idi na sadržaj

Dizajn proteina

Nepregledano
S Wikipedije, slobodne enciklopedije

Dizajn proteina je racionalni dizajn novih molekula proteina s ciljem dizajniranja nove aktivnosti, ponašanja ili svrhe, te unapređenja osnovnog razumijevanja funkcije proteina.[1] Proteini se mogu dizajnirati od nule (de novo dizajn) ili pravljenjem izračunatih varijanti poznate strukture proteina i njegovog niza (nazvano redizajn proteina). Pristupi racionalnog dizajna proteina daju predviđanja o nizu proteina koji će se preklopiti u specifične strukture. Ovi predviđeni nizovi se zatim mogu eksperimentalno validirati metodama kao što su sinteza peptida, mutageneza usmjerena na mjesto ili sinteza vještačkog gena. Racionalni dizajn proteina datira iz sredine 1970-ih.[2] Međutim, nedavno je bilo brojnih primjera uspješnog racionalnog dizajna vodotopivih, pa čak i transmembranskih peptida i proteina, dijelom zbog boljeg razumijevanja različitih faktora koji doprinose stabilnosti proteinske strukture i razvoju boljih računarskih metoda.

Pregled i historija

[uredi | uredi izvor]

Cilj racionalnog dizajna proteina je predvidjeti aminokiseline sekvence primarne strukture proteina koje će se savijati u specifičnu proteinsku strukturu. Iako je broj mogućih proteinskih sekvenci ogroman i raste eksponencijalno s veličinom proteinskog lanca, samo će se podskup njih pouzdano i brzo saviti u jedno nativno stanje. Dizajn proteina uključuje identifikaciju novih sekvenci unutar ovog podskupa. Nativno stanje proteina je konformacijski slobodna energija minimum za lanac. Dakle, dizajn proteina je potraga za sekvencama koje imaju odabranu strukturu kao minimum slobodne energije. U određenom smislu, to je suprotno od [[predviđanje predviđanja strukture proteina. U dizajnu se specificira tercijarna struktura i identificira se sekvenca koja će se saviti u nju. Stoga se to naziva i "inverzno savijanje". Dizajn proteina je tada problem optimizacije: korištenjem nekih kriterija bodovanja odabire se optimizirana sekvenca koja će se saviti u željenu strukturu.

Kada su prvi proteini racionalno dizajnirani tokom 1970-ih i 1980-ih, sekvenca za njih je optimizirana ručno na osnovu analiza drugih poznatih proteina, sastava sekvence, naboja aminokiselina i geometrije željene strukture.[2] Prvi dizajnirani proteini pripisuju se Berndu Gutteu, koji je dizajnirao reduciranu verziju poznatog katalizatora, goveđe ribonukleaze i tercijarne strukture koje se sastoje od beta-lista i alfa-heliksa, uključujući vezivo DDT. Urry i kolege kasnije su dizajnirali peptide slične elastinu, na osnovu pravila o sastavu sekvence. Richardson i saradnici su dizajnirali protein od 79 ostataka bez homologije sekvence sa poznatim proteinom.[2] Tokom 1990-ih, pojava moćnih računara, biblioteka aminokiselinskih konformacija i polja sile razvijenih uglavnom za simulacije molekularne dinamike omogućila je razvoj alata za računarski dizajn proteina zasnovanih na strukturi. Nakon razvoja ovih računarskih alata, u posljednjih 30 godina postignut je veliki uspjeh u dizajnu proteina. Prvi protein koji je uspješno dizajniran potpuno de novo uradili su Stephen Mayo i saradnici 1997. godine,[3] i, ubrzo nakon toga, 1999. godine Peter S. Kim i saradnici dizajnirali su dimere, trimere i tetramere neprirodnih desnorukih spiralnih zavojnica.[4][5] U 2003., laboratrija Davida Bakera dizajniraja je potpuni protein do nabora kakav nikada prije nije viđen u prirodi.[6] Kasnije, 2008. godine, Bakerova grupa je računarski dizajnirala enzime za dvije različite reakcije.[7] In 2010, one of the most powerful broadly neutralizing antibodies was isolated from patient serum using a computationally designed protein probe.[8] U 2024., Baker je dobio polovinu Nobelove nagrade za hemiju za svoj napredak u računarskom dizajnu proteina, dok su drugu polovinu podijelili Demis Hassabis i John Jumper iz Deepmind za predviđanje strukture proteina.[9] Zbog ovih i drugih uspjeha (npr. pogledajte primjeri ispod), dizajn proteina postao je jedan od najvažnijih alata dostupnih za proteinsko inženjerstvo. Postoji velika nada da će dizajn novih proteina, malih i velikih, imati primjenu u biomedicini i bioinženjerstvu.

Osnovni modeli strukture i funkcije proteina

[uredi | uredi izvor]

Programi za dizajn proteina koriste računarske modele molekularnih sila koje pokreću proteine u in vivo okruženjima. Da bi se problem učinio rješivim, ove sile su pojednostavljene modelima dizajna proteina. Iako se programi za dizajn proteina uveliko razlikuju, oni moraju odgovoriti na četiri glavna pitanja modeliranja: Koja je ciljna struktura dizajna, koja je fleksibilnost dozvoljena na ciljnoj strukturi, koje sekvence su uključene u pretragu i koje polje sile će se koristiti za bodovanje sekvenci i struktura.

Ciljna struktura

[uredi | uredi izvor]
Protein Top7 bio je jedan od prvih proteina dizajniranih za nabor kakav nikada prije nije viđen u prirodi.[6]

Funkcija proteina uveliko zavisi od strukture proteina, a racionalni dizajn proteina koristi ovaj odnos za dizajniranje funkcije dizajniranjem proteina koji imaju ciljnu strukturu ili nabor. Dakle, po definiciji, u racionalnom dizajnu proteina ciljna struktura ili skup struktura moraju biti unaprijed poznati. Ovo je u suprotnosti s drugim oblicima proteinskog inženjerstva, kao što je usmjerena evolucija, gdje se koristi niz metoda za pronalaženje proteina koji postižu specifičnu funkciju, i s predviđanjem strukture proteina gdje je sekvenca poznata, ali struktura nije.

Najčešće se ciljna struktura zasniva na poznatoj strukturi drugog proteina. Međutim, novi nabori koji se ne vide u prirodi postali su sve mogućiji. Peter S. Kim i saradnici dizajnirali su trimere i tetramere neprirodnih spiralnih zavojnica, koje ranije nisu viđene u prirodi.[4][5] Protein Top7, razvijen u laboratoriji Davida Bakera, dizajniran je u potpunosti korištenjem algoritama za dizajn proteina, do potpuno novog oblika.[6] Nedavno su Baker i saradnici razvili niz principa za dizajniranje idealnih globulastog proteina, struktura zasnovanih na lijevcima za savijanje proteina koji premošćuju predviđanje sekundarne i tercijarne strukture. Ovi principi, koji se temelje i na predviđanju strukture proteina i na dizajnu proteina, korišteni su za dizajniranje pet različitih novih proteinskih topologija.[10]

Razmak sekvence

[uredi | uredi izvor]
FSD-1 (prikazan plavom bojom, PDBid: 1FSV) bio je prvi de novo računarski dizajn potpunog proteina.[3] Ciljni nabor bio je onaj cinkovog prsta u ostacima 33–60 strukture proteina Zif268 (prikazano crvenom bojom, PDB id: 1ZAA). Dizajnirana sekvenca imala je vrlo malo identičnosti sekvence sa bilo kojom poznatom proteinskom sekvencom.

U racionalnom dizajnu proteina, proteini se mogu redizajnirati iz sekvence i strukture poznatog proteina ili potpuno od nule u de novo dizajnu proteina. U redizajnu proteina, većina ostataka u sekvenci se održava kao njihova aminokiselina divljeg tipa, dok se nekolicini dozvoljava mutacija. U de novo dizajnu, cijela sekvenca se dizajnira iznova, na osnovu nepostojanja prethodne sekvence.

I de novo dizajni i redizajni proteina mogu uspostaviti pravila o prostor sekvence: specifične aminokiseline koje su dozvoljene na svakoj poziciji promjenjivog ostatka. Naprimjer, sastav površine RSC3 sonde za odabir HIV-široko neutralizirajućih antitijela bio je ograničen na osnovu evolucijskih podataka i balansiranja naboja. Mnogi od najranijih pokušaja dizajna proteina bili su u velikoj mjeri zasnovani na empirijskim pravilima o prostoru sekvenci.[2] Štaviše, dizajn vlaknastih proteina obično slijedi stroga pravila o prostoru sekvenci. Proteini dizajnirani na bazi kolagena, naprimjer, često su sastavljeni od ponavljajućih obrazaca Gly-Pro-X.[2] Pojava računarskih tehnika omogućava dizajniranje proteina bez ljudske intervencije u odabiru sekvenci.[3]

Strukturna fleksibilnost

[uredi | uredi izvor]
Uobičajeni programi za dizajn proteina koriste biblioteke rotamera kako bi pojednostavili konformacijski prostor bočnih lanaca proteina. Ova animacija prolazi kroz sve rotamere aminokiseline izoleucin na osnovu pretposljednje biblioteke rotamera (ukupno 7 rotamera).[11]

U dizajnu proteina, ciljna struktura (ili strukture) proteina su poznate. Međutim, racionalan pristup dizajnu proteina mora modelirati određenu "fleksibilnost" na ciljnoj strukturi kako bi se povećao broj sekvenci koje se mogu dizajnirati za tu strukturu i kako bi se minimizirala mogućnost savijanja sekvence u drugu strukturu. Naprimjer, u redizajnu proteina jedne male aminokiseline (kao što je alanin) u čvrsto pakiranoj jezgri proteina, racionalni pristup dizajnu bi predvidio vrlo malo mutanata koji će se saviti u ciljnu strukturu, ako se okolnim bočnim lancima ne dozvoli ponovno pakiranje.

Dakle, bitan parametar svakog procesa dizajna je količina fleksibilnosti dozvoljena i za bočne lance i za okosnicu. U najjednostavnijim modelima, proteinski lanac se održava krutim, dok je nekim bočnim lancima proteina dozvoljeno da mijenjaju konformacije. Međutim, bočni lanci mogu imati mnogo stepeni slobode u dužini veza, uglovima veza i χ diedarski uglovi. Da bi se pojednostavio ovaj prostor, metode dizajna proteina koriste biblioteke rotamera koje pretpostavljaju idealne vrijednosti za dužine veza i uglove veza, dok ograničavaju χ diedarske uglove na nekoliko često uočenih niskoenergetskih konformacija nazvanih rotameri.

Biblioteke rotamera izvedene su iz statističke analize mnogih proteinskih struktura. Biblioteke rotamera nezavisne od kičme opisuju sve rotamere.[11] Biblioteke rotamera zavisnih od glavnog lanca, nasuprot tome, opisuju rotamere kao vjerovatnoću njihovog pojavljivanja, u zavisnosti od rasporeda proteinskog glavnog oko bočnog lanca.[12] Većina programa za dizajn proteina koristi jednu konformaciju (npr. modalnu vrijednost za rotamerne diedare u prostoru) ili nekoliko tačaka u regiji koju opisuje rotamer; program za dizajn proteina OSPREY, nasuprot tome, modelira cijelu kontinuiranu regiju.[13]

Iako racionalni dizajn proteina mora očuvati opći nabor okosnice proteina, omogućavanje određene fleksibilnosti okosnice može značajno povećati broj sekvenci koje se savijaju u strukturu, a istovremeno održavaju opći nabor proteina.[14] Fleksibilnost okosnice je posebno važna kod redizajna proteina jer mutacije sekvenci često rezultiraju malim promjenama u strukturi okosnice. Štaviše, fleksibilnost okosnice može biti ključna za naprednije primjene dizajna proteina, kao što su predviđanje vezivanja i dizajn enzima. Neki modeli fleksibilnosti okosnice dizajna proteina uključuju male i kontinuirane globalne pokrete okosnice, diskretne uzorke okosnice oko ciljnog nabora, pokrete trljanja unazad i fleksibilnost proteinske petlje.[14][15]

Energetska funkcija

[uredi | uredi izvor]
Poređenje različitih funkcija potencijalne energije. Najtačnije energetske funkcije su one koje koriste kvantno-mehaničke proračune, ali su oni previše spori za dizajn proteina. S druge strane, heurističke funkcije energije zasnivaju se na statističkim terminima i vrlo su brze. U sredini su funkcije energije molekularne mehanike koje su fizički zasnovane, ali nisu računski skupe kao kvantno-mehaničke simulacije.[16]

Racionalne tehnike dizajna proteina moraju biti u stanju da razlikuju sekvence koje će biti stabilne pod ciljnim savijanjem od onih koje bi preferirale druga konkurentska stanja niske energije. Stoga, dizajn proteina zahtijeva tačne funkcije energije koje mogu rangirati i bodovati sekvence prema tome koliko dobro se savijaju u ciljnu strukturu. Međutim, istovremeno, ove funkcije energije moraju uzeti u obzir računske Kao izazove iza dizajna proteina. Jedan od najizazovnijih zahtjeva za uspješan dizajn je funkcija energije koja je i tačna i jednostavna za računske proračune.

Najtačnije funkcije energije su one zasnovane na kvantno-mehaničkim simulacijama. Međutim, takve simulacije su previše spore i obično nepraktične za dizajn proteina. Umjesto toga, mnogi algoritmi za dizajn proteina koriste ili energetske funkcije zasnovane na fizici prilagođene iz programa za simulaciju molekularne mehanike, funkcije zasnovane na znanju, ili hibridnu kombinaciju oba. Trend je bio ka korištenju više funkcija potencijalne energije zasnovanih na fizici.[16]

Energetske funkcije zasnovane na fizici, kao što su AMBER i CHARMM, obično se izvode iz kvantno-mehaničkih simulacija i eksperimentalnih podataka iz termodinamike, kristalografije i spektroskopije.[17] Ove energetske funkcije obično pojednostavljuju fizičku energetsku funkciju i čine ih parno dekompozicionim, što znači da se ukupna energija proteinske konformacije može izračunati dodavanjem parne energije između svakog para atoma, što ih čini atraktivnim za optimizacijske algoritme. Energetske funkcije zasnovane na fizici obično modeliraju privlačno-odbojni Lennard-Jonesov član između atoma i parni elektrostatski kulonovski član[18]

Vodikove veze posredovane vodom imaju ključnu ulogu u vezivanju proteina. Jedna takva interakcija je prikazana između ostataka D457, S365 u teškom lancu HIV-široko neutralizirajućeg antitijela VRC01 (zeleno) i ostataka N58 i Y59 u proteinu omotača HIV-a GP120 (ljubičasto)[19]

Statistički potencijali, za razliku od potencijala zasnovanih na fizici, imaju prednost brzine izračunavanja, implicitnog uzimanja u obzir složenih efekata i manje osjetljivosti na male promjene u strukturi proteina.[20] Ove energetske funkcije su zasnovane na izvođenju energetskih vrijednosti iz učestalosti pojavljivanja u strukturnoj bazi podataka.

Međutim, dizajn proteina ima zahtjeve koji ponekad mogu biti ograničeni u poljima sila molekularne mehanike. Polja sila molekularne mehanike, koja su se uglavnom koristila u simulacijama molekularne dinamike, optimizirana su za simulaciju pojedinačnih sekvenci, ali dizajn proteina pretražuje mnoge konformacije mnogih sekvenci. Stoga, polja sila molekularne mehanike moraju biti prilagođena dizajnu proteina. U praksi, energetske funkcije dizajna proteina često uključuju i statističke i fizičke termine. Na primjer, Rosetta energetska funkcija, jedna od najčešće korištenih energetskih funkcija, uključuje fizičke energetske termine koji potiču iz CHARMM energetske funkcije i statističke energetske termine, kao što su vjerovatnoća rotamera i elektrostatika zasnovana na znanju. Tipično, energetske funkcije su visoko prilagođene između laboratorija i posebno prilagođene za svaki dizajn.[17]

Izazovi za efikasan dizajn energetskih funkcija

[uredi | uredi izvor]

Voda čini većinu molekula koji okružuju proteine i glavni je pokretač strukture proteina. Stoga je modeliranje interakcije između vode i proteina ključno u dizajnu proteina. Broj molekula vode koji u bilo kojem trenutku interaguju s proteinom je ogroman i svaki od njih ima veliki broj stepeni slobode i partnera u interakciji. Umjesto toga, programi za dizajn proteina modeliraju većinu takvih molekula vode kao kontinuum, modelirajući i hidrofobni efekat i polarizaciju solvatacije.[17]

Pojedinačne molekule vode ponekad mogu imati ključnu strukturnu ulogu u jezgru proteina i u interakcijama protein-protein ili protein–ligand. Neuspjeh u modeliranju takvih voda može rezultirati pogrešnim predviđanjima optimalnog slijeda protein-proteinskog interfejsa. Kao alternativa, molekule vode mogu se dodati rotamerima.

Kao problem optimizacije

[uredi | uredi izvor]
Ova animacija ilustruje složenost pretrage dizajna proteina, koja obično poredi sve konformacije rotamera iz svih mogućih mutacija na svim ostacima. U ovom primjeru, ostacima Phe36 i His106 je dozvoljeno da mutiraju u aminokiseline Tyr i Asn, respektivno. Phe i Tyr imaju po četiri rotamera u biblioteci rotamera, dok Asn i His imaju aedam odnosno osam rotamera, u biblioteci rotamera (iz Richardsonove pretposljednje biblioteke rotamera[11]). Animacija prolazi kroz svih (4 + 4) x (7 + 8) = 120 mogućnosti. Prikazana struktura je struktura mioglobina,PDB id: 1mbn.

Cilj dizajna proteina je pronaći proteinsku sekvencu koja će se saviti u ciljnu strukturu. Algoritam za dizajn proteina mora, dakle, pretražiti sve konformacije svake sekvence, u odnosu na ciljni nabor, i rangirati sekvence prema konformaciji najniže energije svake od njih, kako je određeno energetskom funkcijom dizajna proteina. Dakle, tipičan ulaz u algoritam za dizajn proteina je ciljni nabor, prostor sekvence, strukturna fleksibilnost i energetska funkcija, dok je izlaz jedna ili više sekvenci za koje se predviđa da će se stabilno savijati u ciljnu strukturu.

Međutim, broj kandidatskih proteinskih sekvenci raste eksponencijalno s brojem proteinskih ostataka; na primjer, postoji 20100 proteinskih sekvenci dužine 100. Nadalje, čak i ako su konformacije bočnih lanaca aminokiselina ograničene na nekoliko rotamera (vidi Strukturna fleksibilnost), to rezultira eksponencijalnim brojem konformacija za svaku sekvencu. Dakle, u našem proteinu od 100 aminokiselina, i pod pretpostavkom da svaka aminokiselina ima tačno 10 rotamera, algoritam za pretragu koji pretražuje ovaj prostor morat će pretražiti preko 200 proteinskih konformacija.

Najčešće energetske funkcije mogu se rastaviti na parne članove između rotamera i tipova aminokiselina, što problem pretvara u kombinatorni, a za njegovo rješavanje mogu se koristiti moćni optimizacijski algoritmi. U tim slučajevima, ukupna energija svake konformacije koja pripada svakoj sekvenci može se formulirati kao zbir pojedinačnih i parnih članova između pozicija ostataka. Ako je dizajner zainteresiran samo za najbolju sekvencu, algoritam za dizajn proteina zahtijeva samo konformaciju sekvence s najnižom energijom. U tim slučajevima, identitet aminokiseline svakog rotamera može se zanemariti i svi rotameri koji pripadaju različitim aminokiselinama mogu se tretirati isto. Neka je ri rotamer na poziciji ostatka i u proteinskom lancu, a E(ri) potencijalna energija između unutrašnjih atoma rotamera. Neka je E(ri, rj) potencijalna energija između ri i rotamera rj na poziciji ostatka j. Zatim, definiramo problem optimizacije kao pronalaženje konformacije minimalne energije (ET

 

 

 

 

( 1 )

Problem minimiziranja ET je NP-težak problem.[15][21][22] Iako je klasa problema NP-teška, u praksi se mnogi slučajevi dizajna proteina mogu riješiti tačno ili zadovoljavajuće optimizirati heurističkim metodama.

Algoritmi

[uredi | uredi izvor]

Nekoliko algoritama je razvijeno posebno za problem dizajna proteina. Ovi algoritmi se mogu podijeliti u dvije široke klase: tačni algoritmi, kao što su eliminacija slijepih ulica, kojima nedostaju vrijeme izvođenja garancije, ali garantuju kvalitet rješenja; heuristički algoritmi, kao što je Monte Carlo, koji su brži od tačnih algoritama, ali nemaju garancije o optimalnosti rezultata. Tačni algoritmi garantuju da je proces optimizacije proizveo optimalno prema modelu dizajna proteina. Dakle, ako predviđanja tačnih algoritama ne uspiju kada se eksperimentalno potvrde, tada se izvor greške može pripisati energetskoj funkciji, dozvoljenoj fleksibilnosti, prostoru sekvenci ili ciljnoj strukturi (npr. ako se ne može dizajnirati za).[23]

Neki algoritmi za dizajn proteina navedeni su u nastavku. Iako se ovi algoritmi bave samo najosnovnijom formulacijom problema dizajna proteina, Jednačinom (1  ), kada se cilj optimizacije promijeni jer dizajneri uvode poboljšanja i proširenja modela dizajna proteina, kao što su poboljšanja dozvoljene strukturne fleksibilnosti (npr. fleksibilnost proteinskog skeleta) ili uključivanje sofisticiranih energetskih termina, mnoga proširenja dizajna proteina koja poboljšavaju modeliranje izgrađena su na ovim algoritmima. Na primjer, Rosetta Design uključuje sofisticirane energetske termine i fleksibilnost skeleta koristeći Monte Carlo kao osnovni optimizacijski algoritam. OSPREY-jevi algoritmi grade se na algoritmu eliminacije slijepih ulica i A* kako bi uključili kontinuirane pokrete skeleta i bočnih lanaca. Dakle, ovi algoritmi pružaju dobru perspektivu o različitim vrstama algoritama dostupnih za dizajn proteina. U 2020., naučnici su izvijestili o razvoju procesa zasnovsnog na vještačkoj inteligenciji, koristeći genomske baze podataka za bazirano na evoluciji dizajniranje novih proteina. Koristili su duboko učenje za identifikaciju pravila dizajna.[24][25] U 2022., studija je izvijestila o softveru za duboko učenje koji može dizajnirati proteine koji sadrže unaprijed specificirana funkcionalna mjesta.[26][27]

Sa matematičkim garancijama

[uredi | uredi izvor]

Eliminacija slijepog ulice

[uredi | uredi izvor]

Šablon:Flavni Algoritam eliminacije slijepe ulice (DEE) iterativno smanjuje prostor pretraživanja problema uklanjanjem rotamera za koje se može dokazati da nisu dio globalne konformacije najniže energije (GMEC). U svakoj iteraciji, algoritam eliminacije slijepe ulice uspoređuje sve moguće parove rotamera na svakoj poziciji ostatka i uklanja svaki rotamer i za koji se može pokazati da uvijek ima veću energiju od drugog rotamera ri i stoga nije dio GMEC-a:

Pszala moćna proširenja algoritma za eliminaciju slijepe ulice uključuju kriterij eliminacije parova i generalizirani kriterij eliminacije slijepe ulice. Ovaj algoritam je također proširen za rukovanje kontinuiranim rotamerima s dokazivim garancijama.

Iako se algoritam za eliminaciju slijepe ulice izvršava u polinomijalnom vremenu na svakoj iteraciji, ne može garantirati konvergenciju. Ako, nakon određenog broja iteracija, algoritam za eliminaciju slijepe ulice ne ukloni više rotamera, tada se rotameri moraju spojiti ili se mora koristiti drugi algoritam pretraživanja za pretraživanje preostalog prostora pretraživanja. U takvim slučajevima, eliminacija slijepe ulice djeluje kao algoritam za prethodno filtriranje kako bi se smanjio prostor pretrage, dok se drugi algoritmi, poput A*, Monte Carlo, linearnog programiranja ili FASTER, koriste za pretraživanje preostalog prostora pretrage.[15]

Grana i granica

[uredi | uredi izvor]

Konformacijski prostor dizajna proteina može se predstaviti kao stablo, gdje su proteinski ostaci poredani na proizvoljan način, a stablo se grana na svakom od rotamera u ostatku. Algoritmi grana i granica koriste ovaj prikaz za efikasno istraživanje konformacijskog stabla: Na svakom grananju, algoritmi grananja i granica ograničavaju konformacijski prostor i istražuju samo obećavajuće grane.[15][28][29]

Popularan algoritam pretraživanja za dizajn proteina je A* algoritam pretraživanja.[15][29] A* izračunava rezultat donje granice na svakoj parcijalnoj putanji stabla koja određuje donje granice (uz garancije) energije svakog od proširenih rotamera. Svaka parcijalna konformacija se dodaje u red prioriteta i u svakoj iteraciji parcijalni put s najnižom donjom granicom se izvlači iz reda i proširuje. Algoritam se zaustavlja kada se nabroji puna konformacija i garantuje da je konformacija optimalna. A* rezultat f u dizajnu proteina sastoji se od dva dijela, f=g+h. g je tačna energija rotamera koji su već dodijeljeni u parcijalnoj konformaciji. h je donja granica energije rotamera koji još nisu dodijeljeni. Svaki je dizajniran na sljedeći način, gdje je d indeks posljednjeg dodijeljenog ostatka u parcijalnoj konformaciji.

Linearno programiranje cjelobrojnih brojeva

[uredi | uredi izvor]

Problem optimizacije ET (Jednačina (1  )) može se lako formulirati kao linearni program cjelobrojnih brojeva (ILP).[30] Jedna od najmoćnijih formulacija koristi binarne varijable za predstavljanje prisutnosti rotamera i rubova u konačnom rješenju i ograničava rješenje da ima tačno jedan rotamer za svaki ostatak i jednu parnu interakciju za svaki par ostataka:

s.t.

ILP rješavači, kao što je CPLEX, mogu izračunati tačno optimalno rješenje za velike instance problema dizajna proteina. Ovi rješavači koriste linearnu programsku relaksaciju problema, gdje je qi i qij dozvoljeno da uzimaju kontinuirane vrijednosti, u kombinaciji s algoritmom grananje i rezanje za pretraživanje samo malog dijela konformacionog prostora za optimalno rješenje. Pokazalo se da ILP rješavači rješavaju mnoge instance problema postavljanja bočnog lanca.[30]

Aproksimacije zasnovane na prenosu poruka za linearno programiranje dualno

[uredi | uredi izvor]

ILP rješavači zavise od algoritama linearnog programiranja (LP), kao što su metode zasnovane na Simplex ili barijeri za izvođenje LP relaksacije na svakoj grani. Ovi LP algoritmi su razvijeni kao metode optimizacije opšte namjene i nisu optimizovani za problem dizajna proteina (Jednačina (1  )). Posljedično, LP relaksacija postaje usko grlo ILP rješavača kada je veličina problema velika.[31] Nedavno je dizajnirano nekoliko alternativa zasnovanih na algoritmima za prenošenje poruka posebno za optimizaciju LP relaksacije problema dizajna proteina. Ovi algoritmi mogu aproksimirati i instance cjelobrojnog programiranja dualnih ili primal cjelobrojnog programiranja, ali kako bi se održale garancije optimalnosti, najkorisniji su kada se koriste za aproksimaciju dualnia problema dizajna proteina, jer aproksimacija duala garantuje da se ne propuštaju rješenja. Aproksimacije zasnovane na prenošenju poruka uključuju algoritam prenošenja poruka s maksimalnim proizvodom s ponderima stabla[32][33] i algoritam linearnog programiranja prenošenja poruka.[34]

Algoritmi optimizacije bez garancija

[uredi | uredi izvor]

Monte Carlo i simulirano kaljenje

[uredi | uredi izvor]

Monte Carlo je jedan od najčešće korištenih algoritama za dizajn proteina. U svom najjednostavnijem obliku, Monte Carlo algoritam nasumično bira ostatak, a u tom ostatku se procjenjuje nasumično odabrani rotamer (bilo koje aminokiseline).[22] Nova energija proteina, Enew, poredi se sa starom energijom Eold i novi rotamer se prihvata sa vjerovatnoćom:

gdje je β Boltzmannova konstanta, a temperatura T može se odabrati, tako da u početnim rundama bude visoka i da se polhako žari kako bi se prevazišli lokalni minimumi.[13]

FASTER

[uredi | uredi izvor]

Algoritam FASTER koristi kombinaciju determinističkih i stohastičkih kriterija za optimizaciju sekvenci aminokiselina. FASTER prvo koristi DEE kako bi eliminirao rotamere koji nisu dio optimalnog rješenja. Zatim, niz iterativnih koraka optimizira dodjeljivanje rotamera..[35][36]

Propagacija vjerovanja

[uredi | uredi izvor]

U propagaciji vjerovanja za dizajn proteina, algoritam razmjenjuje poruke koje opisuju uvjerenje koje svaki ostatak ima o vjerovatnoći svakog rotamera u susjednim ostacima. Algoritam ažurira poruke na svakoj iteraciji i iterira do konvergencije ili do fiksnog broja iteracija. Konvergencija nije zagarantovana u dizajnu proteina. Poruka mi j(rj koju ostatak i šalje svakom rotameru (rj na susjednom ostatku j definirana je kao:

I propagacija vjerovanja na osnovu maksimalnog proizvoda i na osnovu sume proizvoda korištena je za optimizaciju dizajna proteina.

Primjene i primjeri dizajniranih proteina

[uredi | uredi izvor]

Dizajn enzima

[uredi | uredi izvor]

Dizajn novih enzima je upotreba dizajna proteina sa ogromnim bioinženjerskim i biomedicinskim primjenama. Općenito, dizajniranje proteinske strukture može se razlikovati od dizajniranja enzima, jer dizajn enzima mora uzeti u obzir mnoga stanja uključena u katalitski mehanizam enzima. Međutim, dizajn proteina je preduvjet dizajna enzima de novo jer, u najmanju ruku, dizajn katalizatora zahtijeva skelu u koju se može umetnuti katalitski mehanizam.[37]

Veliki napredak u dizajnu i redizajnu enzima „de novo“ postignut je u prvoj deceniji 21. vijeka. U tri velike studije, David Baker i saradnici „de novo“ su dizajnirali enzime za retro-aldolnu reakciju,[38] Kemp-eliminacijsku reakciju,[39] i za Diels-Alderovu reakcijua.[40] Također, u laboratoriji Brucea Donalda, korišten je računarski dizajn proteina za promjenu specifičnosti jednog od proteinskih domena neribosomalne peptidne sintetaze koji proizvodi Gramicidin S, sa njegovog prirodnog supstrata fenilalanina na druge nesrodne supstrate, uključujući nabijene aminokiseline; redizajnirani enzimi imali su aktivnosti bliske onima divljeg tipa.[41]

Poluracionalni dizajn

[uredi | uredi izvor]

Poluracionalni dizajn je svrsishodna metoda modifikacije zasnovana na određenom razumijevanju sekvence, strukture i katalitičkog mehanizma enzima. Ova metoda se nalazi između iracionalnog i racionalnog dizajna. Koristi poznate informacije i sredstva za izvođenje evolucijske modifikacije specifične funkcije ciljnog enzima. Karakteristika poluracionalnog dizajna je da se ne oslanja isključivo na slučajne mutacije i skrining, već kombinuje koncept usmjerene evolucije. Stvara biblioteku slučajnih mutanata sa različitim sekvencama putem mutageneze, RCR-a sklonpg greškama, rekombinacije DNK i mutageneze zasićenja mjesta. Istovremeno, koristi razumijevanje enzima i principa dizajna kako bi svrsishodno isključio mutante sa željenim karakteristikama.

Metodologija poluracionalnog dizajna naglašava dubinsko razumijevanje enzima i kontrolu evolucijskog procesa. Omogućava istraživačima da koriste poznate informacije za vođenje evolucijskog procesa, čime se poboljšava efikasnost i stopa uspjeha. Ova metoda igra važnu ulogu u modifikaciji funkcije proteina jer može kombinovati prednosti iracionalnog i racionalnog dizajna, te može istraživati nepoznati prostor i koristiti poznato znanje za ciljanu modifikaciju.

Poluracionalni dizajn ima širok spektar primjena, uključujući, ali ne ograničavajući se na optimizaciju enzima, modifikaciju ciljeva lijekova, evoluciju biokatalizatora itd. Pomoću ove metode, istraživači mogu efikasnije poboljšati funkcionalna svojstva proteina kako bi zadovoljili specifične biotehnološke ili medicinske potrebe. Iako ova metoda ima visoke zahtjeve za informacijama i tehnologijom i relativno ju je teško implementirati, s razvojem računarske tehnologije i bioinformatike, izgledi primjene poluracionalnog dizajna u proteinskom inženjerstvu postaju sve širi.[42]

Dizajn za afinitet

[uredi | uredi izvor]

Interakcije proteina-protein uključene su u većinu biotičkih procesa. Mnoge od najteže liječivih bolesti, poput Alzheimerove bolesti, mnogih oblika raka (npr. TP53) i infekcije virusa ljudske imunodeficijencije , uključuju interakcije protein-protein. Stoga je za liječenje takvih bolesti poželjno dizajnirati proteine ili terapiju sličnu proteinima koja se veže za jednog od partnera u interakciji i na taj način prekida interakciju koja uzrokuje bolest. To zahtijeva dizajniranje proteinske terapije za afinitet prema svom partneru.

Interakcije proteina-protein mogu se dizajnirati korištenjem algoritama za dizajn proteina jer principi koji upravljaju stabilnošću proteina također upravljaju vezivanjem proteina i proteina. Međutim, dizajn interakcije protein-protein predstavlja izazove koji nisu obično prisutni u dizajnu proteina. Jedan od najvažnijih izazova je taj što su, općenito, interfejsi između proteina polarniji od proteinskih jezgara, a vezivanje uključuje kompromis između desolvatacije i formiranja vodikove veze.[43] Da bi prevazišli ovaj izazov, Bruce Tidor i saradnici razvili su metodu za poboljšanje afiniteta antitijela fokusirajući se na elektrostatičke doprinose. Otkrili su da je, za antitijela dizajnirana u studiji, smanjenje troškova desolvatacije ostataka u međupovršini povećalo afinitet vezivnog para.[43][44][45]

Ocjenjivanje predviđanja vezivanja

[uredi | uredi izvor]

Energetske funkcije dizajna proteina moraju se prilagoditi za bodovanje predviđanja vezivanja jer vezivanje uključuje kompromis između najnižih -energija konformacija slobodnih proteina (EP i EL) i najniže energetske konformacije vezanog kompleksa (EPL):

.+

K* algoritam aproksimira konstantu vezivanja algoritma uključivanjem konformacijske entropije u izračun slobodne energije. K* algoritam uzima u obzir samo konformacije najniže energije slobodnih i vezanih kompleksa (označenih skupovima P, L i PL) kako bi aproksimirao particijske funkcije svakog kompleksa:[15]

Dizajn za specifičnost

[uredi | uredi izvor]

Dizajn interakcija protein-protein mora biti vrlo specifičan jer proteini mogu interreagovati s velikim brojem proteina; uspješan dizajn zahtijeva selektivne vezivne supstance. Stoga, algoritmi za dizajn proteina moraju biti u stanju razlikovati vezivanje na meti (ili pozitivni dizajn) i vezivanje van mete (ili negativni dizajn).[2][43] Jedan od najistaknutijih primjera dizajna za specifičnost je dizajn specifičnih peptida koji se vežu za bZIP od strane Amy Keating i saradnika za 19 od 20 bZIP porodica; osam od ovih peptida bilo je specifično za svog namjeravanog partnera u odnosu na konkurentske peptide.[43][46][47] Nadalje, Anderson i saradnici su također koristili pozitivan i negativan dizajn za predviđanje mutacija u aktivnom mjestu cilja lijeka koje su uzrokovale otpornost na novi lijek; pozitivni dizajn je korišten za održavanje aktivnosti divljeg tipa, dok je negativni dizajn korišten za prekid vezivanja lijeka.[48] Nedavni računarski redizajn koji su odradili Costas Maranas i saradnici također je omogućio eksperimentalno prebacivanje specifičnosti ksiloza reduktaze (kofaktor Candida boidinii sa NADPH na NADH.[49]

Obnavljanje površine proteina

[uredi | uredi izvor]

Obnavljanje površine proteina sastoji se od dizajniranja površine proteina uz očuvanje cjelokupnog nabora, jezgra i graničnih područja proteina netaknutim. Obnavljanje površine proteina je posebno korisno za promjenu vezivanja proteina za druge proteine. Jedna od najvažnijih primjena obnavljanja površine proteina bio je dizajn RSC3 sonde za odabir široko neutralizirajućih antitijela protiv HIV-a u Istraživačkom centru za vakcine NIH. Prvo su odabrani ostaci izvan vezivnog interfejsa između proteina omotača HIV-a gp120 i ranije otkrivenog b12-antitijela za dizajniranje. Zatim je razmak sekvenci odabran na osnovu evolucijskih informacija, topljivosti, sličnosti s divljim tipom i drugih razmatranja. Zatim je korišten softver RosettaDesign za pronalaženje optimalnih sekvenci u odabranom prostoru sekvenci. RSC3 je kasnije korišten za otkrivanje široko neutralizirajućeg antitijela VRC01 u serumu dugotrajno HIV-inficirane osobe bez progresije.[50]

Dizajn globulastih proteina

[uredi | uredi izvor]

Globulaati proteini su proteini koji sadrže hidrofobno jezgro i hidrofilnu površinu. Globulasti proteini često imaju stabilnu strukturu, za razliku od vlaknastih proteina, koji imaju višestruke konformacije. Trodimenzijsku strukturu globulastih proteina obično je lakše odrediti putem rendgenske kristalografije i nuklearne magnetne rezonance nego vlaknastih i membranskih proteina, što globulaste proteine čini atraktivnijim za dizajn proteina od drugih vrsta proteina. Većina uspješnih dizajna proteina uključivala je globularne proteine. I RSD-1 i Top7 bili su de novo dizajni globulaatstih proteina. Još pet proteinskih struktura dizajnirano je, sintetizirano i verificirano 2012. godine od strane Bakerpve grupe. Ovi novi proteini nemaju biotičku funkciju, ali su strukture namijenjene da djeluju kao gradivni blokovi koji se mogu proširiti kako bi uključili funkcionalna aktivna mjesta. Strukture su pronađene računarski korištenjem novih heuristika zasnovanih na analizi povezujućih petlji između dijelova sekvence koje specificiraju sekundarne strukture..[51]

Dizajn membranskih proteina

[uredi | uredi izvor]

Nekoliko transmembranskih proteina je uspješno dizajnirano,[52] along with many other membrane-associated peptides and proteins.[53] Recently, Costas Maranas and his coworkers developed an automated tool[54] to redesign the pore size of Outer Membrane Porin Type-F (OmpF) from E.coli to any desired sub-nm size and assembled them in membranes to perform precise angstrom scale separation.

Ostale primjene

[uredi | uredi izvor]

Jedna od najpoželjnijih upotreba za dizajn proteina su biosenzori, proteini koji će osjetiti prisustvo specifičnih spojeva. Neki pokušaji u dizajnu biosenzora uključuju senzore za neprirodne molekule, uključujući TNT.[55] Nedavno su Kuhlman i saradnici dizajnirali biosenzor PAK1.[56]

U određenom smislu, dizajn proteina je podskup dizajna baterije.

Također pogledajte

[uredi | uredi izvor]

Reference

[uredi | uredi izvor]
  1. Korendovych, Ivan (19. 3. 2018). "Minimalist design of peptide and protein catalysts". American Chemical Society. Pristupljeno 22. 3. 2018.
  2. 1 2 3 4 5 6 Richardson, JS; Richardson, DC (juli 1989). "The de novo design of protein structures". Trends in Biochemical Sciences. 14 (7): 304–9. doi:10.1016/0968-0004(89)90070-4. PMID 2672455.
  3. 1 2 3 Dahiyat, BI; Mayo, SL (3. 10. 1997). "De novo protein design: fully automated sequence selection". Science. 278 (5335): 82–7. CiteSeerX 10.1.1.72.7304. doi:10.1126/science.278.5335.82. PMID 9311930.
  4. 1 2 Gordon, DB; Marshall, SA; Mayo, SL (august 1999). "Energy functions for protein design". Current Opinion in Structural Biology. 9 (4): 509–13. doi:10.1016/s0959-440x(99)80072-4. PMID 10449371.
  5. 1 2 Harbury, PB; Plecs, JJ; Tidor, B; Alber, T; Kim, PS (20. 11. 1998). "High-resolution protein design with backbone freedom". Science. 282 (5393): 1462–7. doi:10.1126/science.282.5393.1462. PMID 9822371.
  6. 1 2 3 Kuhlman, B; Dantas, G; Ireton, GC; Varani, G; Stoddard, BL; Baker, D (21. 11. 2003). "Design of a novel globular protein fold with atomic-level accuracy". Science. 302 (5649): 1364–8. Bibcode:2003Sci...302.1364K. doi:10.1126/science.1089427. PMID 14631033. S2CID 1939390.
  7. Sterner, R; Merkl, R; Raushel, FM (maj 2008). "Computational design of enzymes". Chemistry & Biology. 15 (5): 421–3. doi:10.1016/j.chembiol.2008.04.007. PMID 18482694.
  8. Wu, X; Yang, ZY; Li, Y; Hogerkorp, CM; Schief, WR; Seaman, MS; Zhou, T; Schmidt, SD; Wu, L; Xu, L; Longo, NS; McKee, K; O'Dell, S; Louder, MK; Wycuff, DL; Feng, Y; Nason, M; Doria-Rose, N; Connors, M; Kwong, PD; Roederer, M; Wyatt, RT; Nabel, G; Mascola, JR (13. 8. 2010). "Rational design of envelope identifies broadly neutralizing human monoclonal antibodies to HIV-1". Science. 329 (5993): 856–61. Bibcode:2010Sci...329..856W. doi:10.1126/science.1187659. PMC 2965066. PMID 20616233.
  9. "Press Release: The Nobel Prize in Chemistry 2024". Nobel Prize. 9. 10. 2024. Pristupljeno 31. 3. 2025.
  10. Höcker, B (8. 11. 2012). "Structural biology: A toolbox for protein design". Nature. 491 (7423): 204–5. Bibcode:2012Natur.491..204H. doi:10.1038/491204a. PMID 23135466. S2CID 4426247.
  11. 1 2 3 Lovell, SC; Word, JM; Richardson, JS; Richardson, DC (15. 8. 2000). "The penultimate rotamer library". Proteins. 40 (3): 389–408. CiteSeerX 10.1.1.555.4071. doi:10.1002/1097-0134(20000815)40:3<389::AID-PROT50>3.0.CO;2-2. PMID 10861930. S2CID 3055173.
  12. Shapovalov, MV; Dunbrack RL, Jr (8. 6. 2011). "A smoothed backbone-dependent rotamer library for proteins derived from adaptive kernel density estimates and regressions". Structure. 19 (6): 844–58. doi:10.1016/j.str.2011.03.019. PMC 3118414. PMID 21645855.
  13. 1 2 Samish, I; MacDermaid, CM; Perez-Aguilar, JM; Saven, JG (2011). "Theoretical and computational protein design". Annual Review of Physical Chemistry. 62: 129–49. Bibcode:2011ARPC...62..129S. doi:10.1146/annurev-physchem-032210-103509. PMID 21128762.
  14. 1 2 Mandell, DJ; Kortemme, T (august 2009). t=pqrxq4 "Backbone flexibility in computational protein design" Provjerite vrijednost parametra |url= (pomoć) (PDF). Current Opinion in Biotechnology. 20 (4): 420–8. doi:10.1016/j.copbio.2009.07.006. PMID 19709874.
  15. 1 2 3 4 5 6 Donald, Bruce R. (2011). Algorithms in Structural Molecular Biology. Cambridge, Mass.: MIT Press.
  16. 1 2 Boas, F. E. & Harbury, P. B. (2007). "Potential energy functions for protein design". Current Opinion in Structural Biology. 17 (2): 199–204. doi:10.1016/j.sbi.2007.03.006. PMID 17387014.
  17. 1 2 3 Boas, FE; Harbury, PB (april 2007). "Potential energy functions for protein design". Current Opinion in Structural Biology. 17 (2): 199–204. doi:10.1016/j.sbi.2007.03.006. PMID 17387014.
  18. Vizcarra, CL; Mayo, SL (decembar 2005). "Electrostatics in computational protein design". Current Opinion in Chemical Biology. 9 (6): 622–6. doi:10.1016/j.cbpa.2005.10.014. PMID 16257567.
  19. Zhou, T; Georgiev, I; Wu, X; Yang, ZY; Dai, K; Finzi, A; Kwon, YD; Scheid, JF; Shi, W; Xu, L; Yang, Y; Zhu, J; Nussenzweig, MC; Sodroski, J; Shapiro, L; Nabel, GJ; Mascola, JR; Kwong, PD (13. 8. 2010). "Structural basis for broad and potent neutralization of HIV-1 by antibody VRC01". Science. 329 (5993): 811–7. Bibcode:2010Sci...329..811Z. doi:10.1126/science.1192819. PMC 2981354. PMID 20616231.
  20. Mendes, J; Guerois, R; Serrano, L (august 2002). "Energy estimation in protein design". Current Opinion in Structural Biology. 12 (4): 441–6. doi:10.1016/s0959-440x(02)00345-7. PMID 12163065.
  21. Pierce, NA; Winfree, E (oktobar 2002). "Protein design is NP-hard". Protein Engineering. 15 (10): 779–82. doi:10.1093/protein/15.10.779. PMID 12468711.
  22. 1 2 Voigt, CA; Gordon, DB; Mayo, SL (9. 6. 2000). "Trading accuracy for speed: A quantitative comparison of search algorithms in protein sequence design". Journal of Molecular Biology. 299 (3): 789–803. CiteSeerX 10.1.1.138.2023. doi:10.1006/jmbi.2000.3758. PMID 10835284.
  23. Hong, EJ; Lippow, SM; Tidor, B; Lozano-Pérez, T (septembar 2009). "Rotamer optimization for protein design through MAP estimation and problem-size reduction". Journal of Computational Chemistry. 30 (12): 1923–45. doi:10.1002/jcc.21188. PMC 3495010. PMID 19123203.
  24. "Machine learning reveals recipe for building artificial proteins". phys.org (jezik: engleski). Pristupljeno 17. 8. 2020.
  25. Russ, William P.; Figliuzzi, Matteo; Stocker, Christian; Barrat-Charlaix, Pierre; Socolich, Michael; Kast, Peter; Hilvert, Donald; Monasson, Remi; Cocco, Simona; Weigt, Martin; Ranganathan, Rama (2020). "An evolution-based model for designing chorismatemutase enzymes". Science. 369 (6502): 440–445. Bibcode:2020Sci...369..440R. doi:10.1126/science.aba3304. PMID 32703877. S2CID 220714458.
  26. "Biologists train AI to generate medicines and vaccines" (jezik: engleski). University of Washington-Harborview Medical Center.
  27. Wang, Jue; Lisanza, Sidney; Juergens, David; Tischer, Doug; Watson, Joseph L.; Castro, Karla M.; Ragotte, Robert; Saragovi, Amijai; Milles, Lukas F.; Baek, Minkyung; Anishchenko, Ivan; Yang, Wei; Hicks, Derrick R.; Expòsit, Marc; Schlichthaerle, Thomas; Chun, Jung-Ho; Dauparas, Justas; Bennett, Nathaniel; Wicky, Basile I. M.; Muenks, Andrew; DiMaio, Frank; Correia, Bruno; Ovchinnikov, Sergey; Baker, David (22. 7. 2022). "Scaffolding protein functional sites using deep learning" (PDF). Science (jezik: engleski). 377 (6604): 387–394. Bibcode:2022Sci...377..387W. doi:10.1126/science.abn2100. ISSN 0036-8075. PMC 9621694 Provjerite vrijednost parametra |pmc= (pomoć). PMID 35862514 Provjerite vrijednost parametra |pmid= (pomoć).
  28. Gordon, DB; Mayo, SL (15. 9. 1999). "Branch-and-terminate: a combinatorial optimization algorithm for protein design". Structure. 7 (9): 1089–98. doi:10.1016/s0969-2126(99)80176-2. PMID 10508778.
  29. 1 2 Leach, AR; Lemon, AP (1. 11. 1998). "Exploring the conformational space of protein side chains using dead-end elimination and the A* algorithm". Proteins. 33 (2): 227–39. CiteSeerX 10.1.1.133.7986. doi:10.1002/(sici)1097-0134(19981101)33:2<227::aid-prot7>3.0.co;2-f. PMID 9779790. S2CID 12872539.
  30. 1 2 Kingsford, CL; Chazelle, B; Singh, M (1. 4. 2005). "Solving and analyzing side-chain positioning problems using linear and integer programming". Bioinformatics. 21 (7): 1028–36. doi:10.1093/bioinformatics/bti144. PMID 15546935.
  31. Yanover, Chen; Talya Meltzer; Yair Weiss (2006). "Linear Programming Relaxations and Belief Propagation – An Empirical Study". Journal of Machine Learning Research. 7: 1887–1907.
  32. Wainwright, Martin J; Tommi S. Jaakkola; Alan S. Willsky (2005). "MAP estimation via agreement on trees: message-passing and linear programming". IEEE Transactions on Information Theory. 51 (11): 3697–3717. CiteSeerX 10.1.1.71.9565. doi:10.1109/tit.2005.856938. S2CID 10007532.
  33. Kolmogorov, Vladimir (28. 10. 2006). "Convergent tree-reweighted message passing for energy minimization". IEEE Transactions on Pattern Analysis and Machine Intelligence. 28 (10): 1568–1583. doi:10.1109/TPAMI.2006.200. PMID 16986540. S2CID 8616813.
  34. Globerson, Amir; Tommi S. Jaakkola (2007). "Fixing max-product: Convergent message passing algorithms for MAP LP-relaxations". Advances in Neural Information Processing Systems.
  35. Allen, BD; Mayo, SL (30. 7. 2006). "Dramatic performance enhancements for the FASTER optimization algorithm". Journal of Computational Chemistry. 27 (10): 1071–5. CiteSeerX 10.1.1.425.5418. doi:10.1002/jcc.20420. PMID 16685715. S2CID 769053.
  36. Desmet, J; Spriet, J; Lasters, I (1. 7. 2002). "Fast and accurate side-chain topology and energy refinement (FASTER) as a new method for protein structure optimization". Proteins. 48 (1): 31–43. doi:10.1002/prot.10131. PMID 12012335. S2CID 21524437.
  37. Baker, D (oktobar 2010). "An exciting but challenging road ahead for computational enzyme design". Protein Science. 19 (10): 1817–9. doi:10.1002/pro.481. PMC 2998717. PMID 20717908.
  38. Jiang, Lin; Althoff, Eric A.; Clemente, Fernando R.; Doyle, Lindsey; Rothlisberger, Daniela; Zanghellini, Alexandre; Gallaher, Jasmine L.; Betker, Jamie L.; Tanaka, Fujie (2008). "De Novo Computational Design of Retro-Aldol Enzymes". Science. 319 (5868): 1387–91. Bibcode:2008Sci...319.1387J. doi:10.1126/science.1152692. PMC 3431203. PMID 18323453.
  39. Röthlisberger, Daniela; Khersonsky, Olga; Wollacott, Andrew M.; Jiang, Lin; Dechancie, Jason; Betker, Jamie; Gallaher, Jasmine L.; Althoff, Eric A.; Zanghellini, Alexandre (2008). "Kemp elimination catalysts by computational enzyme design". Nature. 453 (7192): 190–5. Bibcode:2008Natur.453..190R. doi:10.1038/nature06879. PMID 18354394.
  40. Siegel, JB; Zanghellini, A; Lovick, HM; Kiss, G; Lambert, AR; St Clair, JL; Gallaher, JL; Hilvert, D; Gelb, MH; Stoddard, BL; Houk, KN; Michael, FE; Baker, D (16. 7. 2010). "Computational design of an enzyme catalyst for a stereoselective bimolecular Diels-Alder reaction". Science. 329 (5989): 309–13. Bibcode:2010Sci...329..309S. doi:10.1126/science.1190239. PMC 3241958. PMID 20647463.</refNadalje, Stephen Mayo i saradnici razvili su iterativnu metodu za dizajniranje najefikasnijeg poznatog enzima za Kemp-eliminacijsku reakciju.<ref>Privett, HK; Kiss, G; Lee, TM; Blomberg, R; Chica, RA; Thomas, LM; Hilvert, D; Houk, KN; Mayo, SL (6. 3. 2012). "Iterative approach to computational enzyme design". Proceedings of the National Academy of Sciences of the United States of America. 109 (10): 3790–5. Bibcode:2012PNAS..109.3790P. doi:10.1073/pnas.1118082108. PMC 3309769. PMID 22357762.
  41. Chen, CY; Georgiev, I; Anderson, AC; Donald, BR (10. 3. 2009). "Computational structure-based redesign of enzyme activity". Proceedings of the National Academy of Sciences of the United States of America. 106 (10): 3764–9. Bibcode:2009PNAS..106.3764C. doi:10.1073/pnas.0900266106. PMC 2645347. PMID 19228942.
  42. Korendovych, Ivan V. (2018). "Rational and Semirational Protein Design". Protein Engineering. Methods in Molecular Biology (Clifton, N.J.). 1685. str. 15–23. doi:10.1007/978-1-4939-7366-8_2. ISBN 978-1-4939-7364-4. ISSN 1064-3745. PMC 5912912. PMID 29086301.
  43. 1 2 3 4 Karanicolas, J; Kuhlman, B (august 2009). "Computational design of affinity and specificity at protein–protein interfaces". Current Opinion in Structural Biology. 19 (4): 458–63. doi:10.1016/j.sbi.2009.07.005. PMC 2882636. PMID 19646858.
  44. Shoichet, BK (oktobar 2007). "No free energy lunch". Nature Biotechnology. 25 (10): 1109–10. doi:10.1038/nbt1007-1109. PMID 17921992. S2CID 5527226.
  45. Lippow, SM; Wittrup, KD; Tidor, B (oktobar 2007). "Computational design of antibody-affinity improvement beyond in vivo maturation". Nature Biotechnology. 25 (10): 1171–6. doi:10.1038/nbt1336. PMC 2803018. PMID 17891135.
  46. Schreiber, G; Keating, AE (februar 2011). "Protein binding specificity versus promiscuity". Current Opinion in Structural Biology. 21 (1): 50–61. doi:10.1016/j.sbi.2010.10.002. PMC 3053118. PMID 21071205.
  47. Grigoryan, G; Reinke, AW; Keating, AE (16. 4. 2009). "Design of protein-interaction specificity gives selective bZIP-binding peptides". Nature. 458 (7240): 859–64. Bibcode:2009Natur.458..859G. doi:10.1038/nature07885. PMC 2748673. PMID 19370028.
  48. Frey, KM; Georgiev, I; Donald, BR; Anderson, AC (3. 8. 2010). "Predicting resistance mutations using protein design algorithms". Proceedings of the National Academy of Sciences of the United States of America. 107 (31): 13707–12. Bibcode:2010PNAS..10713707F. doi:10.1073/pnas.1002162107. PMC 2922245. PMID 20643959.
  49. Khoury, GA; Fazelinia, H; Chin, JW; Pantazes, RJ; Cirino, PC; Maranas, CD (oktobar 2009). "Computational design of Candida boidinii xylose reductase for altered cofactor specificity". Protein Science. 18 (10): 2125–38. doi:10.1002/pro.227. PMC 2786976. PMID 19693930.
  50. Burton, DR; Weiss, RA (13. 8. 2010). "AIDS/HIV. A boost for HIV vaccine design". Science. 329 (5993): 770–3. Bibcode:2010Sci...329..770B. doi:10.1126/science.1194693. PMID 20705840. S2CID 206528638.
  51. Jessica Marshall (7. 11. 2012). "Proteins made to order". Nature News. Pristupljeno 17. 11. 2012.
  52. [https://opm.phar.umich.edu/superfamilies/478 Dizajnirani transmembranski alfa-ukosni proteini u OPM bazi podataka
  53. Designed membrane-associated peptides and proteins in OPM database
  54. Chowdhury, Ratul; Kumar, Manish; Maranas, Costas D.; Golbeck, John H.; Baker, Carol; Prabhakar, Jeevan; Grisewood, Matthew; Decker, Karl; Shankla, Manish (10. 9. 2018). "PoreDesigner for tuning solute selectivity in a robust and highly permeable outer membrane pore". Nature Communications (jezik: engleski). 9 (1): 3661. Bibcode:2018NatCo...9.3661C. doi:10.1038/s41467-018-06097-1. ISSN 2041-1723. PMC 6131167. PMID 30202038.
  55. Looger, Loren L.; Dwyer, Mary A.; Smith, James J. & Hellinga, Homme W. (2003). "Computational design of receptor and sensor proteins with novel functions". Nature. 423 (6936): 185–190. Bibcode:2003Natur.423..185L. doi:10.1038/nature01556. PMID 12736688. S2CID 4387641.
  56. Jha, RK; Wu, YI; Zawistowski, JS; MacNevin, C; Hahn, KM; Kuhlman, B (21. 10. 2011). "Redesign of the PAK1 autoinhibitory domain for enhanced stability and affinity in biosensor applications". Journal of Molecular Biology. 413 (2): 513–22. doi:10.1016/j.jmb.2011.08.022. PMC 3202338. PMID 21888918.

Dodatni izvori

[uredi | uredi izvor]

Šablon:Biomolekularna struktura Šablon:Dizajn