wiczenia do kursu bt ć 172
Transkrypt
wiczenia do kursu bt ć 172
ĆWICZENIA DO KURSU BT172 Zastosowanie modelowania molekularnego w Biotechnologii II Zasady ogólne: Do wykonania są 3 ćwiczenia, każde ćwiczenie trwa 5 godzin lekcyjnych (3.75 godzin zegarowych). Konieczne jest wykonanie następujących ćwiczeń: 1(2), 2(5), 3(7). Cyfry w nawiasach tyczą oryginalnej numeracji w skrypcie. Materiały do ćwiczeń stanowią: 1) zbiór zmodyfikowanych instrukcji zebranych w niniejszym opracowaniu 2) skrypt „Modelowanie molekularne biocząsteczek ćwiczenia z podstaw i zastosowań” pod redakcją prof. dr hab. Marty Pasenkiewicz-Gieruli – informacje tyczące „teorii” do ćwiczeń. 3) zbiór załączników (Uzupełnienia) które każda para otrzymuje na czas ćwiczeń . W ćwiczeniach wykorzystane są róż ne programy jak: komercyjny (Accelrys) http://www.accelrys.com/ nie-komercyjny (Tinker) http://dasher.wustl.edu/tinker/ Programy uruchamiane są na stacjach graficznych firmy Silicon Graphics (SGI). Komputery te pracują pod systemem operacyjnym UNIX (IRIX6.2). http://www.sgi.com/ http://www.computerhope.com/unix/irix.htm Proszę zapoznać się z rozdziałami “Dostęp do zasobów komputerowych” oraz “Komendy systemu opreacyjnego oraz krótki opis programów komputerowych” skryptu. Inne uż yteczne niekomercyjne programy - nie uż ywane podczas ć wiczeniach. symulacje dynamiki molekularnej (Gromacs) http://www.gromacs.org/ (Amber) http://amber.scripps.edu/ (Charmm) http://yuri.harvard.edu/ wizualizacja struktur: (Rasmol 2.7.3) http://www.rasmol.org/ (VMD) http://www.ks.uiuc.edu/Research/vmd/ Raster3D http://www.bmsc.washington.edu/raster3d/raster3d.html strona z dużym zbiorem niekomercyjnych programów do modelowania molekularnego i pokrewnych zastosowań: http://www.rcsb.org/pdb/software-list.html 1 Ciekawe strony: BringingPhysicsto Life http://www.ks.uiuc.edu/Publications/Brochures/BPTL/ NationalScienceFoundation http://www.nsf.gov/ Centerfor BiophysicsandComputationalBiology http://www.life.uiuc.edu/biophysics/courses.html Zasoby internetowe Poniżej zestawiono, wraz ze zwięzłym opisem, wybrane strony internetowe (patrz 1-sze ćwiczenie), umożliwiające dostęp do informacji, które mogą być cenne dla osób zainteresowanych modelowaniem molekularnym, biotechnologią, badaniami strukturalnymi oraz pokrewnymi dziedzinami. Adresy stron internetowych napisane są czcionką pogrubioną. 1.MEDLINE – Baza danych literaturowych o tematyce medycznej i pokrewnych (m.in. biochemia, biofizyka). Literatura, odszukana według odpowiedniego “słowa kluczowego”, może być podana w formie odnoś nika, abstraktu lub niekiedy całego artykułu (w większoś ci wypadków całe artykuły można uzyskać jedynie na podstawie subskrypcji). Opcja Advanced Search umożliwia przeszukiwanie literatury z wykorzystaniem operatorów logicznych oraz “słów kluczowych” różnych typów. http://www.ncbi.nlm.nih.gov/PubMed 2. Biblioteka, zawierająca dane na temat zachowawczych fragmentów łańcuchów białek, należących do rodzin homologicznych pod względem struktury. http://smi-web.stanford.edu/projects/helix/LPFC 3. Strona, na której można znaleźć programy służące do analizy sekwencji aminokwasowej białek (peptydów) i przewidywania na tej podstawie m.in. ich struktury drugorzędowej oraz własnoś ci fizykochemicznych. http://pbil.ibcp.fr/html/pbil_index.html Tytuły ć wiczeń: 1. (skrypt ćw. nr 1(2)) Modelowanie mutacji peptydu i białka metodą zaburzania energii swobodnej oraz bezpośredniej wymiany aminokwasu. (G.Jezierski, M.Pasenkiewicz-Gierula) 2. (skrypt ćw. nr 2(5)) Porównanie fizykochemicznych własnoś ci i struktur biocząsteczek; algorytmy poszukiwania optymalnej struktury biocząsteczki. (K.Murzyn,M.Pasenkiewicz-Gierula) 3. (skrypt ćw. nr 3(7)) Wyznaczanie natywnej struktury biocząsteczki poprzez poszukiwanie minimum globalnego funkcji potencjału. (K.Murzyn,M.Pasenkiewicz-Gierula). 2 Ćwiczenie 1(2). Modelowanie mutacji peptytu i białka metodą zaburzenia energii swobodnej oraz bezpoś redniej wymiany aminokwasu (G. Jezierski, M. Pasenkiewicz-Gierula). Opracowanie ć wiczenia: Ćwiczenie należy opracować według punktów znajdujących się na końcu instrukcji oraz podać wyniki, opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji dwoma gwiazdkami (**). Cel, teoria i wykonanie: Ćwiczenie 1(2) ma na celu zaznajomienie studentów z metodą zaburzenia energii swobodnej (FEP). Metoda ta będzie zastosowana do wymiany aminokwasu w tripeptydzie oraz obliczenia wielkoś ci termodynamicznych w reakcji wiązania zmutowanego peptydu do receptora. Pozwoli to na wyznaczenie względnej różnicy energii swobodnych (∆∆G) wiązania naturalnego i zmutowanego peptydu do receptora i okreś lenia, który z peptydów silniej wiąże się z receptorem. Metoda zaburzania energii swobodnej – wymiana aminokwasu w tripeptydzie. IA. Teoria: IA1. Założenia metody Metoda zaburzenia energii swobodnej (ang. FEP – Free Energy Perturbation) służy do obliczenia różnicy energii swobodnej (∆F = FA - FB) dwóch stanów A i B pozostających w równowadze termodynamicznej dla układów, w których zmiana energii swobodnej równa jest zmianie entalpii swobodnej (∆F = ∆G). W modelowaniu molekularnym metodę FEP wykorzystuje się najczęś ciej do wyznaczania względnej różnicy energii oddziaływania między makrocząsteczką a ligandem (ligand binding). Jeś li znana jest zmiana entalpii swobodnej (∆G) wiązania jednego liganda z makrocząsteczką, to przy pomocy metody FEP można wyznaczyć ∆G dla wiązania innego liganda z tą samą makrocząsteczką, jednakże cząsteczki obu ligandów muszę mieć podobną liczbę atomów i podobny rozkład ładunku, tj. muszą się niewiele różnić. Dla obliczenia ∆G korzysta się z procedury zwanej całkowaniem termodynamicznym oraz z przedstawionego niżej cyklu termodynamicznego. Obliczone wartoś ci ∆G obarczone są dużymi błędami, dlatego metodą FEP wyznacza się względną różnicę energii swobodnych tj., ∆∆G – tę wartość można wyznaczyć z dokładnoś cią 0.5-1.5 kcal/mol. IA2. Całkowanie termodynamiczne W metodzie FEP przekształcamy cząsteczkę A, dla której ∆G wiązania z białkiem jest znane, w cząsteczkę B, dla której ∆G wiązania z białkiem chcemy wyznaczyć. Takie przekształcenie przeprowadza się poprzez modyfikację hamiltonianu (funkcji energii) układu, sterowaną parametrem sprzęgającym λ. λ równe 0.0 odpowiada czasteczce A, λ równe 1.0 odpowiada czasteczce B, a ułamkowe wartoś ci λ oznaczają stany poś rednie między cząsteczką A i B. Dla kolejnych wartoś ci λ z przedziału (0.0, 1.0) (∆λi we wzorze 1) przeprowadzamy symulacje dynamiki molekularnej badanego układu (całkowanie równań Newtona po czasie t). W efekcie, w metodzie zaburzenia energii swobodnej przeprowadzamy całkowanie numeryczne po dwóch zmiennych: t (rówanie ruchu) i λ (pochodna energii swobodnej względem parametru sprzęgającego). δλ jest wielkoś cią zaburzenia (perturbacji). W niniejszym ćwiczeniu stosowany jest algorytm FDTI (Mezei et al., 1987), będący zmodyfikowaną 3 wersją wcześ niej opracowanych algorytmów: PM (perturbation method) i TI (Termodynamic Integration). Algorytm ten pozwala na obliczenie wartoś ci ∆G (w tym wypadku dla “procesu mutacji”) zgodnie z zależnoś cią: (1) gdzie: • E oznacza energię obliczoną z zadanej funkcji potencjału dla dynamicznej struktury układu w równowadze • nawias trójkątny 〈〉i oznacza ś redniowanie po kolejnych konformacjach w czasie danego cyklu symulacji dynamiki molekularnej • wyrażenie w nawiasie trójkątnym jest to tzw. czynnik Boltzmanna suma po i oznacza numeryczne całkowanie po parametrze λ. IA3. Przykładowe zastosowania metody FEP Metodę FEP można stosować do okreś lenia wielkoś ci oddziaływań lek syntetyczny-receptor, peptydreceptor, enzym-substrat oraz do obliczania wartoś ci ∆G hydratacji dowolnych cząsteczek organicznych. W tym ćwiczeniu zostaną obliczone wartoś ci: ∆G, ∆∆G i K dla oddziaływań receptor-ligand. R jest hipotetycznym receptorem, ligandami są: peptyd „naturalny” P0 = PheThrGlu (P0R), oraz peptyd „zmutowany” PM = PheValGlu (PMR). Odpowiedni cykl termodynamiczny ma postać: Symbole P0R i PMR oznaczają kompleksy receptora z peptydem odpowiednio: „naturalnym” i “zmutowanym”. ∆GBO i ∆GBM opisują procesy rzeczywiste, ∆GP i ∆GPR procesy “komputerowe”. Zasada cyklu termodynamicznego mówi, że ∆GBO- ∆GBM = ∆GP- ∆GPR. 4 Zagadnienia do przygotowania: 1. Wzory i symbole (trzyliterowe i jednoliterowe) aminokwasów białkowych. 2. Typy oddziaływań w białkach (elektrostatyczne, wiązania wodorowe itd.). 3. Reguły okreś lania konfiguracji (Cahna–Ingolda–Preloga). 4. Związek między zmianą entalpii swobodnej a stałą równowagi reakcji. Literatura obowiązkowa: 1. Morrison RT., Boyd RN. 1985. „Chemia organiczna”, PWN Warszawa, rozd. 4.15 „Okreś lanie konfiguracji R i S”, rozd. 36.2-5 (od: „Struktura aminokwasów”). 2. Lesyng B., McCammon JA. 1993. Molecular modeling methods. Basic techniques and challenging problems. Pharmac. Ther. 60:149-167 (Uzupełnienia, Zał. 2. I, rozdz. 5). Literatura uzupełniająca: 1.Heermann DW. 1997. Podstawy symualcji komputerowych w fizyce. WNT Warszawa. IB. Wykonanie: IB1. Budowa peptydu a. Zbudować dwie cząsteczki peptydu: wyjś ciową PheThrGlu oraz docelową: PheValGlu. Wykorzystać procedurę automatycznego budowania łańcucha polipeptydowego, dostępną w module Biopolymer (polecenie Residue → Append). b. Zjonizować N-końce i C-końce obu peptydów (Protein → Cap), a także boczną grupę karboksylową kwasu glutaminowego (Modify → Bond → Bond Order, Partial Double). c. Ustawić obie cząsteczki w podobnym położeniu oraz przypisać każdej z nich parametry potencjału i ładunki dla pola siłowego CVFF (Forcefield → Potentials: we wszystkich opcjach wybrać Fix). 1B2. Wybór parametrów obliczeń i uruchomienie obliczeń a. Zdefiniować transformowane atomy. Obliczenia względnej energii swobodnej wykonujemy przy użyciu modułu Discover. Podstawą tych obliczeń jest zdefiniowanie atomów poddawanych transformacji (ang. warping – tu: deformacja). Cząsteczce w stanie początkowym (A) przypisujemy λ = 0, zaś cząsteczce w stanie docelowym (B) przypisujemy λ = 1. Program stopniowo przekształca cząsteczkę A w B – stany poś rednie odpowiadają ułamkowym wartoś ciom λ, czyli ∆λi. W celu zdefiniowania transformowanych atomów wywołać Constraint→Warp (opcje: Add, Atom_Pair), następnie „wycelować” na odpowiedni atom, sprawdzić, czy jego symbol pojawia się we właś ciwym oknie dialogowym, a następnie „kliknąć” lewym klawiszem myszy. W ten sposób zdefiniować pary transformowanych atomów: A_Atom: B_Atom: Cβ (Thr) Cβ (Val) O (grupa hydroksylowa Thr) Cγ (Val) H (grupa hydroksylowa Thr) H (połączony wiązaniem ze zdefiniowanym Cγ) 5 oraz pozostałe 2 atomy wodoru grupy metylowej cząsteczki B, które nie posiadają odpowiedników w czasteczce A – wybrać opcję From_Null: B_Atom: kolejno “kliknąć” na 2 atomy H należące do transformowanej grupy metylowej. Należy sprawdzić, czy pary zostały zdefiniowane poprawnie (Warp→Activation = List). b. Zadać parametry obliczeń względnej energii swobodnej. W ćwiczeniu należy przyjąć następujące wartoś ci parametrów (polecenie Parameters→Relative): granice całkowania termodynamicznego λ = 0 do λ = 1; wielkość perturbacji, δλ w rówaniu (1), Dlambda = 0.005; liczba kroków całkowania względem λ (liczba punktów kwadratury Gaussa-Legendre’a, czyli k w sumie w równaniu 1) Quadrature Points = 10; częstość próbkowania czynnika Boltzmanna Sampling = 100. Wartość kroku całkowania parametru λ, tj., ∆λi wyznacza program, zależy ona od przyjętej metody całkowania. c. Zadać parametry minimalizacji (Parameters → Minimize): 100 iteracji algorytmu Steepest Descents (pozostałe parametry domyś lnie) – optymalizacja struktury początkowej peptydu. d. Zadać parametry dynamiki (Parameters → Dynamics): 10 000 kroków czasowych równoważenia układu, 10 000 kroków czasowych dynamiki – taki cykl równoważenia i dynamiki przeprowadza się dla każdego kroku całkowania po λ, tj., dla każdego i we wzorze (1); zapisywanie danych na dysku (History) co 100 kroków, temperatura 298.0 K (pozostałe parametry domyś lnie) (UWAGA: zapisać długość kroku czasowego). e. Zadać parametry oddziaływań niewiążących. Z menu wybrać: Parameters→Variables i ustawić promień obcięcia Cutoff = 15.0 Å; Parameters→Set i ustawić stałą dielektryczną = 1.0, zależną od odległoś ci (Dist_Dependent). f. Uruchomić obliczenia: Z menu wybrać Run→Run. Sprawdzić, czy w oknie dialogowym nazwy obiektu znajduje się nazwa cząsteczki w stanie docelowym (nazwa peptydu PheValGlu). Ustawić tryb obliczeń w tle (symulacja nie będzie pokazywana na ekranie – pozwoli to skrócić czas obliczeń): Computation Mode = Batch. Włączyć opcje minimalizacji i dynamiki; upewnić się, czy pozostałe parametry są ustawione domyś lnie (Discover Hosts = Local, List = Off, Strategy = Off, Auto Option = Add_Auto, PBC = Off, Reduce_Output = On). Polecenie Execute uruchamia obliczenia. g. Sprawdzić, czy obliczenia zostały uruchomione poprawnie. W oknie UNIX’a, z której uruchomiono program BioSym, wyś wietlane są polecenia i komunikaty programu. Przy użyciu polecenia Constraint→Warp→List sprawdzić, czy program poprawnie zinterpretował definicje atomów transformowanych (patrz niżej): Relative Free Energy Warped Atoms: residue THR 2 atom CB and residue VAL 2 atom CB residue THR 2 atom OG1 and residue VAL 2 atom CG2 residue THR 2 atom HG1 and residue VAL 2 atom HG22 residue VAL 2 atom HG23 to NULL residue VAL 2 atom HG21 to NULL 6 Po zakończeniu obliczeń program wyś wietla stosowny komunikat. W nowym oknie UNIX’a wyś wietlić aktualnie biegnące procesy (polecenie ps -aef) i odszukać proces odpowiadający obliczeniom (UID: student, odczytać czas uruchomienia, znaleźć nazwę swojej cząsteczki). UWAGA: Czas obliczeń na komputerze Sauron wynosi ok. 30 min. Obecnie należy wykonywać część II ćwiczenia, natomiast tę część dokończyć po zakończeniu obliczeń. 1B3. Analiza uzyskanych wyników Program tworzy szereg plików wyjś ciowych, m.in.: .inp – plik wejś ciowy zawierający zestawienie par atomów transformowanych oraz ważniejsze parametry wejś ciowe obliczeń .mdf – „molecular dynamics file”, wyszczególnienie przypisanych ładunków formalnych oraz typów potencjałów .car – zawiera współrzędne atomów układu .wrp – zawiera szczegółowe parametry atomów transformowanych .out – zawiera – w postaci „historii całkowania” – wszystkie parametry obliczeń, wartoś ci energii, energii swobodnej (A) i jej zmian, czynników Boltzmanna (e-∆Η/kT) oraz błędy obliczonych wielkoś ci .tbl – plik wykorzystywany do tworzenia wykresów w module Analysis. UWAGA: Dla energii swobodnej używa się równoważnych sobie symboli A oraz F. a. Sprawdzić zbieżność obliczeń. Otworzyć plik *.out za pomocą edytora jot. Znaleźć na końcu pliku tabelę w której zestawione są wyniki obliczeń energii swobodnej, skopiować tabelę. Odczytać końcową wartość zmiany energii swobodnej (TOTAL dA(λ) error). Sprawdzić, czy wartoś ci dA+/dλ (perturbacja energii swobodnej z krokiem dodatnim) i dA-/dλ (perturbacja energii swobodnej z krokiem ujemnym) są podobe. Jeżeli różnią się znacząco, oznacza to słabą zbieżność lub zbyt duży krok całkowania. b. Odczytać wartoś ci energii: całkowitej, potencjalnej i kinetycznej po zakończeniu każdego z cykli dynamiki („SUMMARY: Average Std. Dev.”). c. Wyznaczyć zależnoś ci czynnika Boltzmanna od czasu symulacji dynamiki molekularnej. W tym celu można wykorzystać moduł Analysis, bądź też skorzystać z informacji zawartych w pliku . out. W ćwiczeniu należy użyć drugiego z powyższych sposobów. Odczytać 10 (wyś redniowanych po 100 krokach czasowych) wartoś ci czynnika Boltzmanna (kolumna 4) w danym cyklu, co 1 ps: 10.1, 11.0, 12.0,..., 20.0 (kolumna 2). Na jednym wykresie przedstawić zależnoś ci czynnika Boltzmanna od czasu dla trzech wartoś ci parametru λ: 0.02, 0.52, 0.97. Wykresy powinny przedstawiać fluktuacje wokół stałej wartoś ci, malejące ze wzrostem λ. Tendencje spadkowe lub zwyżkowe przy danym λ ś wiadczą o złej zbieżnoś ci obliczeń. 7 IC. Zagadnienia do opracowania: UWAGA: Zbiory z danymi liczbowymi należy przenieść na komputer PC i tam przygotować wykresy i wydruki. 1. 2. 3. 4. Zwięźle opisać cel ćwiczenia i wykonane czynnoś ci wraz z podstawowymi parametrami obliczeń. Wykreś lić zależność wartoś ci zmiany energii swobodnej sum(dA) i dA(λ) od parametru λ. Podać końcową wartość zmiany energii swobodnej (TOTAL dA(λ) error). Porównać wartoś ci dA+/dλ (perturbacja energii swobodnej z krokiem dodatnim) i dA-/dλ (perturbacja energii swobodnej z krokiem ujemnym) – czy w obliczeniach uzyskano dobrą zbieżność i czy użyto odpowiedniego kroku całkowania? 5. Obliczyć zmianę entalpii swobodnej ∆GBM i stałą równowagi reakcji wiązania (KBM) peptydu PheValGlu przez receptor (patrz cykl termodynamiczny, pkt 3 Teorii), opierając się na danych: ∆GPR = 15,80 kcal/mol (wynik obliczeń metodą FEP) ∆GB0 = -6,36 kcal/mol (wynik doś wiadczenia) Obliczyć wielkość ∆∆G w reakcji wiązania peptydu przez receptor, dla mutacji Thr → Val (∆∆G = ∆GBM – ∆GB0). Skomentować otrzymane wartoś ci. 6. Sporządzić wykresy energii: całkowitej, kinetycznej i potencjalnej w funkcji λ (pkt 6B) i opatrzeć komentarzem. 7. Sporządzić wykres zależnoś ci czynnika Boltzmanna od czasu symulacji dynamiki molekularnej (punk 6C) i opatrzeć komentarzem. 8 Ćwiczenie 2(5). Porównywanie fizykochemicznych własnoś ci i struktur bioczą steczek; algorytmy poszukiwania optymalnej struktury bioczą steczki (K. Murzyn, M. Pasenkiwicz-Gierula). Opracowanie ć wiczenia: Ćwiczenie należy opracować według punktów znajdujących się na końcu poszczególnych części instrukcji oraz podać wyniki, opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji czcionką pogrubioną. Cel i wykonanie: Ćwiczenia 2(5) ma na celu zaznajomienie studentów z komputerowym (1) wyznaczaniem niektórych fizykochemicznych własnoś ci biocząsteczek; (2) wyznaczaniem parametru RMSD określającego “globalne” podobieństwo różnych struktur biocząsteczki; (3) okreś laniem drugorzędowej struktury polipeptydu; (4) “generowaniem” więzów; oraz z (5) optymalizacją struktury biocząsteczki poprzez minimalizację jej energii. W tym ćwiczeniu, do wykonania większoś ci zadań użyty zostanie pakiet TINKER. Ogólna zasada posługiwania się tym pakietem opisana jest w rozdziale “Komendy systemu opreacyjnego oraz krótki opis programów komputerowych” oraz w Zał. 5. I Uzupełnienia. W Uzupełnieniu opisane są też typy plików jakie czyta/generuje TINKER (Zał. 5. I), poszczególne programy pakietu (Zał. 5. II) oraz słowa kluczowe (Zał. 5. III) – proszę się zapoznać z tymi opisami. Organizacja ś rodowiska pracy: Przejść do własnej kartoteki. Utworzyć w niej kartotekę CW_5 przejść do niej i utworzyć kartoteki o nazwach: part_A, part_B1, part_B2. 5A. Porównywanie fizykochemicznych własnoś ci i struktur biocząsteczek 5A1. Skopiowanie na dysk lokalny zbioru *.pdb zawierającego struktury β-defensyny-12, rozdzielenie struktur, obejrzenie trzech losowo wybranych struktur programem insightII: 1. Przejść do kartoteki part_A. 2. Znaleźć zbiór ze strukturami β-defensyny-12 w Protein Data Bank ( http://www.rcsb.org) (ang. defensin) oznaczonymi przez Zimmermanna i innych. Skopiować go na dysk lokalny (ok. 900 kB). Zanotować i umieś cić w sprawozdaniu: a. 4-literowy kod struktury, b. metodę pomiarową, d. pochodzenie białka, e. liczbę reszt aminokwasowych; f. elementy struktury drugorzędowej, g. liczbę mostków dwusiarczkowych, itp. 3. Sprawdzić przy pomocy komendy grep -n “MODEL” *.pdb jaka jest liczba różnych struktur βdefensyny-12 w zbiorze *.pdb (struktury rozdzielone są słowem kluczowym MODEL, “-n” powoduje wyś wietlenie numerów linii zawierających to słowo). Zrobić 3 kopie zbioru *.pdb ze stukturami defensyny (patrz, lista komend UNIXa) – każda kopia musi mieć inną nazwę, ale to samo rozszerzenie *.pdb, np. def_1.pdb, def_2.pdb, itp. Przy pomocy edytora jot, z każdego zbioru usunąć wszystko poza jedną strukturą defensyny (w każdym zbiorze pozostawić inną strukturę – w sumie 3 struktury i 3 zbiory). 4. Wywołać insightII i obejrzeć te struktury. Wczytać 3 struktury równocześ nie. Zaobserwować i zanotować różnice między strukturami oraz chiralność atomów w łańcuchu peptydowym. 9 5A2. Porównanie energii potencjalnych poszczególnych cząsteczek defensyny oraz wkładów poszczególnych członów funkcji potencjału do tych energii, obliczenie pól powierzchni oraz objętoś ci cząsteczek, obliczenie promienia gyracji (Radius of Gyration) rg dla każdej cząsteczki: 1. Przekształcić nowo-utworzone pliki *.pdb na format XYZ TINKERA przy pomocy programu pdbxyz; użyć parametryzacji OPLS All-Atom (oplsaa.prm). Dla ułatwienia pracy: zbiór tinker.key z kartoreki /app/modmol skopiować 3-krotnie, a tworzonym zbiorom nadać takie same nazwy jakie mają utworzone powyżej zbiory *.pdb, jedynie pozostawić rozszerzenie *.key. W przeciwnym przypadku, za każdym wywołaniem programu pdbxyz trzeba wpisywać linię zawierającą ś cieżkę do kartoteki ze zbiorem PRM który zawiera parametry funkcji potencjału: /app/modmol/params/oplsaa.prm. 2. Wywołać program analyze (z pakietu TINKER) w celu obliczenia energii potencjalnej dla trzech wybranych struktur defensyny. Program ANALYZE wczytuje zbiór XYZ, zawierający współrzędne kartezjańskie atomów, oraz zbiór PRM, zawierający parametry funkcji potencjału – informacja o lokalizacji tego zbioru jest zawarta w zbiorze *.key. Uruchamiany w trybie wsadowym, ANALYZE czyta dodatkowo plik INP, zawierający parametry kontrolne programu. Zapisać obliczone energie potencjalne oraz wkłady od poszczególnych członów energetycznych: van der Waalsa, elektrostatycznej, drgań rozciągających wiązania (ang. bond-stretching) itp; zidentyfikować najwyżej energetyczne oddziaływania we wszystkich strukturach. 3. Wywołać program analyze. Tym razem obliczyć i zapisać promienie gyracji rg cząsteczek. 4. Wywołać program spacefill (z pakietu TINKER). Obliczyć pola powierzchni cząsteczek oraz ich objętoś ci (metoda Connolly’ego, opcja nr 2 programu spacefill). W obliczeniach uwzględnić domyś lne (ang. default) ustawienia programu spacefill (Probe Radius = 1.4 Å, No Hydrogens) Wyniki (2), (3) i (4) zestawić w tabeli. 5A3. Wyznaczenie parametru RMSD (ang. root mean square distance) dla wybranych cząsteczek defensyny w celu określenia różnic w ich strukturach. RMSD jest pierwiastkiem ze ś redniego kwardatu różnicy położeń odpowiadających sobie atomów w dwóch strukturach cząsteczki, po ich optymalnym nałożeniu (Günter, 1998). Pozwala on wyznaczyć “globalne” podobieństwo (różnicę) między tymi strukturami – im większa wartość RMSD, tym bardziej różnią się porównywane struktury. RMSD wyznaczony jak poniżej, nie dostarcza informacji o tym w jakich fragmentach cząsteczki występują największe różnice strukturalne. Dokładniejszą informację o różnicach strukturalnych można otrzymać obliczając RMSD dla poszczególnych fragmentów cząsteczki. 1. Wywołać program superpose (z pakietu TINKER). Obliczyć RMSD każdej z wybranych struktur defensyny z pozostałymi. W obliczeniach uwzględnić domyś lne ustawienia parametrów (podane zwykle w nawiasach kwadratowych na końcu każdego zadanego przez program pytania). 10 Opracowanie tej częś ci ć wiczenia: (1) Omówić, na podstawie artykułu Zimmermann et al., 1995 (Zał. 5. XI), biologiczną rolę defensyn i ich główne elementy strukturalne. (2) Na podstawie wartoś ci wyznaczonych wyżej parametrów, omówić różnice w energiach, własnoś ciach fizykochemicznych i strukturach badanych cząsteczek β-defensyny-12. 5A4. Określenie struktury drugorzędowej biocząsteczki: 1. Przed uruchomieniem programu dssp.exe, proszę przeczytać jego skrócony opis (Uzupełnienia, ZAŁ. 5. IV) i zaznajomić się (a) ze sposobem uruchamiania programu, (b) ze strukturą i informacjami zawartymi w zbiorze wynikowym. 2. Wywołać program dssp.exe, ze wskazaniem zbioru wynikowego (dssp.exe pdb_file out_file), w celu okreś lenia struktury drugorzędowej dla trzech wybranych cząsteczek β-defensyny-12. 3. Obejrzeć wygenerowany zbiór out_file i znaleźć w nim informacje o wartościach kątów PHI i PSI; o powierzchni dostępnoś ci wody; utworzonych wiązaniach wodorowych (ZAŁ. 5. IV). Opracowanie tej częś ci ć wiczenia: (1) Omówić najważniejsze elementy metody Kabscha-Sandera (Kabsch & Sander, 1983, Zał. 5. XII). (2) Czy struktury drugorzędowe wybranych cząsteczek β-defensyny-12 wyznaczone w tym ćwiczeniu metodą Kabscha-Sandera są takie jak te podane w pliku *.pdb zdeponowanym w Protein Data Bank – omówić różnice. (3) Dla jednej cząsteczki β-defensyny-12 wskazać kilka najmocniejszych wewnątrzcząsteczko-wych wiązań wodorowych, podać reszty oraz grupy chemiczne, do których należą atomy tworzące wiązanie. 5A5. “Komputerowy” eksperyment NOE (Nuclear Overhauser Effect) – generowanie więzów (restraindistance), tj. utworzenie zbioru odległoś ci (z zadanego przedziału) między atomami wodoru należącmi do różnych reszt aminokwasowych w cząsteczce (porównaj – Zimmermann et al., 1995): 1. Wywołać program fakenoe.x (z pakietu TINKER), i dla jednej ze struktur β-defensyny (*.pdb) wygenerować przy jego pomocy zbiór odległoś ci dla par protonów, których wzajemna odległość jest nie większa niż zadana górna wartość RD (restrain-distance). W tym programie, domyś lna wartość RD wynosi 4.0 Å (co odpowiada słabym sygnałom NOE). W metodzie NOE więzy dla RD równego 2.7 Å odpowiadają sygnałom silnym, a dla RD równego 3.3 Å – sygnałom średniej mocy. Proszę wygenerować zbiory więzów z zakresów takich jak w pracy Zimmermanna et al., 1995, tj. dla (a) RD równego 2.5 Å, (b) RD równego 3.5 Å, oraz (c) RD równego 4.0 Å. Wypisane na ekranie więzy dla poszczególnych wartoś ci RD należy przenieść do zbioru tekstowego (użyć jot i “myszki” – lewy i ś rodkowy klawisz) i zapisać pod nazwą np. noe.out. Zanotować i umieś cić w sprawozdaniu: liczbę więzów dla 1.8<RD≤2.5 Å, dla 2.5<RD≤3.5 Å, oraz dla 3.5<RD≤4.0 Å i porównać je z liczbami podanymi przez Zimmermanna et al., 1995 – spróbować wyjaś nić róznicę w liczbach otrzymanych w tym ćwiczeniu i przez Zimmermanna et al. (Zał. 5.XI). 11 5B. Optymalizacja struktury biocząsteczki w funkcji metody minimalizacyjnej oraz konformacji początkowej: Celem ćwiczenia 5B jest porównanie efektywnoś ci metod minimalizacyjnych używanych do optymalizacji i uś ciś lania trójwymiarowej struktury cząsteczek. Procesowi minimalizacji poddana jest funkcja energii potencjalnej układu molekularnego zdefiniowana w ramach mechaniki molekularnej. W tym ćwiczeniu, optymalizowana będzie struktura peptapeptydu Met-enkefaliny (M-Enk) (Tyr1-Gly2-Gly3-Phe4-Met5). M-Enk jest niewielką cząsteczką (Rys. 4 przedstawia jej wzór strukturalny), możliwe więc będzie w czasie przeznaczonym na ćwiczenia przeprowadzenie optymalizacji jej struktury kilkoma metodami minimalizacyjnymi. M-Enk jest najczęś ciej badanym przedstawicielem peptydów wykazujących aktywność opioidową. W długiej historii badań (Hughes et al., 1975) nad konformacją tego peptydu stawiano przeciwstawne hipotezy dotyczące jego struktury. Co ciekawe – problem trójwymiarowej struktury enkefalin pozostaje nadal nierozwiązany. Główną tego przyczyną jest to, że krótkie, liniowe peptydy w różnych otoczeniach (w ś rodowisku wodnym, błonie lipidowej, rozpuszczalniku organicznym) przyjmują szereg niskoenergetycznych, właś ciwych danemu rozpuszczalnikowi konformacji, trudno więc zdefiniować ich strukturę natywną. Biorąc po uwagę, że czasy życia takich dyskretnych konformacji są znacznie krótsze od czasów pokrywanych technikami magnetycznego rezonansu jądrowego, więzy geometryczne generowane w metodzie wielowymiarowego NMR odpowiadają pewnej uś rednionej konformacji, która w szczególnoś ci może odbiegać od mikrostanów peptydu (Meirovitch & Meirovitch, 1996, Uzupełnienia, Zał. 5. V). W tej częś ci ćwiczenia zostaną sprawdzone następujące zależnoś ci: (1) związek między metodą minimalizacyjną a czasem optymalizacji i końcową strukturą MEnk. Użyte będą następujące metody minimalizacyjne: największego spadku (steepest descent, program MINIMIZE) oraz sprzężonych gradientów (nonlinear conjugate gradient, domyś lna metoda programu MINIMIZE). Przy porównaniu struktur końcowych wykorzystane będą następujące kryteria: • wartość końcowej energii potencjalnej i konformacje cząsteczki (kąty PHI i PSI), • liczba iteracji i czas obliczeń; (2) w jaki sposób struktura początkowa wpływa na wynik końcowy optymalizacji. 5B1. Porównanie metod minimalizacyjnych. 5B1a. Budowa M-Enk w konformacji rozciągniętej (extended). Przejść do kartoteki part_B1. Wywołać program protein w celu zbudowania peptydu o zadanej sekwencji i konformacji (skrócony opis programu protein znajduje się w Uzupełnieniach, Zał. 5. VI, a przykład jego użycia poniżej). W tej częś ci ćwiczenia praca z programem jest interaktywna, tzn. program kolejno “pyta” o niezbędne parametry (w dalszych etapach należy posługiwać się plikami wsadowymi (input)). Na pytania programu odpowiadać w podany niżej sposób (tekst kursywą): 12 ############################################################################## ############################################################################## ## ## ## TINKER --- Software Tools for Molecular Design ## ## ## ## Version 3.5 October 1997 ## ## ## ## Copyright (c) Jay William Ponder 1990-1997 ## ## All Rights Reserved ## ## ## ############################################################################## ############################################################################## Enter Name to be used for Output Files : Enter Title : 5b1_ext Met-Enkephalin, extended, exercise 5B1 Enter Potential Parameter File Name : /app/modmol/params/oplsaa.prm Enter One Residue per Line, Free Format: 1 or 3 Letter Code, then Phi/Psi/Omega (3F), Chi Angles (4F), then Disulfide Partner if a CYS (I) and D/L Chirality as desired (A1), <CR> ends Residue entry The allowed N-Cap Residues are Acetyl=ACE or Formyl=FOR, and the possible C-Cap Residues are N-MethylAmide=NME or Amide=NH2 Enter Residue 1 : Tyr 180 180 Enter Residue 2 : Gly 180 180 Enter Residue 3 : Gly 180 180 Enter Residue 4 : Phe 180 180 Enter Residue 5 : Met 180 180 Enter Residue 6 : Cyclize the Polypeptide Chain [N] : N Po wykonaniu programu w aktualnej kartotece pojawią się trzy nowe pliki. Wykonać ls –l. Wypisane zostną zbiory: -rw-r--r--rw-r--r--rw-r--r-- 1 studbt 1 studbt 1 studbt user user user 5285 Oct 20 12:52 5b1_ext.int 18 Oct 20 12:52 5b1_ext.seq 5009 Oct 20 12:52 5b1_ext.xyz Odczytać (more) zawartość utworzonych plików i umieś cić w sprawozdaniu informacje o: (1) zawartoś ci wygenerowanych plików (opis formatu XYZ w Zał. 5. VII), (2) liczbie atomów w układzie, (3) liczbie reszt aminokwasowych oraz (4) sekwencji aminokwasów. Wygenerować plik PDB (program xyzpdb). Obejrzeć i wydrukować rysunek ze strukturą (rasmol) zbudowanej czasteczki Metenkefaliny. Wygenerować rysunek w reprezentacji Ball-and-Stick (format GIF, białe tło). 13 Skopiować plik *.xyz na: 5b1_desc.xyz oraz 5b1_conj.xyz, a plik *.seq na: Skopiować plik tinker.key na 5b1_ext.key; 5b1_desc.key oraz 5b1_conj.key 5b1_desc.seq oraz 5b1_conj.seq. 5B1b. Porównanie efektywnoś ci metod minimalizacyjnych – wyznaczenie czasów optymalizacji struktury M-Enk z narzuconą wartoś cią końcową gradientu potencjału równą 0.1 kcal/mol. W pliku 5b1_desc.key dopisać linię: steepest-descent. UWAGA: Na końcu każdego pliku z rozszerzeniem .key zostawić pustą linię. Optymalizację struktury metodą największego spadku przeprowadza się programem minimize. Przed przystępieniem do obliczeń należy napisać odpowiedni plik wsadowy o nazwie 5b1_desc.inp: 5b1_desc.xyz 0.1 (pusta linia) Program uruchomiony poleceniem C1 poniżej wczytuje dane z pliku 5b1_desc.inp, a wynik zapisuje w pliku 5b1_desc.out. W pliku *.out podany będzie m. in. czas wykonania (timex w poleceniu C1) programu (do opracowania notować czas user). Uruchomienie programu minimize poleceniem C1 poniżej: nohup timex minimize < 5b1_desc.inp >& 5b1_desc.out & (C1) Program będzie wykonywany w tle, jego postępy można ś ledzić oglądając zawartość pliku 5b1_desc.out. Po zakończeniu obliczeń, ostatni fragment przykładowego pliku 5b1_desc.out wygląda następująco: ... 2873 2874 2875 LMQN -156.4006 -156.4009 -156.4012 -- 0.0003 0.0003 0.0003 0.0001 0.0001 0.0001 0.00 0.00 0.00 2981 2982 2983 Success Success SmallGrad Normal Termination due to SmallGrad Final Function Value : Final RMS Gradient : Final Gradient Norm : real user sys 0.1026 0.1337 0.0995 -156.4012 0.0995 0.8613 2:45.56 1:16.15 16.23 W tym przykładzie program wykonywał się przez 2 min 45 i 56/100 s. Sam program minimize wykorzystał 1 min 16 i 15/100 s czasu procesora (ten czas należy zachować do przeprowadzenia odpowiedniej analizy w sprawozdaniu – zaleca się podawanie również czasu real). Ostatnia z podanych liczb reprezentuje czas procesora wykorzystany na operacje systemowe i dla naszych rozważań jest nieistotna. W wyniku działania programu powstał, prócz pliku 5b1_desc.out, plik zawierający współrzędne kartezjańskie zoptymalizowanej struktury o nzawie 5b1_desc.xyz_2. Przeprowadzić analogiczną optymalizację struktury M-Enk metodą sprzężonych gradientów. Ponieważ metoda sprzężonych gradientów jest metodą domyś lną programu minimize, w pliku 5b1_conj.key nie trzeba wpisywać nazwy tej metody. Napisać odpowiedni plik 5b1_conj.inp i uruchomić program minimize (wygenerowane zostają zbiory wynikowe analogicznie jak dla metody największego spadku). 14 Opracowanie tej częś ci ć wiczenia: (1) podać czas optymalizacji prowadzonych metodami największego spadku i sprzężonych gradientów; końcowe wartoś ci energii potencjalnej (Final Function Value), oraz liczbę kroków iteracyjnych (w przykładzie powyżej wynosiła ona 2875). (2) Porównać wkłady poszczególnych członów funkcji potencjału do energii całkowitej (pkt 5A2-2) dla obu struktur. Porównać wartoś ci kątów PHI i PSI zoptymalizowanych struktur (pkt 5A4-2 i 3) z wartoś ciami z pracy Graham et al., 1992 (Zał. 5. IX). UWAGA: Program dssp.exe czyta wyłącznie pliki PDB, do ich wygenerowania programem xyzpdb potrzebne są pliki *.seq. 5B2. Zależnoś ci między strukturą początkową peptydu i wynikiem optymalizacji Przejść do kartoteki part_B2. Używając programu protein zbudować M-Enk w trzech konformacjach: 1. arkusza β (SHEET) – kątom PHI i PSI przypisać waroś ci odpowiednio -139.0° i +135.0° iutworzyć zbiór o nazwie 5b2_sht; 2. helisy (HELIX) – kątom PHI i PSI przypisać waroś ci odpowiednio -57.0° i -47.0° i utworzyć zbiór o nazwie 5b2_hlx; 3. kłębka statystycznego (RANDOM) – kątom PHI i PSI przypisać przypadkowe i róż niące się między sobą wartoś ci z przedziału od –180.0° do +180.0° (nie dawać wartoś ci ±180°) i utworzyć zbiór o nazwie 5b2_rnd. Z kartoteki part_B1 skopiować plik 5b1_ext.key do zbiorów: 5b2_sht.key, 5b2_hlx.key, 5b2_rnd.key. Utworzyc odpowiednie zbiory inputowe *.inp aby przeprowadzić optymalizację metodą sprzężonych gradientów z narzuconą wielkoś cią gradientu 0.01. Dla każdej ze struktur zanotować i umieś cić w sprawozdaniu: (1) liczbę iteracji, (2) czas obliczeń i (3) wartość energii po optymalizacji. Użyć programu superpose do obliczenia wartoś ci RMSD między poszczególnymi strukturami startowymi oraz między strukturami zoptymalizowanymi. UWAGA: Nie porównywać struktury startowej z końcową. W porównaniach uwzględnić wcześ niej zoptymalizowaną metodą sprzężonych gradientów strukturę EXTENDED – patrz punkt 2b). Wyniki porównań zestawić w tabeli. Wywołać dssp.exe, okreś lić wartoś ci kątów PHI i PSI, porównać je z wartoś ciami z pracy Graham et al., 1992 (Zał. 5. IX). Sprawdzić, czy tworzą się β-skręty (β-turns) – Zał. 5. X. Odnoś niki literaturowe: 1. Günter P. 1998. Q. Rev. Biophys. 31:145-237; rozdział 7.2. 2. Zimmermann G. R., Legault P., Selsted M. E. and Pardi A. 1995. Biochemistry 34:13663-13671 (Zał. 5. XI). 3. Kabsch W. and Sander Ch. 1983. Biopolymers 22:2577-2637 (Zał. 5. XII). 4. Hughes J., Smith T. W. Kosterlitz H. W. Fothergill L. A. Morgan B. A. Morris H. R. 1975. Nature, 258:577-580. 5. Meirovitch E. and Meirovitch H. 1996. Biopolymers 38:69-88. 6. Graham W. H., Certer E. S. and Hicks R. 1992. Biopolymers 32:1752-1764. 7. Wilmot C. M. and Thornton J. M. 1988. J. Mol. Biol. 203:221-232. 15 Ćwiczenie 3(7). Wyznaczanie natywnej struktury bioczą steczki poprzez poszukiwanie minimum globalnego funkcji potencjału (K. Murzyn, M. Pasenkiewicz-Gierula). Opracowanie ć wiczenia: Ćwiczenie należy opracować według punktów znajdujących się na końcu poszczególnych części instrukcji oraz podać wyniki, opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji czcionką pogrubioną. Cel, teoria i wykonanie: Ćwiczenie 3(7) ma na celu zaznajomienie studentów z trzema metodami puszukiwania natywnej struktury polipeptydów: (1) symulowanego wyżarzania, SA (Simmulated Annealing), Brünger AT., Nilges M. 1993. Q. Rev. Biophys. 26:49-125; (2) DG (Distance Geometry), Hodsdon ME., Cistola DP. 1997. Biochemistry. 36:1450-1460; (3) DEM (Diffusion Equation Method), Kostrowicki J., Scheraga HA. 1992. J.Phys.Chem. 96:74427449. Organizacja ś rodowiska pracy: Przejść do własnej kartoteki. Utworzyć kartotekę CW_7, przejść do niej i utworzyć kartoteki o nazwach: part_A1, part_A2, part_A3, part_B. Metody optymalizacji struktury cząsteczki poprzez minimalizacją jej energii potrencjalnej, poznane w ćwiczeniach 5 i 6, wykorzystywane są zazwyczaj w początkowym lub w końcowym etapie ustalania trójwymiarowej struktury cząsteczki. Główną wadą tych metod jest ich niewielka skuteczność w odniesieniu do tzw. problemu lokalnych minimów (minimalizacja prowadzi do najbliższego lokalnego minimum, które może leżeć daleko od minimum globalnego funkcji). W ostatnich latach opracowano szereg metod, przy pomocy których problem lokalnych minimów można częś ciowo obejść. Jednakże, nadal brak uniwersalnej metody znajdowania globalnego minimum funkcji energii, a tym samym jednoznacznego wyznaczenia natywnej struktury biocząsteczki. Metody, których celem jest poszukiwanie globalnego minimum funkcji potencjału, to symulowane wyżarzanie, SA (Simmulated Annealing), Distance Geometry, DG oraz wygładzania funkcji potencjału, DEM (Diffusion Equation Method). Metody SA oraz DG są obecnie rutynowo stosowane w procesie ustalania struktury białek w oparciu o dane NMR. W tym ćwiczeniu trzy wymienione wyżej metody te będą użyte do optymalizacji struktury M-Enk. Wyznaczone struktury będą porównane między sobą. 7A. Metoda symulowanego wyż arzania (SA, Simmulated Annealing) Powierzchnia energii potencjalnej białka charakteryzuje się wielką liczbą lokalnych minimów. Ponieważ wzrost temperatury (tj. energii kinetycznej) obniża wysokość barier energetycznych, podniesienie temperatury układu poddanego symulacji dynamiki molekularnej pozwala na znacznie efektywniejsze pokrycie stanów konformacyjnych układu. Metoda symulowanego wyżarzania polega na przeprowadzeniu krótkich symulacji dynamiki molekularnej cząsteczki w temperaturze 1000 K (lub wyższej, do 10000 K), a następnie stopniowym schładzaniu układu. Pozwala to cząsteczce zrelaksować i osiągnąć stan nisko-energetyczny. Na końcowy wynik procesu wpływa zarówno przebieg procesu schładzania, tj. czy temperatura maleje liniowo, sigmoidalnie lub eksponencjalnie, jak i zwiększenie masy wszystkich atomów w układzie o pewien stały czynnik. 16 W pakiecie TINKER, do przeprowadzania symulowanego wyżarzania służy program ANNEAL. W trzech kolejnych częś ciach ćwiczenia 7A przebadany będzie wpływ (1) sposobu schładzania układu na końcowy wynik oraz czas obliczeń; (2) zmiany masy atomów w układzie na efektywność procesu SA; oraz (3) konformacji startowych na końcowy wynik. 7A1. Wpływ sposobu schładzania układu na końcowy wynik oraz czas obliczeń Z kartoteki CW_5 part_B1 skopiować pliki 5b1_ext.xyz, 5b1_ext.seq, 5b1_ext.key; zmienić ich nazwy na 7a1_ext.*. W pliku .key dodać linię ze słowem kluczowym RATTLE (pozwoli to na wydłużenie kroku czasowego do 2.0 fs dzięki zamrożeniu drgań wiązań z udziałem atomu wodoru). Utworzyć kartoteki lin, sig i exp. Do każdej z nich skopiować pliki 7a1_ext.*. Przejść do kartoteki lin. Uruchomić program anneal w trybie interaktywnym – na pytania o parametry odpowiadać zgodnie z podanym niżej wzorem (Uwaga: zapisać znaczenie poszczególnych parametrów !!! ). Usunąć z bieżącej kartoteki wygenerowane pliki z wyjątkiem *.xyz; *.key oraz *.seq. 7a1_ext.xyz 1000 0 50 1000 L 2.0 10.0 0.0 (pusta linia) Utworzyć zbiór wsadowy (input) w/g podanego wyżej wzoru zmieniając liczbę kroków SA na 10000. Uruchomić program anneal poleceniem analogicznym do C1 w ćwiczeniu 5B1. Zanotować czas obliczeń. Obliczyć końcową energię potencjalną i jej składowe dla zoptymalizowanej struktury (analyze) oraz kąty PHI i PSI (dssp.exe). UWAGA: Program dssp.exe czyta wyłącznie pliki PDB, do ich wygenerowania programem xyzpdb potrzebne są pliki *.seq. Przejść do kartoteki sig. Uruchomić program anneal poleceniem i z plikiem inputowym jak powyżej; ustawić liczbę kroków na 10000; zmienić COOLING PROTOCOL na SIGMOIDAL. Wyniki opracować jak powyżej. Przejść do kartoteki exp. Uruchomić program anneal poleceniem i z plikiem inputowym jak powyżej; ustawić liczbę kroków na 10000; zmienić COOLING PROTOCOL na EXPONENTIAL. Wyniki opracować jak powyżej. Opracowanie tej częś ci ć wiczenia: (1) Porównć energie (pkt 5A2) i czasy obliczeń dla otrzymanych trzech końcowych struktur. 7A2. Wpływ zwiększenia masy atomów w układzie na efektywność procesu SA Przejść do kartoteki part_A2. Z kartoteki part_A1/lin skopiować plik .xyz, .key, .seq oraz .inp. Zmienić ich nazwy na 7a2_ext.*. Uruchomić program anneal poleceniem i z plikiem inputowym jak ćwiczeniu 7A1, ustawić liczbę kroków na 10000, COOLING PROTOCOL na LINEAR oraz zmienić Increase Atomic Weights by a Factor of 10^x na 4.0. Wyniki opracować jak powyżej. Porównać wyniki dla mnożnika mas atomowych (mass-factor) = 4.0 oraz mass_factor = 0.0 (ćwiczenie 7A1-lin). 17 7A3. Wpływ konformacji startowych na końcowy wynik procesu SA Przejść do kartoteki part_A3. Z kartoteki part_A1/lin skopiować plik .xyz, .key, .seq oraz .inp M-Enk w konformacji rozciągniętej. Zmienić ich nazwy na 7a3_ext.*. Z kartoteki CW_5/part_B2 skopiować pliki 5b2_hlx.xyz i 5b2_rnd.xyz zawierające struktury M-Enk w konformacji helikalnej i przypadkowej oraz utworzyć niezbędne pliki .key, .seq. Wykonać program anneal dla konformacji rozciągniętej, helikalnej i przypadkowej. Za każdym razem ustawić liczbę kroków na 10000, COOLING PROTOCOL na LINEAR, Increase Atomic Weights by a Factor of 10^x na 2.0. Wyznaczyć końcowe energie potencjalne (analyze) oraz kąty PHI i PSI (dssp.exe). Opracowanie ć wiczenia 7A: (1) Dla struktur otrzymanych w ćwiczeniu 7A1, 7A2 i 7A3: porównć ich energie (pkt 5A2), kąty PHI i PSI i czasy obliczeń. (2) Która z uzyskanych struktur charakteryzuje się najniższą energią potencjalną? Czy celowe jest przeprowadzanie SA dla kilku (dziesięciu itp.) struktur początkowych? 7B. Metoda DISTANCE GEOMETRY (DG) Metoda DG – metric matrix distance geometry była pierwszą metodą optymalizacyjną użytą do okreś lenia struktury białka w oparciu o dane NMR. Bazuje ona na założeniu, że dane uzyskane w eksperymencie Nuclear Overhauser Effect (NOE) oraz dane stereochemiczne (chiralność) można przedstawić w postaci więzów narzuconych na odległoś ci między atomami w cząsteczce (RD). Podstawą teoretyczną metody DG jest założenie, że jeś li znane są dokładne wartoś ci wszystkich odległoś ci między elementami zbioru punktów w trójwymiarowej przestrzeni euklidesowej, to można okreś lić współrzędne kartezjańskie tych punktów. W rzeczywistoś ci nigdy nie dysponujemy pełnym zbiorem odległoś ci międzyatomowych w białku. Co gorsza, nawet te, które można wyznaczyć eksperymentalnie, nie są znane dokładnie, ale jako zakres dopuszczalnych wartoś ci (granice przedziału wyznacza z jednej strony odległość między dwoma atomami w kontakcie van der Waalsa, z drugiej strony zasięg efektu Overhausera). Dodatkowe ograniczenia narzucają dopuszczalne długoś ci wiązań i wielkoś ci kątów walencyjnych. Aby skorzystać z metody DG, należy w pierwszej kolejnoś ci ustalić RD dla nieznanych z pomiarów NOE odległoś ci międzyatomowych (boundary smoothing). Następnie losowo generuje się kompletny zestaw odległoś ci, które mieszczą się w dopuszczalnych, racjonalnych zakresach. Na ich podstawie dokonuje się obliczenia współrzędnych kartezjańskich poszczególnych atomów. Ze względu na wprowadzone uproszczenia przy uzupełnianiu zbioru RD, wygenerowana trójwymiarowa struktura białka jest silnie zaburzona, z szeregiem naprężeń (np. długoś ci wiązań i watoś ci kątów walencyjnych odbiegają od standardowych wartoś ci, kąty PHI i PSI leżą w niedozwolonych obszarach mapy Ramachandrana itp). Usuwanie tych naprężeń realizuje się metodą minimalizacyjną sprzężonych gradientów lub metodą symulowanego wyżarzania. Wnikliwszy opis metody DG oraz odnoś niki literaturowe znajdują się w pracy Hodsdon & Cistola, 1997. W pakiecie TINKER metoda DG została zaimplementowana w programie DISTGEOM. 18 Przejść do kartoteki part_B. Z kartoteki part_A1/lin skopiować plik .xyz, .key, oraz .seq dla M-Enk w konformacji rozciągniętej. Zmienić ich nazwy na 7b_ext.*. Utworzyć plik 7b_ext.inp według wzoru podanego poniżej. 7b_ext.xyz 10 Y N Y Y N N A (pusta linia) Przeprowadzić obliczenia programem distgeom przy pomocy polecenia analogicznego do C1 w ćwiczeniu 5B1. Program generuje 10 struktur (druga linia pliku inputowego). Odczytać w pliku 7b_ext.out energię potencjalną każdej ze struktur. Dla trzech struktur o najniżej energii obliczyć końcowe energie potencjalne i ich składowe (analyze) oraz kąty PHI i PSI (dssp.exe) Opracowanie tej częś ci ć wiczenia: (1) Dla struktur otrzymanych w ćwiczeniu 7A i 7B porównć ich energie, kąty PHI i PSI i czasy obliczeń. (2) W sprawozdaniu porównać wyniki otrzymane metodami SA i DG. Odnoś niki literaturowe: Brünger AT., Nilges M. 1993. Q. Rev. Biophys. 26:49-125. 1. Hodsdon ME., Cistola DP. 1997. Biochemistry 36:1450-1460. 2. Kostrowicki J., Scheraga HA. 1992. J.Phys.Chem. 96:7442-7449. Dla osób zainteresowanych Na podstawie podanej niżej literatury oraz wyników otrzymanych w czasie ćwiczeń, proszę znaleźć relację między strukturą i funkcją enkefalin. W szczególnoś ci proszę zwrócić uwagę, które z elementów strukturalnych M-Enk, względnie jaki typ oddziaływań może być istotny dla aktywnoś ci biologicznej enkefalin. van der Spoel D., Berendsen H.J.C. 1996. Biophys.J. 72:2032-2041. Gupta G. et al. 1986. FEBS Lett. 198:245-250. Khaled M. et al. 1977. Biochem. Biophys. Res. Comm. 76:224-231. Moret E. et al. 1990. FEBS Lett. 262:173-175. Surewicz WK., Mantsch HH. 1988. Biochem. Biophys. Res. Comm., 150:245-251. Vesterman N. et al. 1989. Biochim. Biophys. Acta 998:204-209. Zhorov BS., Ananthanarayanan VS. 1994. FEBS Lett. 354:131-134. 19