wiczenia do kursu bt ć 172

Transkrypt

wiczenia do kursu bt ć 172
ĆWICZENIA DO KURSU BT172
Zastosowanie modelowania molekularnego w Biotechnologii II
Zasady ogólne:
Do wykonania są 3 ćwiczenia, każde ćwiczenie trwa 5 godzin lekcyjnych (3.75 godzin zegarowych).
Konieczne jest wykonanie następujących ćwiczeń: 1(2), 2(5), 3(7).
Cyfry w nawiasach tyczą oryginalnej numeracji w skrypcie.
Materiały do ćwiczeń stanowią:
1) zbiór zmodyfikowanych instrukcji zebranych w niniejszym opracowaniu
2) skrypt „Modelowanie molekularne biocząsteczek ćwiczenia z podstaw i zastosowań”
pod redakcją prof. dr hab. Marty Pasenkiewicz-Gieruli – informacje tyczące „teorii” do ćwiczeń.
3) zbiór załączników (Uzupełnienia) które każda para otrzymuje na czas ćwiczeń .
W ćwiczeniach wykorzystane są róż ne programy jak:
komercyjny (Accelrys) http://www.accelrys.com/
nie-komercyjny (Tinker) http://dasher.wustl.edu/tinker/
Programy uruchamiane są na stacjach graficznych firmy Silicon Graphics (SGI).
Komputery te pracują pod systemem operacyjnym UNIX (IRIX6.2).
http://www.sgi.com/
http://www.computerhope.com/unix/irix.htm
Proszę zapoznać się z rozdziałami “Dostęp do zasobów komputerowych” oraz “Komendy systemu
opreacyjnego oraz krótki opis programów komputerowych” skryptu.
Inne uż yteczne niekomercyjne programy - nie uż ywane podczas ć wiczeniach.
symulacje dynamiki molekularnej
(Gromacs) http://www.gromacs.org/
(Amber) http://amber.scripps.edu/
(Charmm) http://yuri.harvard.edu/
wizualizacja struktur:
(Rasmol 2.7.3) http://www.rasmol.org/
(VMD) http://www.ks.uiuc.edu/Research/vmd/
Raster3D http://www.bmsc.washington.edu/raster3d/raster3d.html
strona z dużym zbiorem niekomercyjnych programów do modelowania molekularnego i pokrewnych
zastosowań: http://www.rcsb.org/pdb/software-list.html
1
Ciekawe strony:
BringingPhysicsto Life http://www.ks.uiuc.edu/Publications/Brochures/BPTL/
NationalScienceFoundation http://www.nsf.gov/
Centerfor BiophysicsandComputationalBiology http://www.life.uiuc.edu/biophysics/courses.html
Zasoby internetowe
Poniżej zestawiono, wraz ze zwięzłym opisem, wybrane strony internetowe (patrz 1-sze ćwiczenie),
umożliwiające dostęp do informacji, które mogą być cenne dla osób zainteresowanych modelowaniem
molekularnym, biotechnologią, badaniami strukturalnymi oraz pokrewnymi dziedzinami. Adresy stron
internetowych napisane są czcionką pogrubioną.
1.MEDLINE – Baza danych literaturowych o tematyce medycznej i pokrewnych (m.in. biochemia,
biofizyka). Literatura, odszukana według odpowiedniego “słowa kluczowego”, może być podana w
formie odnoś nika, abstraktu lub niekiedy całego artykułu (w większoś ci wypadków całe artykuły można
uzyskać jedynie na podstawie subskrypcji). Opcja Advanced Search umożliwia przeszukiwanie
literatury z wykorzystaniem operatorów logicznych oraz “słów kluczowych” różnych typów.
http://www.ncbi.nlm.nih.gov/PubMed
2. Biblioteka, zawierająca dane na temat zachowawczych fragmentów łańcuchów białek, należących do
rodzin homologicznych pod względem struktury. http://smi-web.stanford.edu/projects/helix/LPFC
3. Strona, na której można znaleźć programy służące do analizy sekwencji aminokwasowej białek
(peptydów) i przewidywania na tej podstawie m.in. ich struktury drugorzędowej oraz własnoś ci
fizykochemicznych. http://pbil.ibcp.fr/html/pbil_index.html
Tytuły ć wiczeń:
1. (skrypt ćw. nr 1(2)) Modelowanie mutacji peptydu i białka metodą zaburzania energii swobodnej oraz
bezpośredniej wymiany aminokwasu. (G.Jezierski, M.Pasenkiewicz-Gierula)
2. (skrypt ćw. nr 2(5)) Porównanie fizykochemicznych własnoś ci i struktur biocząsteczek; algorytmy
poszukiwania optymalnej struktury biocząsteczki. (K.Murzyn,M.Pasenkiewicz-Gierula)
3. (skrypt ćw. nr 3(7)) Wyznaczanie natywnej struktury biocząsteczki poprzez poszukiwanie minimum
globalnego funkcji potencjału. (K.Murzyn,M.Pasenkiewicz-Gierula).
2
Ćwiczenie 1(2). Modelowanie mutacji peptytu i białka metodą zaburzenia
energii swobodnej oraz bezpoś redniej wymiany aminokwasu
(G. Jezierski, M. Pasenkiewicz-Gierula).
Opracowanie ć wiczenia:
Ćwiczenie należy opracować według punktów znajdujących się na końcu instrukcji oraz podać wyniki,
opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji dwoma gwiazdkami (**).
Cel, teoria i wykonanie:
Ćwiczenie 1(2) ma na celu zaznajomienie studentów z metodą zaburzenia energii swobodnej (FEP).
Metoda ta będzie zastosowana do wymiany aminokwasu w tripeptydzie oraz obliczenia wielkoś ci
termodynamicznych w reakcji wiązania zmutowanego peptydu do receptora. Pozwoli to na
wyznaczenie względnej różnicy energii swobodnych (∆∆G) wiązania naturalnego i zmutowanego
peptydu do receptora i okreś lenia, który z peptydów silniej wiąże się z receptorem.
Metoda zaburzania energii swobodnej – wymiana aminokwasu w tripeptydzie.
IA. Teoria:
IA1. Założenia metody
Metoda zaburzenia energii swobodnej (ang. FEP – Free Energy Perturbation) służy do obliczenia
różnicy energii swobodnej (∆F = FA - FB) dwóch stanów A i B pozostających w równowadze
termodynamicznej dla układów, w których zmiana energii swobodnej równa jest zmianie entalpii
swobodnej (∆F = ∆G). W modelowaniu molekularnym metodę FEP wykorzystuje się najczęś ciej do
wyznaczania względnej różnicy energii oddziaływania między makrocząsteczką a ligandem (ligand
binding). Jeś li znana jest zmiana entalpii swobodnej (∆G) wiązania jednego liganda z makrocząsteczką,
to przy pomocy metody FEP można wyznaczyć ∆G dla wiązania innego liganda z tą samą
makrocząsteczką, jednakże cząsteczki obu ligandów muszę mieć podobną liczbę atomów i podobny
rozkład ładunku, tj. muszą się niewiele różnić. Dla obliczenia ∆G korzysta się z procedury zwanej
całkowaniem termodynamicznym oraz z przedstawionego niżej cyklu termodynamicznego. Obliczone
wartoś ci ∆G obarczone są dużymi błędami, dlatego metodą FEP wyznacza się względną różnicę energii
swobodnych tj., ∆∆G – tę wartość można wyznaczyć z dokładnoś cią 0.5-1.5 kcal/mol.
IA2. Całkowanie termodynamiczne
W metodzie FEP przekształcamy cząsteczkę A, dla której ∆G wiązania z białkiem jest znane, w
cząsteczkę B, dla której ∆G wiązania z białkiem chcemy wyznaczyć. Takie przekształcenie
przeprowadza się poprzez modyfikację hamiltonianu (funkcji energii) układu, sterowaną parametrem
sprzęgającym λ. λ równe 0.0 odpowiada czasteczce A, λ równe 1.0 odpowiada czasteczce B, a
ułamkowe wartoś ci λ oznaczają stany poś rednie między cząsteczką A i B. Dla kolejnych wartoś ci λ z
przedziału (0.0, 1.0) (∆λi we wzorze 1) przeprowadzamy symulacje dynamiki molekularnej badanego
układu (całkowanie równań Newtona po czasie t). W efekcie, w metodzie zaburzenia energii swobodnej
przeprowadzamy całkowanie numeryczne po dwóch zmiennych: t (rówanie ruchu) i λ (pochodna
energii swobodnej względem parametru sprzęgającego). δλ jest wielkoś cią zaburzenia (perturbacji).
W niniejszym ćwiczeniu stosowany jest algorytm FDTI (Mezei et al., 1987), będący zmodyfikowaną
3
wersją wcześ niej opracowanych algorytmów: PM (perturbation method) i TI (Termodynamic
Integration). Algorytm ten pozwala na obliczenie wartoś ci ∆G (w tym wypadku dla “procesu mutacji”)
zgodnie z zależnoś cią:
(1)
gdzie:
•
E oznacza energię obliczoną z zadanej funkcji potencjału dla dynamicznej struktury układu w
równowadze
•
nawias trójkątny 〈〉i oznacza ś redniowanie po kolejnych konformacjach w czasie danego cyklu
symulacji dynamiki molekularnej
• wyrażenie w nawiasie trójkątnym jest to tzw. czynnik Boltzmanna
suma po i oznacza numeryczne całkowanie po parametrze λ.
IA3. Przykładowe zastosowania metody FEP
Metodę FEP można stosować do okreś lenia wielkoś ci oddziaływań lek syntetyczny-receptor, peptydreceptor, enzym-substrat oraz do obliczania wartoś ci ∆G hydratacji dowolnych cząsteczek
organicznych.
W tym ćwiczeniu zostaną obliczone wartoś ci: ∆G, ∆∆G i K dla oddziaływań receptor-ligand. R jest
hipotetycznym receptorem, ligandami są: peptyd „naturalny” P0 = PheThrGlu (P0R), oraz peptyd
„zmutowany” PM = PheValGlu (PMR). Odpowiedni cykl termodynamiczny ma postać:
Symbole P0R i PMR oznaczają kompleksy receptora z peptydem odpowiednio: „naturalnym” i
“zmutowanym”. ∆GBO i ∆GBM opisują procesy rzeczywiste, ∆GP i ∆GPR procesy “komputerowe”. Zasada
cyklu termodynamicznego mówi, że ∆GBO- ∆GBM = ∆GP- ∆GPR.
4
Zagadnienia do przygotowania:
1. Wzory i symbole (trzyliterowe i jednoliterowe) aminokwasów białkowych.
2. Typy oddziaływań w białkach (elektrostatyczne, wiązania wodorowe itd.).
3. Reguły okreś lania konfiguracji (Cahna–Ingolda–Preloga).
4. Związek między zmianą entalpii swobodnej a stałą równowagi reakcji.
Literatura obowiązkowa:
1. Morrison RT., Boyd RN. 1985. „Chemia organiczna”, PWN Warszawa, rozd. 4.15 „Okreś lanie
konfiguracji R i S”, rozd. 36.2-5 (od: „Struktura aminokwasów”).
2. Lesyng B., McCammon JA. 1993. Molecular modeling methods. Basic techniques and challenging
problems. Pharmac. Ther. 60:149-167 (Uzupełnienia, Zał. 2. I, rozdz. 5).
Literatura uzupełniająca:
1.Heermann DW. 1997. Podstawy symualcji komputerowych w fizyce. WNT Warszawa.
IB. Wykonanie:
IB1. Budowa peptydu
a. Zbudować dwie cząsteczki peptydu: wyjś ciową PheThrGlu oraz docelową: PheValGlu.
Wykorzystać procedurę automatycznego budowania łańcucha polipeptydowego, dostępną w module
Biopolymer (polecenie Residue → Append).
b. Zjonizować N-końce i C-końce obu peptydów (Protein → Cap), a także boczną grupę
karboksylową kwasu glutaminowego (Modify → Bond → Bond Order, Partial Double).
c. Ustawić obie cząsteczki w podobnym położeniu oraz przypisać każdej z nich parametry potencjału
i ładunki dla pola siłowego CVFF (Forcefield → Potentials: we wszystkich opcjach wybrać Fix).
1B2. Wybór parametrów obliczeń i uruchomienie obliczeń
a. Zdefiniować transformowane atomy. Obliczenia względnej energii swobodnej wykonujemy przy
użyciu modułu Discover. Podstawą tych obliczeń jest zdefiniowanie atomów poddawanych
transformacji (ang. warping – tu: deformacja). Cząsteczce w stanie początkowym (A) przypisujemy
λ = 0, zaś cząsteczce w stanie docelowym (B) przypisujemy λ = 1. Program stopniowo przekształca
cząsteczkę A w B – stany poś rednie odpowiadają ułamkowym wartoś ciom λ, czyli ∆λi. W celu
zdefiniowania transformowanych atomów wywołać Constraint→Warp (opcje: Add, Atom_Pair),
następnie „wycelować” na odpowiedni atom, sprawdzić, czy jego symbol pojawia się we
właś ciwym oknie dialogowym, a następnie „kliknąć” lewym klawiszem myszy. W ten sposób
zdefiniować pary transformowanych atomów:
A_Atom:
B_Atom:
Cβ (Thr)
Cβ (Val)
O (grupa hydroksylowa Thr)
Cγ (Val)
H (grupa hydroksylowa Thr)
H (połączony wiązaniem ze zdefiniowanym Cγ)
5
oraz pozostałe 2 atomy wodoru grupy metylowej cząsteczki B, które nie posiadają odpowiedników
w czasteczce A – wybrać opcję From_Null: B_Atom: kolejno “kliknąć” na 2 atomy H należące do
transformowanej grupy metylowej. Należy sprawdzić, czy pary zostały zdefiniowane poprawnie
(Warp→Activation = List).
b. Zadać parametry obliczeń względnej energii swobodnej. W ćwiczeniu należy przyjąć następujące
wartoś ci parametrów (polecenie Parameters→Relative): granice całkowania termodynamicznego λ
= 0 do λ = 1; wielkość perturbacji, δλ w rówaniu (1), Dlambda = 0.005; liczba kroków całkowania
względem λ (liczba punktów kwadratury Gaussa-Legendre’a, czyli k w sumie w równaniu 1)
Quadrature Points = 10; częstość próbkowania czynnika Boltzmanna Sampling = 100. Wartość
kroku całkowania parametru λ, tj., ∆λi wyznacza program, zależy ona od przyjętej metody
całkowania.
c. Zadać parametry minimalizacji (Parameters → Minimize): 100 iteracji algorytmu Steepest
Descents (pozostałe parametry domyś lnie) – optymalizacja struktury początkowej peptydu.
d. Zadać parametry dynamiki (Parameters → Dynamics): 10 000 kroków czasowych równoważenia
układu, 10 000 kroków czasowych dynamiki – taki cykl równoważenia i dynamiki przeprowadza
się dla każdego kroku całkowania po λ, tj., dla każdego i we wzorze (1); zapisywanie danych na
dysku (History) co 100 kroków, temperatura 298.0 K (pozostałe parametry domyś lnie) (UWAGA:
zapisać długość kroku czasowego).
e. Zadać parametry oddziaływań niewiążących. Z menu wybrać: Parameters→Variables i ustawić
promień obcięcia Cutoff = 15.0 Å; Parameters→Set i ustawić stałą dielektryczną = 1.0, zależną od
odległoś ci (Dist_Dependent).
f. Uruchomić obliczenia: Z menu wybrać Run→Run. Sprawdzić, czy w oknie dialogowym nazwy
obiektu znajduje się nazwa cząsteczki w stanie docelowym (nazwa peptydu PheValGlu). Ustawić
tryb obliczeń w tle (symulacja nie będzie pokazywana na ekranie – pozwoli to skrócić czas
obliczeń): Computation Mode = Batch. Włączyć opcje minimalizacji i dynamiki; upewnić się, czy
pozostałe parametry są ustawione domyś lnie (Discover Hosts = Local, List = Off, Strategy = Off,
Auto Option = Add_Auto, PBC = Off, Reduce_Output = On). Polecenie Execute uruchamia
obliczenia.
g. Sprawdzić, czy obliczenia zostały uruchomione poprawnie. W oknie UNIX’a, z której
uruchomiono program BioSym, wyś wietlane są polecenia i komunikaty programu. Przy użyciu
polecenia Constraint→Warp→List sprawdzić, czy program poprawnie zinterpretował definicje
atomów transformowanych (patrz niżej):
Relative Free Energy Warped Atoms:
residue THR 2 atom CB
and residue VAL 2 atom CB
residue THR 2 atom OG1
and residue VAL 2 atom CG2
residue THR 2 atom HG1
and residue VAL 2 atom HG22
residue VAL 2 atom HG23
to NULL
residue VAL 2 atom HG21
to NULL
6
Po zakończeniu obliczeń program wyś wietla stosowny komunikat.
W nowym oknie UNIX’a wyś wietlić aktualnie biegnące procesy (polecenie ps -aef) i odszukać proces
odpowiadający obliczeniom (UID: student, odczytać czas uruchomienia, znaleźć nazwę swojej
cząsteczki).
UWAGA: Czas obliczeń na komputerze Sauron wynosi ok. 30 min. Obecnie należy wykonywać część
II ćwiczenia, natomiast tę część dokończyć po zakończeniu obliczeń.
1B3. Analiza uzyskanych wyników
Program tworzy szereg plików wyjś ciowych, m.in.:
.inp – plik wejś ciowy zawierający zestawienie par atomów transformowanych oraz ważniejsze
parametry wejś ciowe obliczeń
.mdf – „molecular dynamics file”, wyszczególnienie przypisanych ładunków formalnych oraz typów
potencjałów
.car – zawiera współrzędne atomów układu
.wrp – zawiera szczegółowe parametry atomów transformowanych
.out – zawiera – w postaci „historii całkowania” – wszystkie parametry obliczeń, wartoś ci energii,
energii swobodnej (A) i jej zmian, czynników Boltzmanna (e-∆Η/kT) oraz błędy obliczonych
wielkoś ci
.tbl – plik wykorzystywany do tworzenia wykresów w module Analysis.
UWAGA: Dla energii swobodnej używa się równoważnych sobie symboli A oraz F.
a. Sprawdzić zbieżność obliczeń. Otworzyć plik *.out za pomocą edytora jot. Znaleźć na końcu pliku
tabelę w której zestawione są wyniki obliczeń energii swobodnej, skopiować tabelę. Odczytać końcową
wartość zmiany energii swobodnej (TOTAL dA(λ)
error). Sprawdzić, czy wartoś ci dA+/dλ
(perturbacja energii swobodnej z krokiem dodatnim) i dA-/dλ (perturbacja energii swobodnej z krokiem
ujemnym) są podobe. Jeżeli różnią się znacząco, oznacza to słabą zbieżność lub zbyt duży krok
całkowania.
b. Odczytać wartoś ci energii: całkowitej, potencjalnej i kinetycznej po zakończeniu każdego z cykli
dynamiki („SUMMARY: Average Std. Dev.”).
c. Wyznaczyć zależnoś ci czynnika Boltzmanna od czasu symulacji dynamiki molekularnej.
W tym celu można wykorzystać moduł Analysis, bądź też skorzystać z informacji zawartych w pliku .
out. W ćwiczeniu należy użyć drugiego z powyższych sposobów.
Odczytać 10 (wyś redniowanych po 100 krokach czasowych) wartoś ci czynnika Boltzmanna
(kolumna 4) w danym cyklu, co 1 ps: 10.1, 11.0, 12.0,..., 20.0 (kolumna 2). Na jednym wykresie
przedstawić zależnoś ci czynnika Boltzmanna od czasu dla trzech wartoś ci parametru
λ: 0.02, 0.52, 0.97.
Wykresy powinny przedstawiać fluktuacje wokół stałej wartoś ci, malejące ze wzrostem λ. Tendencje
spadkowe lub zwyżkowe przy danym λ ś wiadczą o złej zbieżnoś ci obliczeń.
7
IC. Zagadnienia do opracowania:
UWAGA: Zbiory z danymi liczbowymi należy przenieść na komputer PC i tam przygotować wykresy i
wydruki.
1.
2.
3.
4.
Zwięźle opisać cel ćwiczenia i wykonane czynnoś ci wraz z podstawowymi parametrami obliczeń.
Wykreś lić zależność wartoś ci zmiany energii swobodnej sum(dA) i dA(λ) od parametru λ.
Podać końcową wartość zmiany energii swobodnej (TOTAL dA(λ) error).
Porównać wartoś ci dA+/dλ (perturbacja energii swobodnej z krokiem dodatnim) i dA-/dλ
(perturbacja energii swobodnej z krokiem ujemnym) – czy w obliczeniach uzyskano dobrą
zbieżność i czy użyto odpowiedniego kroku całkowania?
5. Obliczyć zmianę entalpii swobodnej ∆GBM i stałą równowagi reakcji wiązania (KBM) peptydu
PheValGlu przez receptor (patrz cykl termodynamiczny, pkt 3 Teorii), opierając się na danych:
∆GPR = 15,80 kcal/mol (wynik obliczeń metodą FEP)
∆GB0 = -6,36 kcal/mol (wynik doś wiadczenia)
Obliczyć wielkość ∆∆G w reakcji wiązania peptydu przez receptor, dla mutacji
Thr → Val (∆∆G = ∆GBM – ∆GB0). Skomentować otrzymane wartoś ci.
6. Sporządzić wykresy energii: całkowitej, kinetycznej i potencjalnej w funkcji λ (pkt 6B) i opatrzeć
komentarzem.
7. Sporządzić wykres zależnoś ci czynnika Boltzmanna od czasu symulacji dynamiki molekularnej
(punk 6C) i opatrzeć komentarzem.
8
Ćwiczenie 2(5). Porównywanie fizykochemicznych własnoś ci i struktur
bioczą steczek; algorytmy poszukiwania optymalnej struktury bioczą steczki
(K. Murzyn, M. Pasenkiwicz-Gierula).
Opracowanie ć wiczenia:
Ćwiczenie należy opracować według punktów znajdujących się na końcu poszczególnych części instrukcji
oraz podać wyniki, opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji czcionką
pogrubioną.
Cel i wykonanie:
Ćwiczenia 2(5) ma na celu zaznajomienie studentów z komputerowym (1) wyznaczaniem niektórych
fizykochemicznych własnoś ci biocząsteczek; (2) wyznaczaniem parametru RMSD określającego
“globalne” podobieństwo różnych struktur biocząsteczki; (3) okreś laniem drugorzędowej struktury
polipeptydu; (4) “generowaniem” więzów; oraz z (5) optymalizacją struktury biocząsteczki poprzez
minimalizację jej energii.
W tym ćwiczeniu, do wykonania większoś ci zadań użyty zostanie pakiet TINKER. Ogólna zasada
posługiwania się tym pakietem opisana jest w rozdziale “Komendy systemu opreacyjnego oraz krótki opis
programów komputerowych” oraz w Zał. 5. I Uzupełnienia. W Uzupełnieniu opisane są też typy plików
jakie czyta/generuje TINKER (Zał. 5. I), poszczególne programy pakietu (Zał. 5. II) oraz słowa kluczowe
(Zał. 5. III) – proszę się zapoznać z tymi opisami.
Organizacja ś rodowiska pracy: Przejść do własnej kartoteki. Utworzyć w niej kartotekę CW_5 przejść
do niej i utworzyć kartoteki o nazwach: part_A, part_B1, part_B2.
5A. Porównywanie fizykochemicznych własnoś ci i struktur biocząsteczek
5A1. Skopiowanie na dysk lokalny zbioru *.pdb zawierającego struktury β-defensyny-12, rozdzielenie
struktur, obejrzenie trzech losowo wybranych struktur programem insightII:
1. Przejść do kartoteki part_A.
2. Znaleźć zbiór ze strukturami β-defensyny-12 w Protein Data Bank ( http://www.rcsb.org) (ang.
defensin) oznaczonymi przez Zimmermanna i innych. Skopiować go na dysk lokalny (ok. 900 kB).
Zanotować i umieś cić w sprawozdaniu: a. 4-literowy kod struktury, b. metodę pomiarową, d.
pochodzenie białka, e. liczbę reszt aminokwasowych; f. elementy struktury drugorzędowej, g. liczbę
mostków dwusiarczkowych, itp.
3. Sprawdzić przy pomocy komendy grep -n “MODEL” *.pdb jaka jest liczba różnych struktur βdefensyny-12 w zbiorze *.pdb (struktury rozdzielone są słowem kluczowym MODEL, “-n” powoduje
wyś wietlenie numerów linii zawierających to słowo). Zrobić 3 kopie zbioru *.pdb ze stukturami
defensyny (patrz, lista komend UNIXa) – każda kopia musi mieć inną nazwę, ale to samo rozszerzenie
*.pdb, np. def_1.pdb, def_2.pdb, itp. Przy pomocy edytora jot, z każdego zbioru usunąć wszystko poza
jedną strukturą defensyny (w każdym zbiorze pozostawić inną strukturę – w sumie 3 struktury i 3
zbiory).
4. Wywołać insightII i obejrzeć te struktury. Wczytać 3 struktury równocześ nie. Zaobserwować i
zanotować różnice między strukturami oraz chiralność atomów w łańcuchu peptydowym.
9
5A2.
Porównanie energii potencjalnych poszczególnych cząsteczek defensyny oraz wkładów
poszczególnych członów funkcji potencjału do tych energii, obliczenie pól powierzchni oraz objętoś ci
cząsteczek, obliczenie promienia gyracji (Radius of Gyration) rg dla każdej cząsteczki:
1. Przekształcić nowo-utworzone pliki *.pdb na format XYZ TINKERA przy pomocy programu
pdbxyz; użyć parametryzacji OPLS All-Atom (oplsaa.prm). Dla ułatwienia pracy: zbiór tinker.key z
kartoreki /app/modmol skopiować 3-krotnie, a tworzonym zbiorom nadać takie same nazwy jakie mają
utworzone powyżej zbiory *.pdb, jedynie pozostawić rozszerzenie *.key. W przeciwnym przypadku, za
każdym wywołaniem programu pdbxyz trzeba wpisywać linię zawierającą ś cieżkę do kartoteki ze
zbiorem PRM który zawiera parametry funkcji potencjału: /app/modmol/params/oplsaa.prm.
2. Wywołać program analyze (z pakietu TINKER) w celu obliczenia energii potencjalnej dla trzech
wybranych struktur defensyny. Program ANALYZE wczytuje zbiór XYZ, zawierający współrzędne
kartezjańskie atomów, oraz zbiór PRM, zawierający parametry funkcji potencjału – informacja o
lokalizacji tego zbioru jest zawarta w zbiorze *.key. Uruchamiany w trybie wsadowym, ANALYZE
czyta dodatkowo plik INP, zawierający parametry kontrolne programu. Zapisać obliczone energie
potencjalne oraz wkłady od poszczególnych członów energetycznych: van der Waalsa,
elektrostatycznej, drgań rozciągających wiązania (ang. bond-stretching) itp; zidentyfikować najwyżej
energetyczne oddziaływania we wszystkich strukturach.
3. Wywołać program analyze. Tym razem obliczyć i zapisać promienie gyracji rg cząsteczek.
4. Wywołać program spacefill (z pakietu TINKER). Obliczyć pola powierzchni cząsteczek oraz ich
objętoś ci (metoda Connolly’ego, opcja nr 2 programu spacefill). W obliczeniach uwzględnić domyś lne
(ang. default) ustawienia programu spacefill (Probe Radius = 1.4 Å, No Hydrogens) Wyniki (2), (3) i
(4) zestawić w tabeli.
5A3. Wyznaczenie parametru RMSD (ang. root mean square distance) dla wybranych cząsteczek
defensyny w celu określenia różnic w ich strukturach.
RMSD jest pierwiastkiem ze ś redniego kwardatu różnicy położeń odpowiadających sobie atomów w
dwóch strukturach cząsteczki, po ich optymalnym nałożeniu (Günter, 1998). Pozwala on wyznaczyć
“globalne” podobieństwo (różnicę) między tymi strukturami – im większa wartość RMSD, tym bardziej
różnią się porównywane struktury. RMSD wyznaczony jak poniżej, nie dostarcza informacji o tym w
jakich fragmentach cząsteczki występują największe różnice strukturalne. Dokładniejszą informację o
różnicach strukturalnych można otrzymać obliczając RMSD dla poszczególnych fragmentów cząsteczki.
1. Wywołać program superpose (z pakietu TINKER). Obliczyć RMSD każdej z wybranych struktur
defensyny z pozostałymi. W obliczeniach uwzględnić domyś lne ustawienia parametrów (podane
zwykle w nawiasach kwadratowych na końcu każdego zadanego przez program pytania).
10
Opracowanie tej częś ci ć wiczenia:
(1) Omówić, na podstawie artykułu Zimmermann et al., 1995 (Zał. 5. XI), biologiczną rolę defensyn i ich
główne elementy strukturalne.
(2) Na podstawie wartoś ci wyznaczonych wyżej parametrów, omówić różnice w energiach,
własnoś ciach fizykochemicznych i strukturach badanych cząsteczek β-defensyny-12.
5A4. Określenie struktury drugorzędowej biocząsteczki:
1. Przed uruchomieniem programu dssp.exe, proszę przeczytać jego skrócony opis (Uzupełnienia,
ZAŁ. 5. IV) i zaznajomić się (a) ze sposobem uruchamiania programu, (b) ze strukturą i informacjami
zawartymi w zbiorze wynikowym.
2. Wywołać program dssp.exe, ze wskazaniem zbioru wynikowego (dssp.exe pdb_file out_file), w celu
okreś lenia struktury drugorzędowej dla trzech wybranych cząsteczek β-defensyny-12.
3. Obejrzeć wygenerowany zbiór out_file i znaleźć w nim informacje o wartościach kątów PHI i PSI; o
powierzchni dostępnoś ci wody; utworzonych wiązaniach wodorowych (ZAŁ. 5. IV).
Opracowanie tej częś ci ć wiczenia:
(1) Omówić najważniejsze elementy metody Kabscha-Sandera (Kabsch & Sander, 1983, Zał. 5. XII).
(2) Czy struktury drugorzędowe wybranych cząsteczek β-defensyny-12 wyznaczone w tym ćwiczeniu
metodą Kabscha-Sandera są takie jak te podane w pliku *.pdb zdeponowanym w Protein Data Bank –
omówić różnice.
(3) Dla jednej cząsteczki β-defensyny-12 wskazać kilka najmocniejszych wewnątrzcząsteczko-wych
wiązań wodorowych, podać reszty oraz grupy chemiczne, do których należą atomy tworzące wiązanie.
5A5. “Komputerowy” eksperyment NOE (Nuclear Overhauser Effect) – generowanie więzów (restraindistance), tj. utworzenie zbioru odległoś ci (z zadanego przedziału) między atomami wodoru należącmi do
różnych reszt aminokwasowych w cząsteczce (porównaj – Zimmermann et al., 1995):
1. Wywołać program fakenoe.x (z pakietu TINKER), i dla jednej ze struktur β-defensyny (*.pdb)
wygenerować przy jego pomocy zbiór odległoś ci dla par protonów, których wzajemna odległość jest
nie większa niż zadana górna wartość RD (restrain-distance). W tym programie, domyś lna wartość RD
wynosi 4.0 Å (co odpowiada słabym sygnałom NOE). W metodzie NOE więzy dla RD równego 2.7 Å
odpowiadają sygnałom silnym, a dla RD równego 3.3 Å – sygnałom średniej mocy. Proszę
wygenerować zbiory więzów z zakresów takich jak w pracy Zimmermanna et al., 1995, tj. dla (a) RD
równego 2.5 Å, (b) RD równego 3.5 Å, oraz (c) RD równego 4.0 Å. Wypisane na ekranie więzy dla
poszczególnych wartoś ci RD należy przenieść do zbioru tekstowego (użyć jot i “myszki” – lewy i
ś rodkowy klawisz) i zapisać pod nazwą np. noe.out. Zanotować i umieś cić w sprawozdaniu: liczbę
więzów dla 1.8<RD≤2.5 Å, dla 2.5<RD≤3.5 Å, oraz dla 3.5<RD≤4.0 Å i porównać je z liczbami
podanymi przez Zimmermanna et al., 1995 – spróbować wyjaś nić róznicę w liczbach otrzymanych w
tym ćwiczeniu i przez Zimmermanna et al. (Zał. 5.XI).
11
5B. Optymalizacja struktury biocząsteczki w funkcji metody minimalizacyjnej oraz konformacji
początkowej:
Celem ćwiczenia 5B jest porównanie efektywnoś ci metod minimalizacyjnych używanych do
optymalizacji i uś ciś lania trójwymiarowej struktury cząsteczek. Procesowi minimalizacji poddana jest
funkcja energii potencjalnej układu molekularnego zdefiniowana w ramach mechaniki molekularnej.
W tym ćwiczeniu, optymalizowana będzie struktura peptapeptydu Met-enkefaliny (M-Enk)
(Tyr1-Gly2-Gly3-Phe4-Met5). M-Enk jest niewielką cząsteczką (Rys. 4 przedstawia jej wzór
strukturalny), możliwe więc będzie w czasie przeznaczonym na ćwiczenia przeprowadzenie
optymalizacji jej struktury kilkoma metodami minimalizacyjnymi. M-Enk jest najczęś ciej badanym
przedstawicielem peptydów wykazujących aktywność opioidową. W długiej historii badań (Hughes et
al., 1975) nad konformacją tego peptydu stawiano przeciwstawne hipotezy dotyczące jego struktury. Co
ciekawe – problem trójwymiarowej struktury enkefalin pozostaje nadal nierozwiązany. Główną tego
przyczyną jest to, że krótkie, liniowe peptydy w różnych otoczeniach (w ś rodowisku wodnym, błonie
lipidowej, rozpuszczalniku organicznym) przyjmują szereg niskoenergetycznych, właś ciwych danemu
rozpuszczalnikowi konformacji, trudno więc zdefiniować ich strukturę natywną. Biorąc po uwagę, że
czasy życia takich dyskretnych konformacji są znacznie krótsze od czasów pokrywanych technikami
magnetycznego rezonansu jądrowego, więzy geometryczne generowane w metodzie
wielowymiarowego NMR odpowiadają pewnej uś rednionej konformacji, która w szczególnoś ci może
odbiegać od mikrostanów peptydu (Meirovitch & Meirovitch, 1996, Uzupełnienia, Zał. 5. V).
W tej częś ci ćwiczenia zostaną sprawdzone następujące zależnoś ci:
(1) związek między metodą minimalizacyjną a czasem optymalizacji i końcową strukturą MEnk. Użyte będą następujące metody minimalizacyjne: największego spadku (steepest
descent, program MINIMIZE) oraz sprzężonych gradientów (nonlinear conjugate gradient,
domyś lna metoda programu MINIMIZE). Przy porównaniu struktur końcowych
wykorzystane będą następujące kryteria:
• wartość końcowej energii potencjalnej i konformacje cząsteczki (kąty PHI i PSI),
• liczba iteracji i czas obliczeń;
(2) w jaki sposób struktura początkowa wpływa na wynik końcowy optymalizacji.
5B1. Porównanie metod minimalizacyjnych.
5B1a. Budowa M-Enk w konformacji rozciągniętej (extended).
Przejść do kartoteki part_B1. Wywołać program protein w celu zbudowania peptydu o zadanej
sekwencji i konformacji (skrócony opis programu protein znajduje się w Uzupełnieniach, Zał. 5. VI, a
przykład jego użycia poniżej). W tej częś ci ćwiczenia praca z programem jest interaktywna, tzn.
program kolejno “pyta” o niezbędne parametry (w dalszych etapach należy posługiwać się plikami
wsadowymi (input)). Na pytania programu odpowiadać w podany niżej sposób (tekst kursywą):
12
##############################################################################
##############################################################################
##
##
##
TINKER --- Software Tools for Molecular Design
##
##
##
##
Version 3.5
October 1997
##
##
##
##
Copyright (c) Jay William Ponder 1990-1997
##
##
All Rights Reserved
##
##
##
##############################################################################
##############################################################################
Enter Name to be used for Output Files :
Enter Title :
5b1_ext
Met-Enkephalin, extended, exercise 5B1
Enter Potential Parameter File Name : /app/modmol/params/oplsaa.prm
Enter One Residue per Line, Free Format: 1 or 3 Letter Code, then
Phi/Psi/Omega (3F), Chi Angles (4F), then Disulfide Partner if a
CYS (I) and D/L Chirality as desired (A1), <CR> ends Residue entry
The allowed N-Cap Residues are Acetyl=ACE or Formyl=FOR, and the
possible C-Cap Residues are N-MethylAmide=NME or Amide=NH2
Enter Residue
1 :
Tyr 180 180
Enter Residue
2 :
Gly 180 180
Enter Residue
3 :
Gly 180 180
Enter Residue
4 :
Phe 180 180
Enter Residue
5 :
Met 180 180
Enter Residue
6 :
Cyclize the Polypeptide Chain [N] : N
Po wykonaniu programu w aktualnej kartotece pojawią się trzy nowe pliki. Wykonać ls –l.
Wypisane zostną zbiory:
-rw-r--r--rw-r--r--rw-r--r--
1 studbt
1 studbt
1 studbt
user
user
user
5285 Oct 20 12:52 5b1_ext.int
18 Oct 20 12:52 5b1_ext.seq
5009 Oct 20 12:52 5b1_ext.xyz
Odczytać (more) zawartość utworzonych plików i umieś cić w sprawozdaniu informacje o: (1)
zawartoś ci wygenerowanych plików (opis formatu XYZ w Zał. 5. VII), (2) liczbie atomów w układzie,
(3) liczbie reszt aminokwasowych oraz (4) sekwencji aminokwasów. Wygenerować plik PDB (program
xyzpdb). Obejrzeć i wydrukować rysunek ze strukturą (rasmol) zbudowanej czasteczki Metenkefaliny. Wygenerować rysunek w reprezentacji Ball-and-Stick (format GIF, białe tło).
13
Skopiować plik *.xyz na: 5b1_desc.xyz oraz 5b1_conj.xyz, a plik *.seq na:
Skopiować plik tinker.key na 5b1_ext.key; 5b1_desc.key oraz 5b1_conj.key
5b1_desc.seq
oraz
5b1_conj.seq.
5B1b. Porównanie efektywnoś ci metod minimalizacyjnych – wyznaczenie czasów optymalizacji
struktury M-Enk z narzuconą wartoś cią końcową gradientu potencjału równą 0.1 kcal/mol.
W pliku 5b1_desc.key dopisać linię: steepest-descent. UWAGA: Na końcu każdego pliku z rozszerzeniem .key
zostawić pustą linię.
Optymalizację struktury metodą największego spadku przeprowadza się programem minimize.
Przed przystępieniem do obliczeń należy napisać odpowiedni plik wsadowy o nazwie 5b1_desc.inp:
5b1_desc.xyz
0.1
(pusta linia)
Program uruchomiony poleceniem C1 poniżej wczytuje dane z pliku 5b1_desc.inp, a wynik zapisuje w
pliku 5b1_desc.out. W pliku *.out podany będzie m. in. czas wykonania (timex w poleceniu C1) programu
(do opracowania notować czas user).
Uruchomienie programu minimize poleceniem C1 poniżej:
nohup timex minimize < 5b1_desc.inp >& 5b1_desc.out &
(C1)
Program będzie wykonywany w tle, jego postępy można ś ledzić oglądając zawartość pliku 5b1_desc.out.
Po zakończeniu obliczeń, ostatni fragment przykładowego pliku 5b1_desc.out wygląda następująco:
...
2873
2874
2875
LMQN
-156.4006
-156.4009
-156.4012
--
0.0003
0.0003
0.0003
0.0001
0.0001
0.0001
0.00
0.00
0.00
2981
2982
2983
Success
Success
SmallGrad
Normal Termination due to SmallGrad
Final Function Value :
Final RMS Gradient :
Final Gradient Norm :
real
user
sys
0.1026
0.1337
0.0995
-156.4012
0.0995
0.8613
2:45.56
1:16.15
16.23
W tym przykładzie program wykonywał się przez 2 min 45 i 56/100 s. Sam program minimize
wykorzystał 1 min 16 i 15/100 s czasu procesora (ten czas należy zachować do przeprowadzenia
odpowiedniej analizy w sprawozdaniu – zaleca się podawanie również czasu real). Ostatnia z podanych
liczb reprezentuje czas procesora wykorzystany na operacje systemowe i dla naszych rozważań jest
nieistotna.
W wyniku działania programu powstał, prócz pliku 5b1_desc.out, plik zawierający współrzędne
kartezjańskie zoptymalizowanej struktury o nzawie 5b1_desc.xyz_2.
Przeprowadzić analogiczną optymalizację struktury M-Enk metodą sprzężonych gradientów. Ponieważ
metoda sprzężonych gradientów jest metodą domyś lną programu minimize, w pliku 5b1_conj.key nie
trzeba wpisywać nazwy tej metody. Napisać odpowiedni plik 5b1_conj.inp i uruchomić program
minimize (wygenerowane zostają zbiory wynikowe analogicznie jak dla metody największego spadku).
14
Opracowanie tej częś ci ć wiczenia:
(1) podać czas optymalizacji prowadzonych metodami największego spadku i sprzężonych
gradientów; końcowe wartoś ci energii potencjalnej (Final Function Value), oraz liczbę kroków
iteracyjnych (w przykładzie powyżej wynosiła ona 2875).
(2) Porównać wkłady poszczególnych członów funkcji potencjału do energii całkowitej (pkt 5A2-2)
dla obu struktur. Porównać wartoś ci kątów PHI i PSI zoptymalizowanych struktur (pkt 5A4-2 i 3) z
wartoś ciami z pracy Graham et al., 1992 (Zał. 5. IX). UWAGA: Program dssp.exe czyta wyłącznie
pliki PDB, do ich wygenerowania programem xyzpdb potrzebne są pliki *.seq.
5B2. Zależnoś ci między strukturą początkową peptydu i wynikiem optymalizacji
Przejść do kartoteki part_B2. Używając programu protein zbudować M-Enk w trzech konformacjach:
1. arkusza β (SHEET) – kątom PHI i PSI przypisać waroś ci odpowiednio -139.0° i +135.0° iutworzyć
zbiór o nazwie 5b2_sht;
2. helisy (HELIX) – kątom PHI i PSI przypisać waroś ci odpowiednio -57.0° i -47.0° i utworzyć zbiór
o nazwie 5b2_hlx;
3. kłębka statystycznego (RANDOM) – kątom PHI i PSI przypisać przypadkowe i róż niące się
między sobą wartoś ci z przedziału od –180.0° do +180.0° (nie dawać wartoś ci ±180°) i utworzyć
zbiór o nazwie 5b2_rnd.
Z kartoteki part_B1 skopiować plik 5b1_ext.key do zbiorów: 5b2_sht.key, 5b2_hlx.key, 5b2_rnd.key. Utworzyc
odpowiednie zbiory inputowe *.inp aby przeprowadzić optymalizację metodą sprzężonych gradientów
z narzuconą wielkoś cią gradientu 0.01.
Dla każdej ze struktur zanotować i umieś cić w sprawozdaniu: (1) liczbę iteracji, (2) czas obliczeń i (3)
wartość energii po optymalizacji. Użyć programu superpose do obliczenia wartoś ci RMSD między
poszczególnymi strukturami startowymi oraz między strukturami zoptymalizowanymi.
UWAGA: Nie porównywać struktury startowej z końcową. W porównaniach uwzględnić wcześ niej
zoptymalizowaną metodą sprzężonych gradientów strukturę EXTENDED – patrz punkt 2b).
Wyniki porównań zestawić w tabeli. Wywołać dssp.exe, okreś lić wartoś ci kątów PHI i PSI,
porównać je z wartoś ciami z pracy Graham et al., 1992 (Zał. 5. IX). Sprawdzić, czy tworzą się β-skręty
(β-turns) – Zał. 5. X.
Odnoś niki literaturowe:
1. Günter P. 1998. Q. Rev. Biophys. 31:145-237; rozdział 7.2.
2. Zimmermann G. R., Legault P., Selsted M. E. and Pardi A. 1995. Biochemistry 34:13663-13671
(Zał. 5. XI).
3. Kabsch W. and Sander Ch. 1983. Biopolymers 22:2577-2637 (Zał. 5. XII).
4. Hughes J., Smith T. W. Kosterlitz H. W. Fothergill L. A. Morgan B. A. Morris H. R. 1975. Nature,
258:577-580.
5. Meirovitch E. and Meirovitch H. 1996. Biopolymers 38:69-88.
6. Graham W. H., Certer E. S. and Hicks R. 1992. Biopolymers 32:1752-1764.
7. Wilmot C. M. and Thornton J. M. 1988. J. Mol. Biol. 203:221-232.
15
Ćwiczenie 3(7). Wyznaczanie natywnej struktury bioczą steczki poprzez
poszukiwanie minimum globalnego funkcji potencjału
(K. Murzyn, M. Pasenkiewicz-Gierula).
Opracowanie ć wiczenia:
Ćwiczenie należy opracować według punktów znajdujących się na końcu poszczególnych części instrukcji
oraz podać wyniki, opisy i wyjaś nienia zgodnie z punktami oznaczonymi w instrukcji czcionką
pogrubioną.
Cel, teoria i wykonanie:
Ćwiczenie 3(7) ma na celu zaznajomienie studentów z trzema metodami puszukiwania natywnej
struktury polipeptydów:
(1) symulowanego wyżarzania, SA (Simmulated Annealing), Brünger AT., Nilges M. 1993. Q. Rev.
Biophys. 26:49-125;
(2) DG (Distance Geometry), Hodsdon ME., Cistola DP. 1997. Biochemistry. 36:1450-1460;
(3) DEM (Diffusion Equation Method), Kostrowicki J., Scheraga HA. 1992. J.Phys.Chem. 96:74427449.
Organizacja ś rodowiska pracy: Przejść do własnej kartoteki. Utworzyć kartotekę CW_7, przejść do niej
i utworzyć kartoteki o nazwach: part_A1, part_A2, part_A3, part_B.
Metody optymalizacji struktury cząsteczki poprzez minimalizacją jej energii potrencjalnej, poznane w
ćwiczeniach 5 i 6, wykorzystywane są zazwyczaj w początkowym lub w końcowym etapie ustalania
trójwymiarowej struktury cząsteczki. Główną wadą tych metod jest ich niewielka skuteczność w
odniesieniu do tzw. problemu lokalnych minimów (minimalizacja prowadzi do najbliższego lokalnego
minimum, które może leżeć daleko od minimum globalnego funkcji). W ostatnich latach opracowano
szereg metod, przy pomocy których problem lokalnych minimów można częś ciowo obejść. Jednakże,
nadal brak uniwersalnej metody znajdowania globalnego minimum funkcji energii, a tym samym
jednoznacznego wyznaczenia natywnej struktury biocząsteczki.
Metody, których celem jest poszukiwanie globalnego minimum funkcji potencjału, to symulowane
wyżarzanie, SA (Simmulated Annealing), Distance Geometry, DG oraz wygładzania funkcji potencjału,
DEM (Diffusion Equation Method). Metody SA oraz DG są obecnie rutynowo stosowane w procesie
ustalania struktury białek w oparciu o dane NMR. W tym ćwiczeniu trzy wymienione wyżej metody te
będą użyte do optymalizacji struktury M-Enk. Wyznaczone struktury będą porównane między sobą.
7A. Metoda symulowanego wyż arzania (SA, Simmulated Annealing)
Powierzchnia energii potencjalnej białka charakteryzuje się wielką liczbą lokalnych minimów.
Ponieważ wzrost temperatury (tj. energii kinetycznej) obniża wysokość barier energetycznych,
podniesienie temperatury układu poddanego symulacji dynamiki molekularnej pozwala na znacznie
efektywniejsze pokrycie stanów konformacyjnych układu. Metoda symulowanego wyżarzania polega
na przeprowadzeniu krótkich symulacji dynamiki molekularnej cząsteczki w temperaturze 1000 K (lub
wyższej, do 10000 K), a następnie stopniowym schładzaniu układu. Pozwala to cząsteczce zrelaksować
i osiągnąć stan nisko-energetyczny. Na końcowy wynik procesu wpływa zarówno przebieg procesu
schładzania, tj. czy temperatura maleje liniowo, sigmoidalnie lub eksponencjalnie, jak i zwiększenie
masy wszystkich atomów w układzie o pewien stały czynnik.
16
W pakiecie TINKER, do przeprowadzania symulowanego wyżarzania służy program ANNEAL. W
trzech kolejnych częś ciach ćwiczenia 7A przebadany będzie wpływ (1) sposobu schładzania układu na
końcowy wynik oraz czas obliczeń; (2) zmiany masy atomów w układzie na efektywność procesu SA;
oraz (3) konformacji startowych na końcowy wynik.
7A1. Wpływ sposobu schładzania układu na końcowy wynik oraz czas obliczeń
Z kartoteki CW_5 part_B1 skopiować pliki 5b1_ext.xyz, 5b1_ext.seq, 5b1_ext.key; zmienić ich nazwy na
7a1_ext.*. W pliku .key dodać linię ze słowem kluczowym RATTLE (pozwoli to na wydłużenie kroku
czasowego do 2.0 fs dzięki zamrożeniu drgań wiązań z udziałem atomu wodoru). Utworzyć kartoteki
lin, sig i exp. Do każdej z nich skopiować pliki 7a1_ext.*. Przejść do kartoteki lin. Uruchomić program
anneal w trybie interaktywnym – na pytania o parametry odpowiadać zgodnie z podanym niżej wzorem
(Uwaga: zapisać znaczenie poszczególnych parametrów !!! ). Usunąć z bieżącej kartoteki
wygenerowane pliki z wyjątkiem *.xyz; *.key oraz *.seq.
7a1_ext.xyz
1000
0
50
1000
L
2.0
10.0
0.0
(pusta linia)
Utworzyć zbiór wsadowy (input) w/g podanego wyżej wzoru zmieniając liczbę kroków SA na 10000.
Uruchomić program anneal poleceniem analogicznym do C1 w ćwiczeniu 5B1. Zanotować czas
obliczeń. Obliczyć końcową energię potencjalną i jej składowe dla zoptymalizowanej struktury
(analyze) oraz kąty PHI i PSI (dssp.exe). UWAGA: Program dssp.exe czyta wyłącznie pliki PDB, do
ich wygenerowania programem xyzpdb potrzebne są pliki *.seq.
Przejść do kartoteki sig. Uruchomić program anneal poleceniem i z plikiem inputowym jak powyżej;
ustawić liczbę kroków na 10000; zmienić COOLING PROTOCOL na SIGMOIDAL. Wyniki opracować jak
powyżej.
Przejść do kartoteki exp. Uruchomić program anneal poleceniem i z plikiem inputowym jak powyżej;
ustawić liczbę kroków na 10000; zmienić COOLING PROTOCOL na EXPONENTIAL. Wyniki opracować jak
powyżej.
Opracowanie tej częś ci ć wiczenia:
(1) Porównć energie (pkt 5A2) i czasy obliczeń dla otrzymanych trzech końcowych struktur.
7A2. Wpływ zwiększenia masy atomów w układzie na efektywność procesu SA
Przejść do kartoteki part_A2. Z kartoteki part_A1/lin skopiować plik .xyz, .key, .seq oraz .inp. Zmienić ich
nazwy na 7a2_ext.*. Uruchomić program anneal poleceniem i z plikiem inputowym jak ćwiczeniu 7A1,
ustawić liczbę kroków na 10000, COOLING PROTOCOL na LINEAR oraz zmienić Increase Atomic Weights by a
Factor of 10^x na 4.0. Wyniki opracować jak powyżej. Porównać wyniki dla mnożnika mas atomowych
(mass-factor) = 4.0 oraz mass_factor = 0.0 (ćwiczenie 7A1-lin).
17
7A3. Wpływ konformacji startowych na końcowy wynik procesu SA
Przejść do kartoteki part_A3. Z kartoteki part_A1/lin skopiować plik .xyz, .key, .seq oraz .inp M-Enk w
konformacji rozciągniętej. Zmienić ich nazwy na 7a3_ext.*. Z kartoteki CW_5/part_B2 skopiować pliki
5b2_hlx.xyz i 5b2_rnd.xyz zawierające struktury M-Enk w konformacji helikalnej i przypadkowej oraz
utworzyć niezbędne pliki .key, .seq.
Wykonać program anneal dla konformacji rozciągniętej, helikalnej i przypadkowej. Za każdym razem
ustawić liczbę kroków na 10000, COOLING PROTOCOL na LINEAR, Increase Atomic Weights by a Factor of 10^x
na 2.0. Wyznaczyć końcowe energie potencjalne (analyze) oraz kąty PHI i PSI (dssp.exe).
Opracowanie ć wiczenia 7A:
(1) Dla struktur otrzymanych w ćwiczeniu 7A1, 7A2 i 7A3: porównć ich energie (pkt 5A2), kąty PHI i
PSI i czasy obliczeń.
(2) Która z uzyskanych struktur charakteryzuje się najniższą energią potencjalną? Czy celowe jest
przeprowadzanie SA dla kilku (dziesięciu itp.) struktur początkowych?
7B. Metoda DISTANCE GEOMETRY (DG)
Metoda DG – metric matrix distance geometry była pierwszą metodą optymalizacyjną użytą do
okreś lenia struktury białka w oparciu o dane NMR. Bazuje ona na założeniu, że dane uzyskane w
eksperymencie Nuclear Overhauser Effect (NOE) oraz dane stereochemiczne (chiralność) można
przedstawić w postaci więzów narzuconych na odległoś ci między atomami w cząsteczce (RD).
Podstawą teoretyczną metody DG jest założenie, że jeś li znane są dokładne wartoś ci wszystkich
odległoś ci między elementami zbioru punktów w trójwymiarowej przestrzeni euklidesowej, to można
okreś lić współrzędne kartezjańskie tych punktów. W rzeczywistoś ci nigdy nie dysponujemy pełnym
zbiorem odległoś ci międzyatomowych w białku. Co gorsza, nawet te, które można wyznaczyć
eksperymentalnie, nie są znane dokładnie, ale jako zakres dopuszczalnych wartoś ci (granice przedziału
wyznacza z jednej strony odległość między dwoma atomami w kontakcie van der Waalsa, z drugiej
strony zasięg efektu Overhausera). Dodatkowe ograniczenia narzucają dopuszczalne długoś ci wiązań i
wielkoś ci kątów walencyjnych. Aby skorzystać z metody DG, należy w pierwszej kolejnoś ci ustalić RD
dla nieznanych z pomiarów NOE odległoś ci międzyatomowych (boundary smoothing). Następnie
losowo generuje się kompletny zestaw odległoś ci, które mieszczą się w dopuszczalnych, racjonalnych
zakresach. Na ich podstawie dokonuje się obliczenia współrzędnych kartezjańskich poszczególnych
atomów. Ze względu na wprowadzone uproszczenia przy uzupełnianiu zbioru RD, wygenerowana
trójwymiarowa struktura białka jest silnie zaburzona, z szeregiem naprężeń (np. długoś ci wiązań i
watoś ci kątów walencyjnych odbiegają od standardowych wartoś ci, kąty PHI i PSI leżą w
niedozwolonych obszarach mapy Ramachandrana itp). Usuwanie tych naprężeń realizuje się metodą
minimalizacyjną sprzężonych gradientów lub metodą symulowanego wyżarzania. Wnikliwszy opis
metody DG oraz odnoś niki literaturowe znajdują się w pracy Hodsdon & Cistola, 1997. W pakiecie
TINKER metoda DG została zaimplementowana w programie DISTGEOM.
18
Przejść do kartoteki part_B. Z kartoteki part_A1/lin skopiować plik .xyz, .key, oraz .seq dla M-Enk w
konformacji rozciągniętej. Zmienić ich nazwy na 7b_ext.*. Utworzyć plik 7b_ext.inp według wzoru
podanego poniżej.
7b_ext.xyz
10
Y
N
Y
Y
N
N
A
(pusta linia)
Przeprowadzić obliczenia programem distgeom przy pomocy polecenia analogicznego do C1 w
ćwiczeniu 5B1.
Program generuje 10 struktur (druga linia pliku inputowego). Odczytać w pliku 7b_ext.out energię
potencjalną każdej ze struktur. Dla trzech struktur o najniżej energii obliczyć końcowe energie
potencjalne i ich składowe (analyze) oraz kąty PHI i PSI (dssp.exe)
Opracowanie tej częś ci ć wiczenia:
(1) Dla struktur otrzymanych w ćwiczeniu 7A i 7B porównć ich energie, kąty PHI i PSI i czasy
obliczeń.
(2) W sprawozdaniu porównać wyniki otrzymane metodami SA i DG.
Odnoś niki literaturowe:
Brünger AT., Nilges M. 1993. Q. Rev. Biophys. 26:49-125.
1. Hodsdon ME., Cistola DP. 1997. Biochemistry 36:1450-1460.
2. Kostrowicki J., Scheraga HA. 1992. J.Phys.Chem. 96:7442-7449.
Dla osób zainteresowanych
Na podstawie podanej niżej literatury oraz wyników otrzymanych w czasie ćwiczeń, proszę znaleźć
relację między strukturą i funkcją enkefalin. W szczególnoś ci proszę zwrócić uwagę, które z elementów
strukturalnych M-Enk, względnie jaki typ oddziaływań może być istotny dla aktywnoś ci biologicznej
enkefalin.
van der Spoel D., Berendsen H.J.C. 1996. Biophys.J. 72:2032-2041.
Gupta G. et al. 1986. FEBS Lett. 198:245-250.
Khaled M. et al. 1977. Biochem. Biophys. Res. Comm. 76:224-231.
Moret E. et al. 1990. FEBS Lett. 262:173-175.
Surewicz WK., Mantsch HH. 1988. Biochem. Biophys. Res. Comm., 150:245-251.
Vesterman N. et al. 1989. Biochim. Biophys. Acta 998:204-209.
Zhorov BS., Ananthanarayanan VS. 1994. FEBS Lett. 354:131-134.
19