Automatyzacja analizy widm NMR w procesie ustalania struktury

Transkrypt

Automatyzacja analizy widm NMR w procesie ustalania struktury
Automatyzacja analizy widm NMR w procesie ustalania struktury przestrzennej RNA.
Tomasz Woźniak
Streszczenie
Proces analizy widm NMR dla kwasów nukleinowych jest bardzo złożony. Istotnym jego
etapem, koniecznym dla przypisania sygnałów, jest wyznaczenie tzw. „ścieżek NOE”- ścieżek
transferu magnetyzacji pomiędzy protonami kolejnych reszt nukleotydowych zaangażowanych w
tworzenie par zasad i przypisaniu sygnałów na podstawie wyznaczonych w ten sposób ścieżek.
Ze względu na niewielkie różnice wartości przesunięć chemicznych dla RNA i obecność jedynie
czterech rodzajów reszt nukleotydowych, jednoznaczne przypisanie sygnałów jest niezwykle
czasochłonne. Dotychczas prowadzone badania w naszej Pracowni i Pracowni Bioinformatyki
prof. J. Błażewicza zaowocowały systemem analizy ścieżek NOE w oparciu o algorytm tabusearch. (1). Niestety system ten, mimo dużej szybkości obliczeń, wymaga dodatkowej wiedzy
eksperckiej (pracy eksperymentatora) i nie uwzględnia wielu istotnych informacji, bez których
jednoznaczne i automatyczne wyznaczenie ścieżek NOE nie jest wystarczająco efektywne. W
2013 roku ukazał się program, który na podstawie opracowanych statystyk dotyczących wartości
przesunięć chemicznych oraz wykorzystaniu algorytmu FLYA, może dokonywać przypisywania
większości sygnałów w regionie aromatyczno-anomerycznym (2).
Celem moich badań było zaprojektowanie i zaimplementowanie informatycznego
systemu analizy widm wielokierunkowych NMR dla znakowanych [13C,15N] RNA, który w
dużym stopniu zautomatyzuje proces generacji ścieżek NOE, przypisywania sygnałów
i wyznaczania więzów strukturalnych o nazwie RNA NOEpathfinder.
Stworzyłem program, który automatycznie analizuje widma NMR, redukuje szumy, dzieli
widma na regiony, a następnie wyszukuje korelacje pomiędzy sygnałami na różnych widmach.
Na podstawie tych korelacji przypisywana jest część sygnałów. W dalszych krokach korzystając
z podanej sekwencji RNA i struktury drugorzędowej (format dot-bracket) program ten generuje
krótkie fragmenty ścieżek NOE w regionie aromatyczno-anomerycznym, które następnie
dopasowuje do sekwencji i kombinuje ze sobą. Tak powstałe pary następnie kombinatorycznie
łączy ze sobą a następnie uzupełnia luki pomiędzy fragmentami ścieżek oraz brakujące
fragmenty na końcach ścieżek. Na każdym etapie odrzucana jest część najgorszych rozwiązań, a
uzyskane ścieżki są następnie klastrowane na podstawie podobieństwa i oceniane. Wyznaczenie
ścieżek NOE pozwala na przypisanie pozostałych sygnałów oraz stworzenie więzów
odległościowych, które mogą być wykorzystywane do modelowania cząsteczki
z wykorzystaniem metod dynamiki molekularnej. Program ten jest umieszczony na maszynie
obliczeniowej, a dostęp do niego odbywa się poprzez webserwis zlokalizowany pod adresem
http://rnanoepathfinder.ibch.poznan.pl. Program RNA NOEpathfinder wykorzystuje możliwość
automatycznego zaznaczania sygnałów, jaka jest zaimplementowana w programie Felix 2007
(Felix NMR Inc.) oraz Topspin 3 (Bruker). Tak wyznaczone sygnały są przekazywane jako dane
wejściowe. Ponadto program RNA NOEpathfinder zawiera system modyfikowalnych plików
wewnętrznych, dzięki którym istnieje możliwość m.in. wprowadzania modyfikacji reszt
nukleotydowych.