Automatyzacja analizy widm NMR w procesie ustalania struktury
Transkrypt
Automatyzacja analizy widm NMR w procesie ustalania struktury
Automatyzacja analizy widm NMR w procesie ustalania struktury przestrzennej RNA. Tomasz Woźniak Streszczenie Proces analizy widm NMR dla kwasów nukleinowych jest bardzo złożony. Istotnym jego etapem, koniecznym dla przypisania sygnałów, jest wyznaczenie tzw. „ścieżek NOE”- ścieżek transferu magnetyzacji pomiędzy protonami kolejnych reszt nukleotydowych zaangażowanych w tworzenie par zasad i przypisaniu sygnałów na podstawie wyznaczonych w ten sposób ścieżek. Ze względu na niewielkie różnice wartości przesunięć chemicznych dla RNA i obecność jedynie czterech rodzajów reszt nukleotydowych, jednoznaczne przypisanie sygnałów jest niezwykle czasochłonne. Dotychczas prowadzone badania w naszej Pracowni i Pracowni Bioinformatyki prof. J. Błażewicza zaowocowały systemem analizy ścieżek NOE w oparciu o algorytm tabusearch. (1). Niestety system ten, mimo dużej szybkości obliczeń, wymaga dodatkowej wiedzy eksperckiej (pracy eksperymentatora) i nie uwzględnia wielu istotnych informacji, bez których jednoznaczne i automatyczne wyznaczenie ścieżek NOE nie jest wystarczająco efektywne. W 2013 roku ukazał się program, który na podstawie opracowanych statystyk dotyczących wartości przesunięć chemicznych oraz wykorzystaniu algorytmu FLYA, może dokonywać przypisywania większości sygnałów w regionie aromatyczno-anomerycznym (2). Celem moich badań było zaprojektowanie i zaimplementowanie informatycznego systemu analizy widm wielokierunkowych NMR dla znakowanych [13C,15N] RNA, który w dużym stopniu zautomatyzuje proces generacji ścieżek NOE, przypisywania sygnałów i wyznaczania więzów strukturalnych o nazwie RNA NOEpathfinder. Stworzyłem program, który automatycznie analizuje widma NMR, redukuje szumy, dzieli widma na regiony, a następnie wyszukuje korelacje pomiędzy sygnałami na różnych widmach. Na podstawie tych korelacji przypisywana jest część sygnałów. W dalszych krokach korzystając z podanej sekwencji RNA i struktury drugorzędowej (format dot-bracket) program ten generuje krótkie fragmenty ścieżek NOE w regionie aromatyczno-anomerycznym, które następnie dopasowuje do sekwencji i kombinuje ze sobą. Tak powstałe pary następnie kombinatorycznie łączy ze sobą a następnie uzupełnia luki pomiędzy fragmentami ścieżek oraz brakujące fragmenty na końcach ścieżek. Na każdym etapie odrzucana jest część najgorszych rozwiązań, a uzyskane ścieżki są następnie klastrowane na podstawie podobieństwa i oceniane. Wyznaczenie ścieżek NOE pozwala na przypisanie pozostałych sygnałów oraz stworzenie więzów odległościowych, które mogą być wykorzystywane do modelowania cząsteczki z wykorzystaniem metod dynamiki molekularnej. Program ten jest umieszczony na maszynie obliczeniowej, a dostęp do niego odbywa się poprzez webserwis zlokalizowany pod adresem http://rnanoepathfinder.ibch.poznan.pl. Program RNA NOEpathfinder wykorzystuje możliwość automatycznego zaznaczania sygnałów, jaka jest zaimplementowana w programie Felix 2007 (Felix NMR Inc.) oraz Topspin 3 (Bruker). Tak wyznaczone sygnały są przekazywane jako dane wejściowe. Ponadto program RNA NOEpathfinder zawiera system modyfikowalnych plików wewnętrznych, dzięki którym istnieje możliwość m.in. wprowadzania modyfikacji reszt nukleotydowych.