Eksploracja danych medycznych Metody sztucznej inteligencji w

Transkrypt

Eksploracja danych medycznych Metody sztucznej inteligencji w
Jerzy W. Grzymała-Busse
Zdzisław S. Hippe
Teresa Mroczek
Eksploracja danych medycznych
Metody sztucznej inteligencji w projektowaniu syntez leków
RZESZÓW – SZCZECIN 2015
Publikacja została dofinansowana ze środków MNiSW na utrzymanie potencjału badawczego Wydziału
Informatyki Stosowanej Wyższej Szkoły Informatyki i Zarządzania z siedzibą w Rzeszowie
Tytuł monografii naukowej:
Eksploracja danych medycznych
Metody sztucznej inteligencji w projektowaniu syntez leków
Redakcja:
Jerzy W. Grzymała-Busse
Zdzisław S. Hippe
Teresa Mroczek
Recenzent naukowy:
Prof. dr hab. Andrzej Parczewski
Komitet Naukowy:
Prof. UG dr hab. Sylwia Pangsy-Kania
Prof. dr hab. Włodzimierz Szpringer
Prof. zw. dr hab. Jerzy Kisielnicki
Prof. UW dr hab. Grzegorz Karasiewicz
Prof. UZ dr hab. Arkadiusz Świadek
Projekt okładki:
Tomek Przewrocki
Korekta językowa, skład oraz druk:
Jacek Storm
Wydawcy:
Wyższa Szkoła Informatyki i Zarządzania z siedzibą w Rzeszowie
ul. Sucharskiego 2, 35-225 Rzeszów
www.wsiz.rzeszow.pl, www.ksiegarnia.wsiz.pl
email:[email protected]
Naukowe Wydawnictwo IVG
ul. Tarpanowa 38/3, 70-796 Szczecin
www.wydawnictwoivg.pl
e-mail: [email protected]
ISBN książka 978-83-64286-33-9 ISBN ebook 978-83-64286-34-6
© Copyright by Wyższa Szkoła Informatyki i Zarządzania z siedzibą w Rzeszowie
Printed in Poland by Naukowe Wydawnictwo IVG
SPIS TREŚCI
PRZEDMOWA .................................................................................................................... 3
CZĘŚĆ I
Wprowadzenie do zagadnień planowania syntez
ROZDZIAŁ 1
Wprowadzenie ....................................................................................................................... 7
ROZDZIAŁ 2
Tradycyjne metody projektowania syntez chemicznych .................................................... 11
ROZDZIAŁ 3
Przestrzeń rozwiązań w projektowaniu syntez chemicznych ............................................. 17
CZĘŚĆ II
Wprowadzenie do badań nad projektowaniem nowych leków
ROZDZIAŁ 4
Zarys metodyki badań nad syntezą nowych leków. Bazy informacyjne dla chemii ......... 27
ROZDZIAŁ 5
Model macierzowy chemii konstytucyjnej. Podstawy koncepcji ....................................... 35
ROZDZIAŁ 6
Strategie planowania syntez w chemii organicznej. Wybrane zagadnienia ..................... 49
CZĘŚĆ III
Ćwiczenia literaturowe
WPROWADZENIE .......................................................................................................... 65
ĆWICZENIE_1 Weryfikacja i walidacja reakcji cytralu z acetonem.
Model Ugi’ego-Dugundji'ego (D-U) ................................................................................... 67
ĆWICZENIE_2 Weryfikacja i walidacja reakcji cytralu z acetonem.
Model zdrowego rozsądku (CS) .......................................................................................... 79
ĆWICZENIE_3 Weryfikacja i walidacja reakcji cytralu z acetonem.
Model podobieństwa (SM), reakcje w środowisku zasadowym .......................................... 91
ĆWICZENIE_4 Weryfikacja i walidacja reakcji metabolitów prostaglandyny PGI2
Model Ugi’ego-Dugundji'ego (D-U) .................................................................................. 97
ĆWICZENIE_5 Weryfikacja i walidacja reakcji metabolitów prostaglandyny PGI2
Model zdrowego rozsądku (CS) ........................................................................................ 109
ĆWICZENIE_6 Weryfikacja i walidacja reakcji metabolitów prostaglandyny PGI2
Model podobieństwa (SM), reakcje w środowisku kwaśnym ........................................... 115
ĆWICZENIE_7 Weryfikacja i walidacja przemian leku VIAGRA w organizmie człowieka
Model Ugi’ego-Dugundji'ego (D-U) ................................................................................. 119
ĆWICZENIE_8 Weryfikacja i walidacja przemian leku VIAGRA w organizmie człowieka
Model zdrowego rozsądku (CS), reakcje w środowisku kwaśnym ................................... 133
ZAKOŃCZENIE ............................................................................................................. 137
LITERATURA ................................................................................................................ 141
ZAŁĄCZNIK A ............................................................................................................... 145
ZAŁĄCZNIK B ............................................................................................................... 147
KOLOFON....................................................................................................................... 183
INDEKS............................................................................................................................ 185
PODZIĘKOWANIA
Z prawdziwą przyjemnością chcemy podziękować wielu osobom za życzliwą pomoc
w wydaniu monografii w aktualnym kształcie. Wyrazy wdzięczności kierujemy do:
prof. nadzw. dra hab. inż. Tadeusza Pomianka, Rektora Wyższej Szkoły
Informatyki i Zarządzania w Rzeszowie, dra Wergiliusza Gołąbka, Prorektora ds.
Rozwoju i Współpracy Wyższej Szkoły Informatyki i Zarządzania w Rzeszowie,
prof. Marcina Kozaka, Pełnomocnika Prorektora Wyższej Szkoły Informatyki
i Zarządzania w Rzeszowie w zakresie jakości badań, Urszuli Bielańskiej, a także
dra inż. Grzegorza Fica, dr inż. Grażyny Nowak i mgr. inż. Michała Mazura,
pracowników Politechniki Rzeszowskiej.
Na koniec chcielibyśmy podziękować recenzentowi, Panu prof. dr. hab. Andrzejowi
Parczewskiemu z Uniwersytetu Jagiellońskiego, za cenne uwagi, które przyczyniły
się do nadania naszej monografii ostatecznej postaci.
Jerzy W. Grzymała-Busse (JGB)
Zdzisław S. Hippe (ZSH)
Teresa Mroczek (TM)
Lawrence (KS, USA)/Rzeszów, lipiec 2015
PRZEDMOWA
Oddając tę monografię w ręce P.T. Czytelników, chcielibyśmy omówić różnice w stosunku
do pierwowzoru pt. Artificial Intelligence in Chemistry: Structure Elucidation and
Syntheses Design, opracowanego po części w Rzeszowie, oraz później, podczas pobytu
jednego z nas (ZSH) w Department of Computer Science and Engineering, Auburn
University, Auburn (Alabama, USA).
Treść książki uzupełniono nowymi danymi na temat modelu macierzowego chemii
konstytucyjnej1 (ang. matrix model of constitutional chemistry), jednego z największych
osiągnięć współczesnej nauki. Dodano także przykłady zastosowania wspomnianego modelu
w projektowaniu syntez związków chemicznych o złożonej budowie strukturalnej.
W literaturze naukowej model macierzowy jest często oznaczany skrótem D-U, który
powstał ze złożenia pierwszych liter nazwisk jego dwóch twórców (prof. James Dugundji,
University of Southern California, LA, USA, opracował podstawy matematyczne modelu,
oraz prof. Ivar Ugi, Technische Universität Műnchen, opracował główne koncepcje modelu).
Przykłady zastosowań modelu macierzowego zostały sprawdzone przy pomocy systemu
informatycznego CSB, ilustrującego w niniejszej monografii metodykę symulowania reakcji
chemicznych2. Pierwsza wersja tego systemu została opracowana w grupie naukowej,
złożonej z następujących osób: prof. Zdzisław Hippe, dr inż. Grzegorz Fic, dr inż. Grażyna
Nowak oraz mgr inż. Michał Mazur [Hippe, Fic oraz Mazur, 1992]. Nową wersję systemu
[Hippe, 2014] wyposażono w algorytmy uczenia maszynowego (ang. machine learning), co
nadało modelowi macierzowemu chemii konstytucyjnej nowy, niekonwencjonalny wymiar.
Istotną zmianę treści monografii w porównaniu do wspomnianego pierwowzoru, wprowadził
prof. Jerzy W. Grzymała-Busse (JGB) z Kansas University, Lawrence (Kansas, USA),
konsultując zastosowanie algorytmów uczenia maszynowego w modelu D-U; ponadto
zweryfikował zgodność językową (angielsko/polską) podstawowych pojęć z zakresu
1
Pomysłodawca modelu macierzowego, prof. Ivar Ugi z Technische Universität Műnchen (TUM), za
opracowanie koncepcji modelu był nominowany do nagrody Nobla. Chronologiczny wykaz publikacji prof. Ugi
podano w Załączniku B
2 Zwięzły opis systemu CSB podano w Załączniku A
sztucznej inteligencji (ang. artificial intelligence, AI) oraz planowania syntez
chemicznych (ang. syntheses planning).
W monografii zamieszczono ponadto Ćwiczenia literaturowe do nauki objaśniania wyników
projektowania syntez chemicznych, uzyskanych za pomocą różnych technik sztucznej
inteligencji oraz uczenia maszynowego. Osiągnięte wyniki nie zawsze odzwierciadlają
istniejące realia chemiczne: należy je uznać za prognozy, wymagające przemyśleń, studiów
literaturowych oraz weryfikacji laboratoryjnej. Całkowicie nowy, oryginalny kształt ćwiczeń
został nadany przez dr. inż. Teresę Mroczek (TM). Wspomniane ćwiczenia literaturowe
polegają w praktyce na zapoznaniu się z zamieszczonymi planami syntez oraz ich ocenie,
wykorzystując udostępniony w sieci Internet (w postaci pdf na stronie oznaczonej symbolem
Free Science Books) podręcznik:
Stuart Warren, Paul Wyatt:
Organic Synthesis: The Disconnection Approach, Wiley, 2nd Edition,
© 2009, ISBN: 976-0-470-71236-8.
Podtytuł monografii Metody sztucznej inteligencji w projektowaniu syntez leków, wskazuje
na niewątpliwie najbardziej frapujący, a jednocześnie ważny oraz obiecujący obszar
zastosowań tej dziedziny informatyki. Doświadczenia tu zdobyte można stosunkowo łatwo
uogólnić i wykorzystać w innych obszarach wiedzy, na przykład w automatyzacji badań,
w pracach nad podejmowaniem decyzji w przypadkach niepewności, czy ujawnianiu
zależności ukrytych (pozornie) w bardzo dużych zbiorach danych.