Kurs: METODY SZTUCZNEJ INTELIGENCJI
Transkrypt
Kurs: METODY SZTUCZNEJ INTELIGENCJI
Kurs: ANALIZA DANYCH i UCZENIE MASZYNOWE Kod kursu: WI/N1/INF/ /KMSIiMS 1.Odpowiedzialny za kurs, jego miejsce zatrudnienia i e-mail: Dr inż. Marcin Korzeń, Zakład Metod Sztucznej Inteligencji, Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej, e-mail: [email protected] 2.Język wykładowy: polski 3.Liczba punktów: 3 4.Rodzaj studiów, kierunek, specjalność, kierunek dyplomowania: studia inżynierskie zaoczne, kierunek Informatyka, specjalność 5.Status kursu dla ww. studiów: obowiązkowy 6.Informacje o formach zajęć: Sem. Pkt VII 3 Wykład G/sem F.z. 10 E Seminarium G/sem F.z. - Zajęcia praktyczne Ćw/ćw. komp. Laboratorium Projekt G/sem F.z. G/sem F.z. G/sem F.z. 10 Z 10 Z - Objaśnienia: Pkt – liczba punktów, G/sem. – liczba godzin w semestrze, F.z. – forma zaliczenia zajęć (E – egzamin, z – zaliczenie). Ćw. komp – zajęcia w formie ćwiczeń, na stanowiskach komputerowych 7. Wymagane zaliczenie kursów poprzedzających (lub określenie wymaganej wiedzy): Matematyka, Rachunek prawdopodobieństwa i statystyka 8. Program wykładów Uzupełnienie wiadomości ze statystyki: testowanie hipotez statystycznych, twierdzenie Bayesa, metoda największej wiarygodności, analiza składowych głównych. Preprocesing danych: normalizacja, dyskretyzacja zmiennych, uzupełnianie danych brakujących, wizualizacja danych. Wykrywanie zmiennych istotnych. Wykrywanie interesujących reguł i wzorców, algorytm Apriori. Algorytmiczne aspekty metod eksploracji danych. Zadanie klasyfikacji, metoda najbliższych sąsiadów, regresja logistyczna – iloraz szans, naiwny klasyfikator bayesowski, drzewa klasyfikacyjne – miary zanieczyszczenia, przycinanie. Szacowanie dokładności klasyfikatora, kroswalidacja, krzywa ROC. Grupowanie danych: hierarchiczne algorytmy aglomeracji, algorytm K-środków, algorytm FCM. 9. Program zajęć praktycznych ćwiczenia audytoryjne : Uzupełnienie wiadomości ze statystyki (analiza składowych głównych, zastosowania tw. Bayes'a, metoda największej wiarygodności) (2h). Algorytm apriori – przykład (2h). Iloraz szans, testowanie niezależności, regresja logistyczna (2h). Naiwny klasyfikator Bayesa i drzewa decyzyjne (2h). Algorytmy klasteryzacji (2h). laboratorium : Wprowadzenie do programów WEKA i MATLAB (2h). Algorytm Apriori i zastosowanie do wykrywania reguł (2h). Wykrywanie zmiennych istotnych (2h). Przegląd metod klasyfikacji i klasteryzacji (2h). Analiza rzeczywistego zbioru danych (2h) 10. Efekty kształcenia Po ukończeniu zajęć student rozróżnia podstawowe zadania analizy danych i uczenia maszynowego, m. in. klasyfikacji oraz regresji. W zależności od typu zadania, umie wskazać efektywne algorytmy oraz wybrane implementować. 11. Literatura 1. D. Hand, H. Mannila, P. Smyth. Eksploracja danych. WNT, Warszawa, 2005. 2. J. Koronacki., J. Ćwik, Statystyczne systemy uczące się. WNT, Warszawa, 2005. 3. D. MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press 2003 4. Ian H. Witten, Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques, Morgan Kaufmann 2005