Kurs: METODY SZTUCZNEJ INTELIGENCJI

Transkrypt

Kurs: METODY SZTUCZNEJ INTELIGENCJI
Kurs: ANALIZA DANYCH i UCZENIE MASZYNOWE
Kod kursu: WI/N1/INF/
/KMSIiMS
1.Odpowiedzialny za kurs, jego miejsce zatrudnienia i e-mail:
Dr inż. Marcin Korzeń, Zakład Metod Sztucznej Inteligencji, Katedra Metod Sztucznej
Inteligencji i Matematyki Stosowanej, e-mail: [email protected]
2.Język wykładowy: polski
3.Liczba punktów: 3
4.Rodzaj studiów, kierunek, specjalność, kierunek dyplomowania: studia inżynierskie
zaoczne, kierunek Informatyka, specjalność
5.Status kursu dla ww. studiów: obowiązkowy
6.Informacje o formach zajęć:
Sem. Pkt
VII
3
Wykład
G/sem F.z.
10
E
Seminarium
G/sem F.z.
-
Zajęcia praktyczne
Ćw/ćw. komp. Laboratorium
Projekt
G/sem F.z. G/sem F.z. G/sem F.z.
10
Z
10
Z
-
Objaśnienia: Pkt – liczba punktów, G/sem. – liczba godzin w semestrze, F.z. – forma
zaliczenia zajęć (E – egzamin, z – zaliczenie). Ćw. komp – zajęcia w formie ćwiczeń, na
stanowiskach komputerowych
7. Wymagane zaliczenie kursów poprzedzających (lub określenie wymaganej wiedzy):
Matematyka, Rachunek prawdopodobieństwa i statystyka
8. Program wykładów
Uzupełnienie wiadomości ze statystyki: testowanie hipotez statystycznych, twierdzenie
Bayesa, metoda największej wiarygodności, analiza składowych głównych. Preprocesing
danych: normalizacja, dyskretyzacja zmiennych, uzupełnianie danych brakujących,
wizualizacja danych. Wykrywanie zmiennych istotnych. Wykrywanie interesujących reguł
i wzorców, algorytm Apriori. Algorytmiczne aspekty metod eksploracji danych. Zadanie
klasyfikacji, metoda najbliższych sąsiadów, regresja logistyczna – iloraz szans, naiwny
klasyfikator bayesowski, drzewa klasyfikacyjne – miary zanieczyszczenia, przycinanie.
Szacowanie dokładności klasyfikatora, kroswalidacja, krzywa ROC. Grupowanie danych:
hierarchiczne algorytmy aglomeracji, algorytm K-środków, algorytm FCM.
9. Program zajęć praktycznych
ćwiczenia audytoryjne : Uzupełnienie wiadomości ze statystyki (analiza składowych
głównych, zastosowania tw. Bayes'a, metoda największej wiarygodności) (2h). Algorytm
apriori – przykład (2h). Iloraz szans, testowanie niezależności, regresja logistyczna (2h).
Naiwny klasyfikator Bayesa i drzewa decyzyjne (2h). Algorytmy klasteryzacji (2h).
laboratorium : Wprowadzenie do programów WEKA i MATLAB (2h). Algorytm Apriori i
zastosowanie do wykrywania reguł (2h). Wykrywanie zmiennych istotnych (2h). Przegląd
metod klasyfikacji i klasteryzacji (2h). Analiza rzeczywistego zbioru danych (2h)
10. Efekty kształcenia
Po ukończeniu zajęć student rozróżnia podstawowe zadania analizy danych i uczenia
maszynowego, m. in. klasyfikacji oraz regresji. W zależności od typu zadania, umie
wskazać efektywne algorytmy oraz wybrane implementować.
11. Literatura
1. D. Hand, H. Mannila, P. Smyth. Eksploracja danych. WNT, Warszawa, 2005.
2. J. Koronacki., J. Ćwik, Statystyczne systemy uczące się. WNT, Warszawa, 2005.
3. D. MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge
University Press 2003
4. Ian H. Witten, Eibe Frank, Data Mining: Practical Machine Learning Tools and
Techniques, Morgan Kaufmann 2005