Metody zapewnienia jakości danych

Transkrypt

Metody zapewnienia jakości danych
Kierunek studiów Informatyka
Studia II stopnia
Przedmiot:
Rok:
Semestr:
Forma studiów:
Rodzaj zajęć i liczba godzin w semestrze:
Metody zapewnienia jakości danych
II
III
stacjonarne
Wykład
Ćwiczenia
Laboratorium
Projekt
15
15
3
Liczba punktów ECTS:
Cele przedmiotu
C1
C2
C3
Zapoznanie studentów z koniecznością monitorowania integralności i jakości danych
Zapoznanie studentów z technikami optymalizacji jakości danych w bazach danych
Zapoznanie studentów z metodami weryfikacji zgodności danych z założonymi regułami
Wymagania wstępne w zakresie wiedzy, umiejętności i innych kompetencji
1
Kompetencje uzyskiwane w zakresie przedmiotów Wprowadzenie do architektury SAS oraz Przetwarzanie
w środowisku SAS z pierwszego semestru studiów II stopnia kierunku Informatyka.
Efekty kształcenia
EK 1
EK 2
EK 3
EK 4
EK 5
EK 6
EK 7
EK 8
EK 9
W zakresie wiedzy:
Zna podstawowe zagadnienia związane z bazami danych i ich przetwarzaniem w środowisku SAS
Zna metody czyszczenia danych
Zna metody oceny i optymalizacji jakości danych
Posiada wiedzę odnośnie monitorowania zmian jakości danych w czasie, zna metody weryfikacji zgodności
danych ze zdefiniowanymi wcześniej regułami
W zakresie umiejętności:
Potrafi samodzielnie czyścić dane
Potrafi planować oraz konfigurować usługi optymalizacji jakości danych
Potrafi monitorować zmiany jakości w czasie przy wykorzystaniu SAS Data Management Platform
Potrafi organizować procesy czyszczenia danych w oparciu o platformy SAS Data Integration Studio i SAS
Data Management Server
W zakresie kompetencji społecznych:
Ma świadomość konieczności ciągłego zdobywania wiedzy w zakresie integracji i zapewnienia jakości
danych
Treści programowe przedmiotu
W1
W2
W3
W4
W5
W6
W7
W8
W9
W10
L1
Forma zajęć – wykłady
Treści programowe
Wprowadzenie do narzędzi programowych SAS
Proces poprawy jakości danych
Profilowanie danych
Standaryzacja, parsowanie
Deduplikacja
Grupowanie obserwacji
Tworzenie i wykorzystanie reguł biznesowych
Tworzenie zadań w SAS Management Platform
Wykorzystanie parametrów
Publikacja zadań na serwerze SAS Data
Management Server
Suma godzin:
Forma zajęć – laboratoria
Treści programowe
Wprowadzenie do SAS Data Management Platform
Liczba godzin
4
2
1
2
1
1
1
1
1
1
15
Liczba godzin
3
1
L2
L3
L4
L5
L6
L7
L8
L9
L10
Proces poprawy jakości danych
Profilowanie danych
Operacje standaryzacji i parsowania
Deduplikacja danych
Grupowanie obserwacji
Tworzenie i wykorzystanie reguł biznesowych
Tworzenie zadań w SAS Management Platform
Wykorzystanie parametrów
Publikacja zadań na serwerze SAS Data
Management Server
2
2
2
1
1
1
1
1
1
Metody/Narzędzia dydaktyczne
1
2
3
Wykład z prezentacjami multimedialnymi
Ćwiczenia laboratoryjne z wykorzystaniem oprogramowania SAS Data Management Platform
Analiza i interpretacja dokumentacji technicznej SAS Data Management Platform
Sposoby oceny
F1
F2
F3
P1
P2
P3
Ocena formująca
Pytania sprawdzające poziom zrozumienia podstawowych zagadnień podczas wykładu
Dyskusja ze studentami, podczas podsumowywania materiału wykładu
Rozwiązywanie zagadnień problemowych z zakresu integracji i jakości danych
Ocena podsumowująca
Kartkówki sprawdzające znajomość zagadnień przed wykonaniem ćwiczeń laboratoryjnego
Ocena wykonania przeprowadzonych praktycznych zajęć laboratoryjnych
Dwa pisemne sprawdziany w połowie oraz na końcu prowadzonych wykładów
Obciążenie pracą studenta
Forma aktywności
Godziny kontaktowe zajęć z wykładowcą, w tym:
Udział w wykładach
Udział w laboratoriach
Godziny kontaktowe z wykładowcą, realizowane w
formie np. konsultacji w odniesieniu – łączna liczba
godzin w semestrze
Przygotowanie się do laboratorium – łączna liczba
godzin w semestrze
Przygotowanie się do zaliczenia wykładu
Suma
Sumaryczna liczba punktów ECTS dla przedmiotu, w
tym:
Średnia liczba godzin na zrealizowanie aktywności
15
15
5
15
25
75
3
Liczba punktów ECTS uzyskiwana podczas zajęć
wymagających bezpośredniego udziału wykładowcy
0,2
Liczba punktów ECTS w ramach zajęć o charakterze
praktycznym (ćwiczenia, laboratoria, projekty)
0,2
Literatura podstawowa i uzupełniająca
1
2
3
4
5
SAS Data Quality Server 9.2: Reference, Second Edition, SAS Institute, 2012
Gerhard Svolba, Data Quality for Analytics Using SAS, SAS Institute
Sunil Gupta and Curt Edmonds, Sharpening Your SAS Skills, CRC Press
2
Macierz efektów kształcenia
Efekt
kształcenia
EK 1
EK 2
EK 3
EK 4
EK 5
EK 6
EK 7
EK 8
EK 9
Odniesienie danego
efektu kształcenia
do efektów
zdefiniowanych dla
całego programu
(PEK)
[I2A_W03,
I2A_W04, I2A_W05,
I2A_U05, I2A_U12]
[I2A_W03,
I2A_W04, I2A_U08,
I2A_U17]
[I2A_W03,
I2A_W04, I2A_W07,
I2A_U11, I2A_U12,
I2A_U15]
[I2A_W03,
I2A_W04, I2A_W07,
I2A_U16, I2A_U19]
[I2A_U08, I2A_U10,
I2A_U11, I2A_U16]
[I2A_U11, I2A_U12,
I2A_U19]
[I2A_U15, I2A_U16,
I2A_U19]
[I2A_U15, I2A_U16,
I2A_U19]
[I2A_K01]
Cele
przedmiotu
Treści programowe
Metody/Narz
ędzia
dydaktyczne
Sposób oceny
[C1, C2]
[W1- -W10, L1- L10]
[1-3]
[F1,F2, P1,P2]
[C1, C2]
[W2-W6, L2-L6]
[1-3]
[F1,F2, P1,P2]
[C1, C2]
[W2-W5,L2-L5]
[1-3]
[F1-F3, P1-P3]
[C1, C2]
[W6-W10, L6-L9]
[1-3]
[F1-F3, P1-P3]
[C2, C3]
[W7-W10, L2-L9]
[1-3]
[F1, P1, P3]
[C1, C3]
[W1-W10, L2-L9]
[1-3]
[F1, P1, P3]
[C1, C2, C3]
[W2-W10,L2-L9]
[1-3]
[F2, P2]
[C2, C3]
[W7-W10, L7-L10]
[1-3]
[F2, P2]
[C2, C3]
[W9-W10, L10]
[1-3]
[F2, P1-P3]
Formy oceny – szczegóły
Na ocenę 2 (ndst)
Na ocenę 3 (dst)
Na ocenę 4 (db)
EK 1
[Nie orientuje się w
zakresie baz danych]
[Potrafi wymienić
podstawowe cechy baz
danych]
[Potrafi wymienić i
scharakteryzować
bazy danych]
EK 2
[Nie potrafi wymienić
metod czyszczenia
danych]
[Potrafi wymienić
podstawowe metody
czyszczenia danych]
[Zna wiele metod
czyszczenia danych]
[Nie ma wiedzy w
zakresie oceny i
optymalizacji jakości
danych]
[Potrafi wymienić
podstawowe metody
oceny i optymalizacji
jakości danych]
[Zna szerokie
spektrum metod oceny
i optymalizacji jakości
danych]
[Nie ma wiedzy w
zakresie monitorowania
zmian jakości danych]
[Zna podstawowe
sposoby monitorowania
zmian jakości danych]
[Zna wybrane sposoby
monitorowania zmian
jakości danych]
[Nie potrafi samodzielnie
podjąć operacji
czyszczenia danych]
[Potrafi wykonać
podstawowe, wybrane
operacje z zakresu
czyszczenia danych]
[Potrafi zaplanować i
przeprowadzić
kompleksową usługę
czyszczenia danych]
EK 3
EK 4
EK 5
Na ocenę 5 (bdb)
[Potrafi wymienić i
wyczerpująco
scharakteryzować różne
typy baz danych, widzi
możliwość ich
optymalizacji]
[Zna metody
czyszczenia danych i
potrafi wartościować ich
cechy pod kątem
własności]
[Posiada dobrą
znajomość metod oceny
i optymalizacji jakości
danych, rozwiązuje
samodzielnie problemy
doboru odpowiednich
narzędzi ]
[Posiada dobrą
znajomość sposobów
monitorowania zmian
jakości danych, zna
metody weryfikacji
zgodności danych ze
zdefiniowanymi
wcześniej regułami]
Potrafi zaplanować i
przeprowadzić
kompleksową usługę
czyszczenia danych,
potrafi ocenić
zagrożenia wynikające z
3
[Nie potrafi zaplanować i
skonfigurować usług
optymalizacji jakości
danych]
[Potrafi zaplanować i
skonfigurować
podstawowe usługi
optymalizacji jakości
danych]
[Potrafi zaplanować i
skonfigurować usługi
optymalizacji jakości
danych]
[Nie potrafi monitorować
zmian jakości danych]
[Potrafi monitorować
wybrane parametry
identyfikujące zmiany
jakości danych]
[Potrafi monitorować
kilka parametrów
identyfikujących
zmiany jakości
danych]
[Nie umie organizować
procesów czyszczenia
baz danych]
[Potrafi przeprowadzić
wybrane procesy
czyszczenia baz
danych]
[Potrafi przeprowadzić
wielopłaszczyznowe
procesy czyszczenia
baz danych]
[Nie przygotowuje się do
zajęć, nie wykorzystuje
dodatkowych źródeł
informacji]
[Przygotowuje się do
zajęć w stopniu
umożliwiającym
wykonanie
podstawowych zadań]
[Przygotowuje się do
zajęć w stopniu
umożliwiającym
wykonania zadań
podstawowych i
dodatkowych]
EK 6
EK 7
EK 8
EK 9
Autor programu:
Adres e-mail:
Jednostka
organizacyjna:
zaniedbań w tym
obszarze i podjąć
działania
zapobiegawcze]
[Potrafi zaplanować i
skonfigurować usługi
oceny i optymalizacji
jakości danych, z
uwzględnieniem
przypadków
wymagających
samodzielnego
oprogramowania
zadania]
[Potrafi kompleksowo
monitorować parametry
identyfikujące zmiany
jakości danych,
samodzielnie pogłębia
wiedzę z zasobów
zewnętrznych]
[Potrafi przeprowadzić
kompleksowo procesy
czyszczenia baz
danych, potrafi
reagować na zmienne
parametry wejściowe
analizowanych
przypadków]
[Bardzo dobrze
przygotowuje się do
zajęć, wyszukuje i
korzysta z zasobów
dodatkowych, odnośnie
poruszanej tematyki]
dr inż. Wojciech Surtel
[email protected]
Instytut Elektroniki i Technik Informacyjnych, Politechnika Lubelska
4