Cwiczenia24.11.2014

Transkrypt

Cwiczenia24.11.2014
Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa"
Zadanie 1
W magazynie są elementy pochodzące z dwóch różnych fabryk, nazwijmy te fabryki I i II.
Elementy są klasyfikowane jako dobre i wadliwe.
Oznaczmy przez:
- zdarzenie: wybrany w sposób losowy element jest dobry, A
- zdarzenie: wybrany w sposób losowy element jest wadliwy, A
- zdarzenie: wybrany w sposób losowy element pochodzi z fabryki I, B
- zdarzenie: wybrany w sposób losowy element pochodzi z fabryki II. B
Liczby elementów odpowiadające poszczególnym zdarzeniom podane są w tabeli:
Zadanie 2
W ciągu 1000 dni przeprowadzono obserwacje meteorologiczne dotyczące siły wiatru i
ciśnienia atmosferycznego.
Oznaczmy przez:
- A zdarzenie: siła wiatru < 5 m/s,
- A zdarzenie: siła wiatru ≥ 5 m/s,
- B zdarzenie: ciśnienie atmosferyczne < 1020 milibarów,
- B zdarzenie: ciśnienie atmosferyczne ≥ 1020 milibarów.
Zaobserwowano następujące liczby zdarzeń:
Przyjmując częstości atmosferyczne jako prawdopodobieństwa obliczyć:
oraz odpowiedzieć na pytanie czy zdarzenia A i B są niezależne
Zadanie 3
W partii rur liczącej 1000 sztuk jest 200 rur stożkowych, 150 eliptycznych, 50 eliptycznych i
stożkowych, 600 rur nie ma wad (rury
walcowe).
Oznaczmy przez:
- S zdarzenie: wybrana w sposób losowy rura jest stożkowa,
Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa"
- L zdarzenie: wybrana w sposób losowy rura jest eliptyczna.
Obliczyć prawdopodobieństwa: P(S) , P(L) , P(S L) , P(S | L) . Czy zdarzenia S oraz L są
niezależne?
Zadanie 4
Prawdopodobieństwem przekazania sygnału przez jeden przekaźnik jest p  0.9 . Działają
niezależnie dwa przekaźniki (tzn. działanie
jednego z nich nie ma wpływu na zadziałanie drugiego). Obliczyć prawdopodobieństwo
przekazania sygnału:
- przy połączeniu szeregowym dwóch przekaźników (muszą działać oba przekaźniki),
- przy połączeniu równoległym (wystarczy, aby jeden z przekaźników działał).
Oznaczmy przez:
- A zdarzenie: sygnał został przekazany przez przekaźnik pierwszy,
- B zdarzenie: sygnał został przekazany przez przekaźnik drugi.
Zadanie 5
Na pierwszym roku studiów pewnego wydziału są słuchacze pochodzący z trzech grup:
- grupa 1 - duże miasta,
- grupa 2 - małe i średnie miasta,
- grupa 3 - wieś.
Liczebności słuchaczy z odpowiednich grup są równe odpowiednio: 50, 40, 30.
Prawdopodobieństwa terminowego ukończenia studiów dla słuchaczy odpowiednich grup są
równe odpowiednio: 0.3, 0.4, 0.5. Z rozważanego zespołu 120 osób wybrano w losowy
sposób studenta.
Obliczyć:
a) prawdopodobieństwo Pa tego, że pochodzi on z grupy 1,
b) prawdopodobieństwo Pb tego, że ukończy on terminowo studia,
c) prawdopodobieństwo warunkowe Pc tego, że pochodzi on z grupy 1, jeżeli stwierdzono
(tzn. przy warunku), że ukończył on terminowo studia,
d) prawdopodobieństwo warunkowe Pd tego, że pochodzi z grupy 2, jeżeli stwierdzono, że
nie ukończył on studiów terminowo.
Zadanie 6
W magazynie fabryki są amperomierze pochodzące z trzech taśm produkcyjnych, przy czym
liczby amperomierzy z każdej taśmy są takie same.
Wiadomo, że dostawy z pierwszej taśmy zawierają 0.5% braków, z drugiej – 0.7% braków, z
trzeciej – 1% braków. Zbadać dwie sytuacje:
a) wybrany w sposób losowy amperomierz okazał się brakiem. Obliczyć
prawdopodobieństwo tego, że został on wyprodukowany na taśmie drugiej,
b) wybrany w sposób losowy amperomierz okazał się dobry. Obliczyć prawdopodobieństwo
tego, że został on wyprodukowany na taśmie trzeciej.
Zadanie 7
Wiadomo, że 5% studentów (grupa 1) umie odpowiedzieć na wszystkie pytania
egzaminacyjne, 30% (grupa 2) umie odpowiedzieć na 70% pytań, 40% (grupa 3) umie
odpowiedzieć na 60% pytań, a 25% (grupa 4) umie odpowiedzieć tylko na 50% pytań.
Z zespołu tego wybrano w sposób losowy studenta.
Obliczyć:
a) prawdopodobieństwo tego, że wybrany student odpowie na zadane pytanie,
Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa"
b) prawdopodobieństwo warunkowe tego, że należy on do grupy 2, jeżeli stwierdzono (tzn.
przy warunku), że odpowiedział on na zadane pytanie.
Zadanie 8
Rozważmy poniższą dziedzinę modeli samochodów:
klasa: atrybutu porządkowy o wartościach- miejski, mały, kompakt, duży
niezawodność: atrybutu porządkowy o wartościach: mała, przeciętna, duża.
cena: atrybut porządkowy o wartościach: niska, umiarkowana, wysoka.
osiągi: atrybut porządkowy o wartościach słabe, przeciętne, dobre.
Wskaż, która z hipotez dopuszczalnych dla tej dziedziny jest hipotezą najbardziej prawdopodobną a
posteriori na podstawie danych trenujących przedstawionych w poniższej tablicy:
x
Klasa
Cena
Osiągi
Niezawodność
12
Mały
Umiarkowana
Mała
13
Miejski
Dobre
Duża
14
Kompakt
Umiarkowana
Dobre
Duża
15
Duży
Umiarkowana
Słabe
przeciętna
przy założeniu, że dane te są w pełni poprawne, a prawodopodobieństwa a priori:
a ) są jednakowe dla wszystkich hipotez
b) są określone tak, że dla dowolnych hipotez h1, h2 i przykładu x, jeśli mamy niezawodność(x)= duża,
h1(x)=1, h2(x)=0, to Pr (h1) > Pr (h2),
c) są określone tak, że dla dowolnych hipotez h1, h2 i przykładu x, jeśli mamy klasa (x)= miejski,
h1(x)=1, i h2(x)=0, to Pr (h1) < Pr (h2),
Zadanie 9
Dla dziedziny modeli samochodów z zadania 8 weźmy pod uwagę hipotezy zdefiniowane
następująco:

1 jesli niezawodnosc ( x ) ≠ duża
h1 ( x ) = 
 0 wprzeciwnym przypadku ,

1 jesli cena( x ) ≠ wysoka
h2 ( x ) = 
 0 wprzeciwnym przypadku,

1 jesli niezawodnosc( x ) ≠ duza i cena ( x ) ≠ wysoka
h3 ( x ) = 
 0 wprzeciwnym przypadku,
Znajdź najbardziej prawdopodobną a posteriori z tych hipotez na podstawie zbioru
trenującego podanego w tablicy z zadania 8 przyjmując, że każdy zawarty w nim przykład
może mieć z prawdopodobieństwem 0, 1 niepoprawną etykietę kategorii oraz, że ich
prawdopodobieństwo a priori wynoszą odpowiednio 0.4, 0, 3 i 0.1.
Zadanie 10
Zastosuj naiwny klasyfikator bayesowski z prawdopodobieństwami szacowanymi przez mszacowanie na podstawie zbioru trenującego dla dziedziny modeli samochodów
przedstawionego w tablicy zadania 8 do klasyfikacji następujących przykładów:
x
12
13
14
15
Klasa
Mały
Miejski
Kompakt
Duży
Cena
Umiarkowana
Umiarkowana
Umiarkowana
Osiągi
Dobre
Dobre
Słabe
Niezawodność
Mała
Duża
Duża
przeciętna
Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa"
Zadanie 11
Udowodnij, że jeśli pominiemy różnice w kosztach pomyłek, czyli przyjmiemy dla
dowolnych d1, d2 ∈C:

 0 jesli d1 = d 2
p (d1 , d 2 ) = 
1 jesli d1 ≠ d 2
to wersja naiwnego klasyfikatora bayesowskiego uwzględniająca koszty pomyłek staje się
równoważna z jego wersją podstawową.
Zadanie 12
Powtórz zadanie 10, uwzględniając koszty pomyłek: ρ(1, 0)=0,7 i ρ(0,1)= 0,3.
Zadanie 13
Oblicz długość kodu dla drzewa decyzyjnego z przykładu (3.1) [materiały od
prowadzącego]
Zadanie 14
Oblicz długość kodu zbioru reguł z przykładu (4.3) [materiały od prowadzącego]
Zadanie 15
Oblicz długość kodu dla zbioru trenującego dla dziedziny stanów pogody przedstawionego w
tabl. 2.2 [materiały od prowadzącego] przy następujących założeniach:
1) nie jest znana żadna hipoteza
2) znane jest drzewo decyzyjne podane w przykładzie 3.1
3) znany jest zbiór reguł podany w przykładzie 4.3 [materiały od prowadzącego]
Dla każdego przypadku podaj łączną długość kodu dla danych i hipotezy, jeśli jest dostępna.
Zadanie 16
Dokonaj wyboru testu do umieszczenia w korzeniu drzew decyzyjnego budowanego na
podstawie zbioru trenującego dla dziedziny stanów pogody przedstawionego w tablicy 2.2
[materiały od prowadzącego], wykorzystując do oceny testów zasadę minimalnej długości
kodu.
Zadanie 17
Podaj ocenie za pomocą zasady minimalnej długości kodu następujące kompleksy dla
dziedziny stanów pogody względem zbioru trenującego przedstawionego w tabl.2.2
[materiały od prowadzącego]
k1 = sloneczna ∨ pochmurna , ?, ?, ?
k 2 = sloneczna ∨ pochmurna , ciepla, ?, ?
k 3 = sloneczna ∨ pochmurna , ?, ?, silny