Cwiczenia24.11.2014
Transkrypt
Cwiczenia24.11.2014
Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa" Zadanie 1 W magazynie są elementy pochodzące z dwóch różnych fabryk, nazwijmy te fabryki I i II. Elementy są klasyfikowane jako dobre i wadliwe. Oznaczmy przez: - zdarzenie: wybrany w sposób losowy element jest dobry, A - zdarzenie: wybrany w sposób losowy element jest wadliwy, A - zdarzenie: wybrany w sposób losowy element pochodzi z fabryki I, B - zdarzenie: wybrany w sposób losowy element pochodzi z fabryki II. B Liczby elementów odpowiadające poszczególnym zdarzeniom podane są w tabeli: Zadanie 2 W ciągu 1000 dni przeprowadzono obserwacje meteorologiczne dotyczące siły wiatru i ciśnienia atmosferycznego. Oznaczmy przez: - A zdarzenie: siła wiatru < 5 m/s, - A zdarzenie: siła wiatru ≥ 5 m/s, - B zdarzenie: ciśnienie atmosferyczne < 1020 milibarów, - B zdarzenie: ciśnienie atmosferyczne ≥ 1020 milibarów. Zaobserwowano następujące liczby zdarzeń: Przyjmując częstości atmosferyczne jako prawdopodobieństwa obliczyć: oraz odpowiedzieć na pytanie czy zdarzenia A i B są niezależne Zadanie 3 W partii rur liczącej 1000 sztuk jest 200 rur stożkowych, 150 eliptycznych, 50 eliptycznych i stożkowych, 600 rur nie ma wad (rury walcowe). Oznaczmy przez: - S zdarzenie: wybrana w sposób losowy rura jest stożkowa, Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa" - L zdarzenie: wybrana w sposób losowy rura jest eliptyczna. Obliczyć prawdopodobieństwa: P(S) , P(L) , P(S L) , P(S | L) . Czy zdarzenia S oraz L są niezależne? Zadanie 4 Prawdopodobieństwem przekazania sygnału przez jeden przekaźnik jest p 0.9 . Działają niezależnie dwa przekaźniki (tzn. działanie jednego z nich nie ma wpływu na zadziałanie drugiego). Obliczyć prawdopodobieństwo przekazania sygnału: - przy połączeniu szeregowym dwóch przekaźników (muszą działać oba przekaźniki), - przy połączeniu równoległym (wystarczy, aby jeden z przekaźników działał). Oznaczmy przez: - A zdarzenie: sygnał został przekazany przez przekaźnik pierwszy, - B zdarzenie: sygnał został przekazany przez przekaźnik drugi. Zadanie 5 Na pierwszym roku studiów pewnego wydziału są słuchacze pochodzący z trzech grup: - grupa 1 - duże miasta, - grupa 2 - małe i średnie miasta, - grupa 3 - wieś. Liczebności słuchaczy z odpowiednich grup są równe odpowiednio: 50, 40, 30. Prawdopodobieństwa terminowego ukończenia studiów dla słuchaczy odpowiednich grup są równe odpowiednio: 0.3, 0.4, 0.5. Z rozważanego zespołu 120 osób wybrano w losowy sposób studenta. Obliczyć: a) prawdopodobieństwo Pa tego, że pochodzi on z grupy 1, b) prawdopodobieństwo Pb tego, że ukończy on terminowo studia, c) prawdopodobieństwo warunkowe Pc tego, że pochodzi on z grupy 1, jeżeli stwierdzono (tzn. przy warunku), że ukończył on terminowo studia, d) prawdopodobieństwo warunkowe Pd tego, że pochodzi z grupy 2, jeżeli stwierdzono, że nie ukończył on studiów terminowo. Zadanie 6 W magazynie fabryki są amperomierze pochodzące z trzech taśm produkcyjnych, przy czym liczby amperomierzy z każdej taśmy są takie same. Wiadomo, że dostawy z pierwszej taśmy zawierają 0.5% braków, z drugiej – 0.7% braków, z trzeciej – 1% braków. Zbadać dwie sytuacje: a) wybrany w sposób losowy amperomierz okazał się brakiem. Obliczyć prawdopodobieństwo tego, że został on wyprodukowany na taśmie drugiej, b) wybrany w sposób losowy amperomierz okazał się dobry. Obliczyć prawdopodobieństwo tego, że został on wyprodukowany na taśmie trzeciej. Zadanie 7 Wiadomo, że 5% studentów (grupa 1) umie odpowiedzieć na wszystkie pytania egzaminacyjne, 30% (grupa 2) umie odpowiedzieć na 70% pytań, 40% (grupa 3) umie odpowiedzieć na 60% pytań, a 25% (grupa 4) umie odpowiedzieć tylko na 50% pytań. Z zespołu tego wybrano w sposób losowy studenta. Obliczyć: a) prawdopodobieństwo tego, że wybrany student odpowie na zadane pytanie, Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa" b) prawdopodobieństwo warunkowe tego, że należy on do grupy 2, jeżeli stwierdzono (tzn. przy warunku), że odpowiedział on na zadane pytanie. Zadanie 8 Rozważmy poniższą dziedzinę modeli samochodów: klasa: atrybutu porządkowy o wartościach- miejski, mały, kompakt, duży niezawodność: atrybutu porządkowy o wartościach: mała, przeciętna, duża. cena: atrybut porządkowy o wartościach: niska, umiarkowana, wysoka. osiągi: atrybut porządkowy o wartościach słabe, przeciętne, dobre. Wskaż, która z hipotez dopuszczalnych dla tej dziedziny jest hipotezą najbardziej prawdopodobną a posteriori na podstawie danych trenujących przedstawionych w poniższej tablicy: x Klasa Cena Osiągi Niezawodność 12 Mały Umiarkowana Mała 13 Miejski Dobre Duża 14 Kompakt Umiarkowana Dobre Duża 15 Duży Umiarkowana Słabe przeciętna przy założeniu, że dane te są w pełni poprawne, a prawodopodobieństwa a priori: a ) są jednakowe dla wszystkich hipotez b) są określone tak, że dla dowolnych hipotez h1, h2 i przykładu x, jeśli mamy niezawodność(x)= duża, h1(x)=1, h2(x)=0, to Pr (h1) > Pr (h2), c) są określone tak, że dla dowolnych hipotez h1, h2 i przykładu x, jeśli mamy klasa (x)= miejski, h1(x)=1, i h2(x)=0, to Pr (h1) < Pr (h2), Zadanie 9 Dla dziedziny modeli samochodów z zadania 8 weźmy pod uwagę hipotezy zdefiniowane następująco: 1 jesli niezawodnosc ( x ) ≠ duża h1 ( x ) = 0 wprzeciwnym przypadku , 1 jesli cena( x ) ≠ wysoka h2 ( x ) = 0 wprzeciwnym przypadku, 1 jesli niezawodnosc( x ) ≠ duza i cena ( x ) ≠ wysoka h3 ( x ) = 0 wprzeciwnym przypadku, Znajdź najbardziej prawdopodobną a posteriori z tych hipotez na podstawie zbioru trenującego podanego w tablicy z zadania 8 przyjmując, że każdy zawarty w nim przykład może mieć z prawdopodobieństwem 0, 1 niepoprawną etykietę kategorii oraz, że ich prawdopodobieństwo a priori wynoszą odpowiednio 0.4, 0, 3 i 0.1. Zadanie 10 Zastosuj naiwny klasyfikator bayesowski z prawdopodobieństwami szacowanymi przez mszacowanie na podstawie zbioru trenującego dla dziedziny modeli samochodów przedstawionego w tablicy zadania 8 do klasyfikacji następujących przykładów: x 12 13 14 15 Klasa Mały Miejski Kompakt Duży Cena Umiarkowana Umiarkowana Umiarkowana Osiągi Dobre Dobre Słabe Niezawodność Mała Duża Duża przeciętna Systemy Wspomagania Decyzji- "Decyzje zależne, Twierdzenie Bayessa" Zadanie 11 Udowodnij, że jeśli pominiemy różnice w kosztach pomyłek, czyli przyjmiemy dla dowolnych d1, d2 ∈C: 0 jesli d1 = d 2 p (d1 , d 2 ) = 1 jesli d1 ≠ d 2 to wersja naiwnego klasyfikatora bayesowskiego uwzględniająca koszty pomyłek staje się równoważna z jego wersją podstawową. Zadanie 12 Powtórz zadanie 10, uwzględniając koszty pomyłek: ρ(1, 0)=0,7 i ρ(0,1)= 0,3. Zadanie 13 Oblicz długość kodu dla drzewa decyzyjnego z przykładu (3.1) [materiały od prowadzącego] Zadanie 14 Oblicz długość kodu zbioru reguł z przykładu (4.3) [materiały od prowadzącego] Zadanie 15 Oblicz długość kodu dla zbioru trenującego dla dziedziny stanów pogody przedstawionego w tabl. 2.2 [materiały od prowadzącego] przy następujących założeniach: 1) nie jest znana żadna hipoteza 2) znane jest drzewo decyzyjne podane w przykładzie 3.1 3) znany jest zbiór reguł podany w przykładzie 4.3 [materiały od prowadzącego] Dla każdego przypadku podaj łączną długość kodu dla danych i hipotezy, jeśli jest dostępna. Zadanie 16 Dokonaj wyboru testu do umieszczenia w korzeniu drzew decyzyjnego budowanego na podstawie zbioru trenującego dla dziedziny stanów pogody przedstawionego w tablicy 2.2 [materiały od prowadzącego], wykorzystując do oceny testów zasadę minimalnej długości kodu. Zadanie 17 Podaj ocenie za pomocą zasady minimalnej długości kodu następujące kompleksy dla dziedziny stanów pogody względem zbioru trenującego przedstawionego w tabl.2.2 [materiały od prowadzącego] k1 = sloneczna ∨ pochmurna , ?, ?, ? k 2 = sloneczna ∨ pochmurna , ciepla, ?, ? k 3 = sloneczna ∨ pochmurna , ?, ?, silny