Frakcję dla dziecka
Transkrypt
Frakcję dla dziecka
Prawdopodobieństwo:
formalizm matematyczny
Działania na zbiorach
i własności prawdopodobieństwa
• A, B, C – zdarzenia losowe
A B
A B
• P(A) – prawdopodobieństwo zdarzenia E
• 0≤P(A)≤1
A B = P(A B) = P(A) P(B)
• S – przestrzeń probabilistyczna (zbiór wszystkich
możliwych wyników eksperymentu-zdarzeń
elementarnych)
• P(S)=
?
Diagramy Venna
S
B
A
A\ B
B\ A
A B
A B
Prawdopodobieństwo klasyczne
• Założenie – wszystkie możliwe elementarne
wyniki eksperymentu są jednakowo
prawdopodobne (np. prawdopodobieństwo
wylosowania każdego studenta jest takie samo).
• N – liczba możliwych wyników eksperymentu
(Tu N=
?)
• x – liczba tych wyników , które
spełniają/sprzyjają zdarzeniu E
(Tu E= „Dostał/a 5.0 z egzaminu”, x=
?)
• P(E)=x/N
(Tu P(E)=
?)
• W praktyce prawdopodobieństwo często
ustalamy jako częstość/proporcję grupy
posiadającą interesującą nas własność.
• Przykład: Na 45-ciu studentów 15-tu dostało 5.0
z egzaminu. Jakie jest prawdopodobieństwo, że
losując studenta z tej grupy trafimy na takiego,
który dostał 5.0 z egzaminu?
Interpretacja częstościowa
prawdopodobieństwa
• Gdy liczba niezależnych powtórzeń
eksperymentu dąży do nieskończoności to
względna częstość występowania
zdarzenia E dąży do P(E).
Przykłady zdarzeń
• E = „wyrzucenie orła w rzucie symetryczną
monetą”: P(E) =
• E = „wyrzucenie 4 w rzucie symetryczną
kostką”: P(E) =
• E = „otrzymam 1 lub 6 w rzucie kostką”:
P(E) =
• Ania i Basia rzucają monetą. E = obie dostaną orła.
P(E) =
• Uzasadnienie
A dostanie O i B dostanie O
A dostanie O i B dostanie R
A dostanie R i B dostanie O
A dostanie R i B dostanie R
Te cztery zdarzenia są jednakowo prawdopodobne
(P(E)=P(OO)=P(OR)=P(RO)=P(RR)=
?)
Prawdopodobieństwo, że dostaniemy dokładnie jednego
orła (Ania albo Basia) =
Niezależność
• Krzyżówka dwóch heterozygot
• Genotyp obu rodziców : Aa
• Dzieci: P(AA) =
? Pr(Aa albo aA) =
P(aa) =
?
Definicja: Zdarzenia A i B są niezależne, gdy
?
• Jeżeli liczba dzieci będzie bardzo duża to frakcja
heterozygot będzie bliska
?
• Przypomnienie: frakcja w próbie aproksymuje
frakcję w populacji.
P ( A B ) = P ( A) P ( B)
• Przykład: Rozważmy dwa rzuty monetą.
A=otrzymano orła w pierwszym rzucie
B=otrzymano orła w drugim rzucie
• P(dwa orły) =
?
Prawdopodobieństwo warunkowe
Zdarzenie
0.5
0.5
0.5
O
OO
P-stwo
P(A|B) – prawdopodobieństwo zajścia zdarzenia A pod
warunkiem, że zajdzie zdarzenie B.
Definicja matematyczna:
O
0.5
R
OR
0.5
O
RO
0.5
O
R
RR
P( A B)
P( B)
P( A B) = P( B) P ( A | B )
P( A | B) =
Przykład:
• Przypuśćmy, że 2% populacji zarażone jest
wirusem HIV, a test do wykrywania obecności
wirusa HIV ma następujące własności:
Jeżeli się ma HIV, to prawdopodobieństwo
jego wykrycia wynosi 0.997 (prawdziwy
dodatni wynik testu).
Gdy się nie ma HIV, to prawdopodobieństwo
właściwej diagnozy wynosi 0.985 (prawdziwy
ujemny wynik testu).
Zdarzenie
Test +
•
•
•
•
•
•
•
A – wybrany losowo człowiek jest chory
B – test wykazuje obecność wirusa
P(A)=
P(B|A)=
A’- wybrany losowo człowiek jest zdrowy
B’-test nie wykazuje obecności wirusa
P(B’|A’)=
P-stwo
Prawdziwy +
HIV +
Test -
Fałszywy -
Test +
Fałszywy +
• Jakie jest p-stwo, że u losowo
wybranej osoby test wykaże
obecność wirusa ?
HIV –
Test -
Prawdziwy -
Wzór Bayesa
• Jakie jest p-stwo, ze osoba u której test
wskazał obecność wirusa jest faktycznie
zakażona?
P( A | B) =
P( B | A) P ( A)
P( B)
Zdarzenie
Wpływ rozkładu a priori.
30% ludzi ma HIV,
test do wykrywania HIV ma czułość 99.7% i specyficzność
98.5% (jak przedtem).
Prawdziwy +
Test -
Fałszywy -
Test +
Fałszywy +
HIV +
Załóżmy teraz, że w pewnej populacji:
Test +
P-stwo
Jakie jest prawdopodobieństwo, że osoba z dodatnim wynikiem
testu ma HIV?
HIV –
Test -
P-stwo, że osoba z dodatnim wynikiem testu
jest (faktycznie) chora wynosi:
Prawdziwy -
Zmienna losowa:
Wartość zależna od wyniku eksperymentu.
P ( HIV i test )
P ( HIV | test ) =
P (test )
Zmienna losowa dyskretna
Przykład: Liczba orłów uzyskanych w jednym rzucie monetą.
Ciągła zmienna losowa
Zbiór wartości, które może przyjąć zmienna losowa dyskretna
jest skończony lub przeliczalny. Możliwe wartości będziemy
oznaczali x1,x2, …
Prawdopodobieństwo przyjęcia każdej ustalonej wartości
wynosi zero, np. P(X=3.14159265358979323)=0
Rozkład zmiennej dyskretnej X określamy podając
prawdopodobieństwa pi=P(X=xi).
Na tym kursie będziemy rozważać tylko zmienne losowe
ciągłe opisane funkcją gęstości f(x).
Np. w rzucie symetryczną kostką liczba oczek X ma rozkład
P(X=i)=
, i=1,...6.
Dystrybuanta zmiennej X:
Dla liczby
Narysuj dystrybuantę dyskretnej zmiennej losowej
X takiej, że P(X=0)=1/3 oraz P(X=1)=2/3.
x definiujemy
FX ( x) = P( X x)
Własności: FX(x) jest funkcją niemalejącą, ciągłą
z prawej strony, oraz
lim x - F ( x) =
lim x F ( x) =
Wartość oczekiwana i wariancja (wzory).
Narysuj dystrybuantę rozkładu jednostajnego na
odcinku [a,b].
Zmienna losowa dyskretna
x
•
:=E(X)= xi P(X= xi)=xipi
Var(X)= (xi- x)2 P(X= xi) = xi2 pi - x2
Przykład 1 (rzut monetą, X=1, gdy orzeł, X=0, gdy
reszka)
E(X)=
Var(X)=
Przykład 2 (X=wynik rzutu kostką)
E(X)=
Var(X)=
Wartość oczekiwana i wariancja, cd.
0 p 1
Rozkład dwupunktowy z parametrem
P(Y=1)=p, P(Y=0)=1-p.
Zmienna losowa ciągła
EX = x f(x) dx
-
Oblicz:
EY=
VarY=
2
Var(X) = (x - EX) f(x) dx = x 2 f(x)dx - (EX) 2
-
-
Wartość oczekiwana jest środkiem ciężkości figury określonej
przez krzywą gęstości.
Własności wartości oczekiwanej i wariancji
Przykład: rozkład jednostajny na [0,1].
Dla dwóch zmiennych losowych X i Y:
E(X+Y)=EX+EY
E(aX+b)=aEX+b
E(X-Y)=EX-EY
Var(aX+b)=a2Var(X)
E(aX+bY+c)=
Niezależność zmiennych losowych:
Niezależność zmiennych losowych, cd.
Jeżeli zmienne X i Y są niezależne to dla każdej pary
zdarzeń A i B
Przykład 2: Wybieramy (losowo) liczbę z zakresu 12,...,101;
X:=cyfra dziesiątek, Y:=cyfra jedności, A={1, 2}, B={3, 4, 5}.
P( X A, Y B) = P( X A) P(Y B)
Przykład 3: Liczby oczek, X, Y, w dwóch kolejnych rzutach
kostką.
Przykład1: Wybieramy (losowo) liczbę dwucyfrową;
X:=liczba dziesiątek, Y:=liczba jedności, A={1, 2},
B={3, 4, 5}.
Jeżeli X i Y są niezależne, to
E(XY)=E(X)·E(Y)
Ćwiczenia: X i Y niezależne
Var(X-Y)=
i
Var(X+Y)=Var(X)+Var(Y).
Var(X+X)=
Schemat Bernoulliego
i rozkład dwumianowy
Rozkład dwumianowy (n=3,p=0.5)
Anita, Beata i Krystyna rzucają monetą i podają łączną
liczbę orłów,Y. Podaj rozkład zmiennej Y
A
B
K
O
O
O
O
R
R
R
R
O
O
R
R
O
O
R
R
O
R
O
R
O
R
O
R
P-stwo
Zdarzenie P-stwo
3O (0R)
2O (1R)
1O (2R)
0O (3R)
Schemat Bernoulliego:
n niezależnych powtórzeń tego samego eksperymentu
dwa możliwe wyniki w każdej próbie - ``sukces’’ i
``porażka’’ (np. O i R, albo 1 i 0)
w każdej próbie p-stwo sukcesu wynosi p
Rozkład dwumianowy:
Y
= łączna liczba sukcesów w schemacie Bernoulliego
Przykłady: liczba orłów na 5 rzutów, liczba wyzdrowień wśród
10 pacjentów poddanych pewnej kuracji
Pr(Y=y)
Histogram rozkładu w populacji.
Populacja =”wszystkie” rzuty trzema monetami
0,4
0,3
0,2
0,1
0
0
1
2
y
Rozkład dwumianowy:
ænö
P(Y = y ) = p y (1 - p) n- y ,
y
ænö
n!
gdzie =
,
y y!(n - y )!
y = 0,1,..., n
3
ænö
Niektóre własności symbolu Newtona
y
Liczba możliwych ciągów y sukcesów i n-y porażek
ænö
=
0
ænö
=
1
Ogólnie
ænö
=
n
æn ö
=
n - 1
W przykładzie p=1/2;
æ 3ö
=
0
æ3ö
=
1
æ 3ö
=
2
æ 3ö
=
3
P (Y = 0) =
P (Y = 1) =
P (Y = 2) =
P (Y = 3) =
Uwaga: Rozkład dwumianowy jest symetryczny dla p=1/2.
ænö æn
ö
y = n- y
Odpowiedź:
Przykład: Efekt uboczny lekarstwa
20% ludzi dostaje nudności po zażyciu pewnego lekarstwa
Lekarz przepisał lekarstwo czterem nowym pacjentom
Y – liczba pacjentów w naszej próbie, którzy dostali nudności
Podaj rozkład zmiennej Y
Parametry rozkładu dwumianowego
P(co najmniej dwóch dostanie nudności) =
P(co najwyżej jeden dostanie nudności) =
EY
= np
Var
Y=np(1-p)