dx generacji
Transkrypt
dx generacji
Rozkłady wielu zmiennych
Uogólnienie pojęć na rozkład wielu zmiennych
Dystrybuanta, gęstość prawdopodobieństwa,
rozkład brzegowy, wartości średnie i odchylenia
standardowe, momenty
Notacja macierzowa
Macierz kowariancji
■ Zamiana zmiennych
■ Transformacja gęstości prawdopodobieństwa
■ Transformacje liniowe
■ Propagacja błędów
■ Transformacje ortogonalne
■
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
1
Rozkłady wielu zmiennych
■
Dystrybuanta
F x 1 ,x 2 , . . . ,x n =P X 1 <x 1 ,X 2 <x 2 , . . . ,X n <x n
■
Gęstość prawdopodobieństwa
n
f x 1 ,x 2 ,. . . ,x n =
■
∂
F x 1 ,x 2 ,. . . ,x n
∂ x1 ∂ x 2 . . . ∂ x n
Gęstość rokładu brzegowego
g r x r =∫ ...∫ f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx r−1 dx r+1 ... dx n
to gęstość prawdopodobieństwa zmiennej xr
■ Podobnie mamy wartość oczekiwaną:
E { H X 1 ,X 2 ,... ,X n }=∫ ...∫ H x 1 ,x 2 ,... ,x n f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx n
■
W szczególności dla H(x)=xr
E { x r }=∫ ...∫ x r f x 1 ,x 2 ,... ,x n dx 1 dx 2 ... dx n=∫ x r g r x r dx r
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
2
Niezależność. Łączne rozkłady brzegowe
■
Podobnie jak w przypadku dwuwymiarowym, dla
niezależności zmiennych musi być spełniony
warunek:
f x 1 ,x 2 , . . . ,x n =g 1 x 1 g 2 x 2 . . . g n x n
■
Definiujemy też łączną gęstość brzegową dla
dowolnych l spośród n zmiennych:
g
■
x 1 ,x , . . . ,x
2
l
=∫ . . .∫ f x 1 ,x 2 , . . . ,x n dx l+ 1 . . . dx n
Zmienne X1, ..., Xl są niezależne, gdy:
g x 1 ,x 2 , . . . ,x l =g 1 x 1 g 2 x 2 . . . g l x l
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
3
Momenty. Wariancje.
■
Momentami rzędu l1, l2, ..., ln nazywamy wartości
oczekiwane funkcji:
l1
l2
ln
H=x 1 x 2 .. . x n
i oznaczamy je symbolami
λl
■
W szczególności
100...0 =E { X 1 }= x 1
■
l1
1
l ...l
2
n
ln
010...0=E { X 2 }= x 2 ...
=E
1l ...l
2
n
{ X
1
1− x
000...1 =E { X n }=x n
l1
X 2− x 2
l2
. . . X n− x n
ln
}
Co pozwala na zapis wariancji:
μ 200 . . . 0 =E { X 1− x 1 } =σ 2 X 1
■
l2
Momenty względem wartości średnich to:
μl
■
=E { X 1 X 2 . . . X n }
μ 020 . . . 0 =E { X 2 − x 2 } =σ 2 X 2 . . .
Oraz kowariancji między zmiennymi i i j:
c ij =cov X i ,X
j
=E { X i − x i X j − x j }
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
4
Notacja macierzowa
■
Naturalną reprezentacją dla n zmiennych x1, x2, ...,
xn jest wektor x w przestrzeni n-wymiarowej.
Możemy przedstawić wszelkie wielkości w notacji
wektorowej:
F=F x
- dystrybuanta
∂n
f x =
F x
∂ x1 ∂ x 2 . . . ∂ x n
- gęstość prawdopodobieństwa
E { H x }=∫ H x f x d x
- wartość oczekiwana
E X = x
- wartość średnia
x T = x 1 ,x 2 ,. . . ,x n
x1
x
x= 2
⋮
xn
- notacja macierzowa
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
5
Macierz kowariancji
■
Szczególne znaczenie dla dalszych rozważań ma
tzw. macierz kowariancji
c 11 c 12 ... c 1 n
c
c
... c 2 n
C= 21 22
⋮
c n1 c n2 ... c nn
gdzie cij to kowariancja zmiennych i i j.
■ Elementy diagonalne to wariancje cii=σ2(xi)
■ Macierz jest symetryczna: cij = cji
■ W notacji macierzowej możemy napisać:
C=E { X −
x X −
x
T
}
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
6
Zamiana zmiennych
Dowolna funkcja zmiennej losowej X, Y=Y(X), jest
również zmienną losową. Jaka jest gęstość
prawdopodobieństwa g(y), jeżeli znana jest f(x)?
y
y=y(x)
1,02cm
■
f x dx= g y dy
dy
g(y)
x
f(x)
dx
1,59
∣ ∣
dx
dx=∣ ∣dy
dy
dx
g y=∣ ∣ f x
dy
dy
dy=
dx
dx
x
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
7
Transformacja rozkładów
Można rozważać podobny problem. Mamy
zmienną losową X opisaną rozkładem
jednorodnym f(x). Jaka ma być funkcja Y=Y(X),
aby otrzymać zadaną g(y)?
y
y=y(x)=?
f x dx= g y dy
gdy f x≡1
1,02cm
■
dy
dG y≡g y dy=dx
g(y)
x
x=G y
dx
1,59
f(x)
∫ dx=∫ dG y
y=G−1 x
1
y min =G−1 0 , y max =G−1 1
0
1x
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
8
Zamiana zmiennych, funkcja 2d
■
Podobnie możemy dokonać zamiany zmiennych
dla funkcji dwóch zmiennych (X,Y)→(U,V):
U =U X , Y
■
Szukamy funkcji J:
V =V X , Y
y
∣ ∣
g u , v= f x , y J
x,y
x a =x u , v
x b =x u , vdv
x c = x udu , v
d
b
u ,v
y a =y u , v
y b =y u , vdv
y c = y udu , v
v(x,y)+dv
dA
v(x,y)
c
u(x,y)+du
a
u(x,y)
x
Rozwijamy w szereg Taylora:
x b = x u , v
x c = x u , v
∂x
∂v
∂x
∂u
dv
y b =y u , v
du
y c = y u , v
∂y
∂v
∂y
∂u
dv
du
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
9
Jakobian
■
Obliczamy pole powierzchni dA:
∣
1
dA= 1
1
xa
xb
xc
∣∣
∂x
ya
∂u
yb =
∂x
yc
∂v
∣
∂y
∂u
du dv ≡ J
∂y
∂v
x,y
du dv
u ,v
czyli szukaną funkcją jest Jakobian
transformacji
■ Dla funkcji wielu zmiennych uogólniamy:
∂x
∂x
Y 1 =Y 1 X
Y 2 =Y 2 X
⋮
Y n =Y n X
∣ ∣
g y = J
x
y
f x
J
2
∂ y1
∂ y1
∂ x1
∂ x2
= ∂y
2
∂ y2
x
y
∣ ∣
1
...
...
∂ xn
∂ y1
∂ xn
∂ y2
...
∂ x1
∂ x2
∂ yn
∂ yn
...
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
∂ xn
∂ yn
10
Przykład zamiany zmiennych
f x , y =1/2 ∗a ,∣x∣∣ y∣a
2
■
Dokonujemy zamiany
zmiennych:
1
uv
2
⇔
1
y u , v = u−v
v x , y = x− y
2
u x , y = x y
■
Obliczamy Jakobian:
∂x 1
=
∂u 2
∂y 1
=
∂u 2
∂x 1
=
∂v 2
∂y
1
=−
∂v
2
J
■
g u , v =
x u , v =
x,y
1 1 1
1 1
= ⋅ − ⋅− =
u ,v
2 2 2
2 2
I otrzymujemy g(u,v):
1
f x , y =1/ 4 ∗a 2 ,∣u∣a ;∣v∣a
2
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
11
Współrzędne sferyczne
f x , y =1/∗R 2 , x 2 y 2R
■
Dokonujemy zamiany
zmiennych:
2
2
x r , =r cos
r x , y = x y
y ⇔
y r , =r sin
x , y =arctg
x
■
Obliczamy Jakobian:
∂y y
∂x x
=
=
∂
r
r
∂r r
∂ x −y
∂y
x
= 2
= 2
∂
∂ r
r
x,y
x x
y y 1
J
= ⋅ 2 ⋅ 2=
u ,v
r r
r r
r
■
g r , =
I otrzymujemy g(r,φ):
1
f x , y =1/r∗∗R 2 , 0 r R ;
r
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
12
Transformacje liniowe
■
Najczęściej posługujemy się transformacjami
liniowymi
Y 1 =a 1 t 11 X 1 t 12 X 2 ...t 1 n X n
Y 2 =a 2 t 21 X 1 t 22 X 2 ...t 2 n X n
⋮
Y r =a r t r1 X 1 t r2 X 2 ...t rn X n
■
Współczynniki t najwygodniej przedstawić w
postaci macierzy. Wtedy:
Y =T X a
E { Y }= y =T
x a
C y = E { y− y y− y }
T
= E {T X a−T
x −aT X a−T
x −a }
T
T
= E {T X −
x X −
x T }
T
=TE { X −
x X −
x T } T T ,
C y =T C x T T ,
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
13
Propagacja błędów
■
Załóżmy, że znamy wartości pomiaru (X) oraz ich
błędy σ2x i kowariancje. Szukamy błędów Y(X).
Dokonujemy rozwinięcia w szereg Taylora wokół
wartości średnich:
Y i =Y i x
■
∂ yi
∂ x1
x= x
X 1− x 1 ...
∂ yi
∂ xn
x= x
X n − x n O 2
Ograniczając się do wyrazów liniowych mamy
transformację liniową o a=Yi(x) oraz:
∂ y1
∂ y1
∂ x1
∂ x2
∂ y2
∂ y2
T= ∂ x
1
∂ x2
⋮
∂ yn
∂ yn
∂ x1
∂ x2
...
...
...
∂ y1
∂ xn
∂ y2
∂ xn
∂ yn
∂ xn
x= x
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
14
Prawo propagacji błędów
■
Możemy obliczyć macierz błędów wielkości Y:
T
C y =T C x T ,
Błędy zmiennych Y zależą od całej macierzy
kowariancji, a nie tylko od błedów zmiennej x.
■ Tylko i wyłącznie, gdy zmienne X są niezależne
czyli cij=0, dla i≠j, czyli gdy macierz Cx jest
diagonalna, możemy napisać:
■
n
Y i =∑ j=1
2
■
∂ yi
∂xj
2
2
X j
Co daje nam, po utożsamieniu σ z błędem
pomiarowym, prawo propagacji błędów:
y i =
n
∑ j=1
∂ yi
∂xj
2
x j
2
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
15
Zamiana zmiennych - kowariancja
Sprawdźmy znaczenie macierzy kowariancji.
■ Przykład: eksperyment STAR mierzy pęd cząstki
poprzez pomiar pędu poprzecznego pT (z
krzywizny toru) i jego kąta azymutalnego φ. Dla
cząstki o pędzie pT=1 GeV niepewność pomiaru pT
jest ośmiokrotnie większa niż φ.
■
x= p T ,
y= p x , p y
p x = p T cos
p y = p T sin
p T =1 GeV
=60
o
∂ px
∂ pT
T=
∂ py
∂ pT
∂ px
cos − p T sin
∂
=
∂ py
sin
p T cos
∂
1
T= 2
3
2
− 3
2
1
2
2
8
C p T , =
0
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
0
2
1
16
Kowariancja
■
Obliczamy nową macierz kowariancji:
Cp
■
x
, p =TC p
y
T
T
T
=
,
1 67
4 63 3
Jeśli zaniedbamy wyrazy niediagonalne i
dokonamy transformacji odwrotnej:
∂ pT
∂ px
T=
∂
∂ px
■
63 3
193
px
∂ pT
pT
∂ py
=
−py
∂
2
∂ py
pT
py
pT
px
pT
Cp
x
,p =
y
1 67
4 0
0
193
2
Otrzymamy następującą macierz kowariancji:
Cp
T
, =TC p
T
x
, py
T =
1
646
126 3
16 126 3
394
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
17
Transformacje ortogonalne
■
Mamy n funkcji y zależnych od n zmiennych x. Zakładamy
a=0. Stąd y=Rx. Żądamy, aby moduł długości wektora był
niezmiennikiem transformacji
n
■
Z założeń wynika, że:
2
2
R R= I , czyli ∑i=1 r ik r il =∂ kl
Jest to tzw. transformacja ortogonalna. Obliczmy
wyznacznik macierzy transformacji:
∣
r 11
r
D= 21
⋮
r n1
■
2
i
n
T
■
n
Y =∑i=1 Y = X =∑i=1 X i
2
r 12
r 22
r n2
...
...
...
∣
r1n
r2n
r nn
∣
1
0
2
D =
⋮
0
0
1
...
...
0
0
0
...
1
∣
czyli Jakobian J=± 1, zaś x=RTy.
Każdą transformację liniową Y1=r11X1+r12X2+...+r1nXn można
rozszerzyć do ortogonalnej przezn konstrukcję dodatkowych
2
r
=1
∑
funkcji Y2, ..., Yn z warunkiem
i=1 1 i
KADD – Rozkłady wielu zmiennych. Generacja liczb losowych
18