Janusz MIREK*, Katarzyna MIREK** Nieparametryczna estymacja

Transkrypt

Janusz MIREK*, Katarzyna MIREK** Nieparametryczna estymacja
WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie
Materiały Warsztatów str. 331–337
Janusz MIREK*, Katarzyna MIREK**
* Akademia Górniczo-Hutnicza, WGGiOŚ, Zakład Geofizyki, Kraków
** Akademia Górniczo-Hutnicza, WGGiOŚ, Zakład Geoinformatyki i Informatyki Stosowanej, Kraków
Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa
położenia źródła sejsmicznego
Streszczenie
W treści artykułu opisano metodykę wyznaczania funkcji gęstości prawdopodobieństwa
położenia źródła sejsmicznego w oparciu o nieparametryczne dwuwymiarowe estymatory
jądrowe do celów probabilistycznej analizy hazardu sejsmicznego (PAHS). W PAHS, w czasoprzestrzennych strefach, najczęściej stosuje się rozkład równomierny zakładający jednakowe
prawdopodobieństwo wystąpienia epicentrum w każdym punkcie strefy. Wykorzystanie estymacji jądrowej umożliwia określenie funkcji gęstości prawdopodobieństwa wystąpienia zjawiska dla danej strefy z uwzględnieniem lokalnych niejednorodności w rozkładzie epicentrów.
1. Wstęp
Probabilistyczna analiza hazardu sejsmicznego (PAHS) opiera się na parametrach wstrząsu
sejsmicznego takich jak czas wystąpienia wstrząsu, jego wielkość określona poprzez np.
energię lub magnitudę, oraz współrzędne epicentrum. Znajomość rozkładów prawdopodobieństwa tych wielkości daje podstawę do określenia hazardu sejsmicznego w danym rejonie.
Dotychczas do modelowania rozkładu źródeł sejsmicznych stosowało się z reguły rozkład
równomierny (np. Lasocki i in. 2001) o dwuwymiarowej gęstości prawdopodobieństwa, stałej
w danej strefie:

 1
f ( x, y )   S

0
dla ( x, y )  S
dla ( x, y )  S
(1.1)
gdzie S jest powierzchnią badanej strefy, a |S| jej polem powierzchni. Jednakże występowanie
źródeł wewnątrz strefy nie jest równomierne i takie założenie jest dalekie od ideału. Aby
dokładniej określić model dystrybucji wewnątrz strefy można zastosować podejście nieparametryczne estymacji funkcji gęstości prawdopodobieństwa. Takie podejście pozwala określić dwuwymiarowy, ciągły rozkład gęstości prawdopodobieństwa wystąpienia źródła w strefie
i odzwierciedla faktyczny rozkład źródeł. Estymacja nieparametryczna wymaga jednak bardzo
dużej mocy obliczeniowej, szczególnie przy zaawansowanych metodach określania parametrów estymacji jądrowej (np. 4.2). Testowanie metody przeprowadzono na czterdziestoprocesorowym klasterze obliczeniowym ASGARD zbudowanym w Zakładzie Geofizyki
WGGiOŚ AGH.
331
J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa …
2. Estymacja nieparametryczna
Do określenia charakterystyk probabilistycznych badanej próby statystycznej najczęściej
używa się metod parametrycznych (Silverman 1986). Polegają one na założeniu, że próba ma
znany rozkład określony funkcją analityczną, a następnie wyznaczeniu jej parametrów.
Zastosowanie metod parametrycznych daje więc bardzo dobre rezultaty w przypadkach,
w których jest dobrze znany rozkład zmiennej. Jeśli rozkład jest bardziej skomplikowany, np.
rozkład wielomodalny, metody parametryczne nie dają pożądanych rezultatów (Kay 1993).
Z pomocą przychodzą tutaj jądrowe estymatory nieparametryczne. Jądrowy estymator gęstości
prawdopodobieństwa (Silverman 1986; Nadaraya 1989) zdefiniowany jest jako suma wartości
funkcji jądrowych rozpiętych nad elementami próby (2.1)
1 n  x  Xi 
fˆ ( x) 

 K
nh i1  h 
(2.1)
gdzie n jest liczebnością próby, Xi elementem próby, K jest funkcją jądrową, a h tzw. parametrem wygładzania utożsamianym czasem z szerokością okna. Na rysunku 2.1 przedstawiono
ideę konstrukcji estymatora jądrowego na przykładzie czteroelementowej próby losowej. Nad
każdym elementem próby narysowano funkcję jądrową (jądro normalne) i grubszą linią sumę,
która stanowi estymatę funkcji gęstości prawdopodobieństwa.
Aby można było zastosować funkcję jako jądro musi ona spełniać warunek (2.2).
 K ( x)dx  1
(2.2)
Dodatkowo zakłada się, że funkcja jądrowa jest symetryczna względem zera i ma w tym
punkcie maksimum.
Rys. 2.1. Estymacja jądrowa funkcji gęstości prawdopodobieństwa
Fig. 2.1. Kernel estimation of probability density function
332
WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie
Ocenę jakości estymacji można przeprowadzić na podstawie błędu średniokwadratowego (MSE), który zdefiniowany jest jako wartość oczekiwana kwadratu błędu estymacji
w punkcie x:


2
MSEx  E fˆ ( x)  f ( x)
(2.3)
gdzie fˆ jest estymatorem funkcji rzeczywistej gęstości prawdopodobieństwa f . Całkowity
wskaźnik jakości estymacji uzyskuje się poprzez scałkowanie MSEx po całej przestrzeni
zmiennej losowej. Wartość tej całki określana jest jako scałkowany błąd średniokwadratowy.


2
MISE   E fˆ ( x)  f ( x) dx
(2.4)
Analizując wyrażenie (2.4) można wykazać, że najbardziej efektywnym jest jądro
Epanecznikowa. Pomimo, że inne jądra mają mniejszą efektywność, to spadek efektywności
nie jest duży. Np. dla jądra jednostajnego, które jest najprostsze, efektywność jest tylko o 7%
mniejsza, a dla jądra normalnego o 5%. Praktycznie oznacza to, że aby uzyskać takie same
wyniki jak dla jądra Epanecznikowa należy zwiększyć liczebność próby stosownie o 7% i 5%.
Nie są to duże wartości i przy wyborze jądra należy się kierować raczej własnościami
uzyskiwanego estymatora i np. oczekiwaną wydajnością obliczeń niż efektywnością. Zwykle
stosuje się jądro normalne z uwagi na własności funkcji ex.
3. Dwuwymiarowy jądrowy estymator funkcji gęstości prawdopodobieństwa
W przypadku estymacji funkcji gęstości prawdopodobieństwa wystąpienia epicentrum
wstrząsu należy rozważyć przypadek dwuwymiarowej zmiennej losowej [Xi Yi], gdzie X i Y są
współrzędnymi epicentrów. Dwuwymiarowe, radialne jądro normalne przyjmie wtedy postać
1
K ( x, y ) 
e
2

 x2  y 2
2

(3.1)
a estymator jądrowy gęstości prawdopodobieństwa w takiej przestrzeni jest zdefiniowany przez
1 n  x  X i y  Yi 
fˆ ( x, y)  2  K 
,

nh i1  h
h 
(3.2)
Jądro K jest nazywane jądrem radialnym, gdyż jego wartość zależy od odległości punktu
próby losowej od punktu r 2  x 2  y 2 , dla którego wyznaczamy wartość funkcji fˆ . Poziomice jądra (3.1) tworzą na płaszczyźnie okręgi. Aby jądro było efektywniejsze, należy
dostosować jego kształt do kształtu funkcji gęstości prawdopodobieństwa, której kształt może
być skorelowany np. z kształtem pola eksploatacji lub lokalną tektoniką. Do modyfikacji
kształtu funkcji jądra (3.1) stosuje się transformację liniową
333
J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa …
T
 x
 x
r    R 1  
 y
 y
2
(3.3)
gdzie R jest macierzą kowariancji zmiennych X i Y. Postać jądra z zastosowaniem transformacji liniowej wygląda więc następująco:
K ( x, y ) 
1
e
2  R
  x T
 x 
   R 1   
  y
 y  

2
(3.4)
Należy zauważyć, że macierz R na diagonalnej ma wartości wariancji zmiennych X i Y,
a w przypadku zmiennych niezależnych przyjmie poza diagonalną wartości zerowe. Jeśli jako
macierz R podstawimy macierz jednostkową, to uzyskamy jądro (3.1). Podobny rezultat można
uzyskać normując przed przetwarzaniem zmienne losowe X i Y poprzez podzielenie ich przez
odchylenie standardowe.
4. Dobór parametru wygładzania h i jego modyfikacja
Wartość parametru wygładzania h decyduje o kształcie funkcji jądrowej. Duża wartość
powoduje rozciągnięcie i spłaszczenie funkcji jądrowej, natomiast mała wartość wysmukla tę
funkcję (Kulczycki 2005). Wartość parametru h, a co za tym idzie, kształt funkcji jądrowej
wpływa na jakość estymatora jądrowego. Parametr ten jest dobierany tak, aby zminimalizować
scałkowany błąd średniokwadratowy MISE (2.4) (Groenborn, Wellner 1992). Problem polega
jednakże na tym, że nie znamy rzeczywistej funkcji gęstości prawdopodobieństwa f. Można
zatem założyć a priori kształt estymowanej funkcji i na tej podstawie minimalizować
wyrażenie (2.4). Jeśli założymy, że rozkład w analizowanym obszarze jest normalny, można
wykazać, że optymalna wartość parametru h wynosi
h0  n

1
6
var( X )  var(Y )
2
(4.1)
gdzie n jest liczebnością próby. Należy pamiętać, że wartość ta jest optymalna tylko dla
przypadku, kiedy zmienne losowe X i Y mają rozkład normalny. Taka sytuacja może zaistnieć,
np. w wydzielonych strefach czasoprzestrzennych, jeśli taki warunek był np. brany pod uwagę
w procesie wydzielania stref. W przypadku gdy analizowany obszar jest większy, a funkcja
gęstości prawdopodobieństwa ma wiele lokalnych maksimów, wartość (4.1) można traktować,
jako pierwsze przybliżenie, którego wartość może być szybko wyznaczona. Dokładniejsze
określenie współczynnika h można uzyskać metodą uwiarygodnienia krzyżowego (crossvalidation), która także jest oparta na minimalizacji scałkowanego błędu średniokwadratowego
MISE. Polega ona na wyznaczeniu wartości minimalnej funkcji g(h) zdefiniowanej poniższą
zależnością:
334
WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie
n
n


 x  x j yi  y j  2
  K (0,0)
g (h)  h 2 n 2  G i
,
h  n
 i1 j 1  h

(4.2)
gdzie funkcja G(x,y) dla jądra radialnego (3.1) określona jest przez
1
Gx, y  
e
4
 ( x2  y 2 )
4
 2 K ( x, y)
(4.3)
W przypadku jądra z uwzględnioną transformacją liniową (3.4) funkcja G(x,y) przyjmuje
postać:
G  x, y  
1
4 R
e
  x T
x 
   R 1   
  y
 y  

4
 2 K ( x, y )
(4.4)
Poszukiwania minimum funkcji G(x,y) prowadzi się zwykle w przedziale [h0/4, 4h0], gdzie
h0 jest przybliżoną wartością współczynnika h wyznaczoną na podstawie (4.1).
Parametr h – obliczony na podstawie (4.2) – może być stosowany w całej przestrzeni, dla
każdego jądra. Jednakże w badanym obszarze są miejsca o większym skupieniu danych i miejsca, gdzie danych tych jest mniej. Celowym wydaje się więc zmniejszenie wartości parametru
w obszarach o większym zagęszczeniu danych, aby uwypuklić ewentualne lokalne zmiany
funkcji gęstości prawdopodobieństwa, lub też zwiększenie parametru w obszarach, gdzie
danych jest mniej, w celu rozciągnięcia funkcji jądrowej i tym samym wygładzenie funkcji.
Można zatem poddać parametr h modyfikacji ze względu na ilość danych w danym obszarze.
Ponieważ wartość funkcji gęstości prawdopodobieństwa jest zależna od ilości danych w danym
rejonie, można więc estymatora jądrowego fˆ – wyznaczonego dla stałego parametru h – użyć
jako pierwszego etapu obliczeń, a następnie na jego podstawie modyfikować wartość parametru h i ponownie wyznaczyć wartość fˆ . Wartość współczynnika modyfikującego s można
określić jako:
 fˆ ( xi , yi ) 

si  
~
s


c
(4.5)
gdzie c jest dodatnią stałą, a ~
s jest średnią geometryczną wartości estymowanych dla stałego h
funkcji fˆ w punktach określonych przez dane wejściowe:
~
s e
1 n
ln  fˆ ( xi , yi ) 
n i 1

(4.6)
W ostatecznej formie estymator funkcji gęstości prawdopodobieństwa określony jest poprzez wyrażenie:
335
J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa …
1 n 1  x  X i y  Yi 

fˆ ( x, y)  2  2 K 
,
nh i1 si  hsi
hsi 
(4.7)
Stała c we wzorze (4.5) decyduje o intensywności modyfikacji i w praktyce zawiera się
w przedziale [0,1]. Badając wpływ stałej c na wartość błędu estymacji najlepsze wyniki
uzyskuje się dla wartości c = 0,5 i taka wartość z reguły stosowana jest w różnych zastosowaniach.
5. Podsumowanie
Pomimo dużego zapotrzebowania na moc obliczeniową komputerów, metody estymacji
jądrowej dają bardzo dobre rezultaty. Na rys. 5.1 przedstawiono mapę poziomicową rozkładu
funkcji gęstości prawdopodobieństwa dla siodła głównego w rejonie GZW. Krzyżykami naniesiono epicentra zarejestrowanych wstrząsów. Do obliczeń wykorzystano 1044 wstrząsy
o energii większej niż 1e6 J. Dane pochodzą z lat 1983–2004. Jak widać prawdopodobieństwo
wystąpienia wstrząsu w centralnej części siodła jest wielokrotnie wyższe niż w pozostałych
rejonach.
Rys. 5.1. Funkcja gęstości prawdopodobieństwa wystąpienia epicentrum zjawiska o wnergii E > 1e6 J
w obrębie siodła głównego w rejonie GZW
Fig. 5.1. Function of probability density of localization of seismic epicenter for energy E > 1e6 J for
a part of GZW, Poland
336
WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie
Pozytywne wyniki określenia funkcji gęstości prawdopodobieństwa skłaniają do dalszych
prac w tym kierunku, w szczególności do prac mających na celu znalezienie funkcji gęstości
zmiennej w czasie.
Praca została wykonana w ramach badań statutowych Zakładu Geofizyki Wydziału Geologii,
Geofizyki i Ochrony Środowiska AGH, nr 11.11.140.455.
Literatura
[1] Groenborn P., Wellner J. A. 1992: Information Bounds and Nonparametric Maximum Likehood
Estimation, Birkhäuser Verlag, Berlin.
[2] Kay S. M. 1993: Fundamentals of Statistical Signal Processing: Estimation Theory, PTR Prentice
Hall, New Jersey.
[3] Kulczycki P. 2005: Estymatory jądrowe w analizie systemowej, Wydawnictwa Naukowo-Techniczne. Warszawa.
[4] Lasocki S. i in. 2001: Prognoza aktywności sejsmicznej indukowanej działalnością górniczą
KGHM „Polska Miedź” S.A. w Lubinie wraz z prognozą drgań gruntu dla miasta Polkowice
w okresie do końca 2013 roku, Zarząd Gminy Polkowice, (praca niepublikowana).
[5] Nadaraya E. A. 1989: Nonparametric Estimation of Probability Densities and Regresion Curves,
Kluwer, Dordrecht.
[6] Silverman B.W. 1986: Density Estimation for Statistic and Data Analysis, Chapman and Hall,
London.
Nonparametric estimation of density probability function of
seismic source location
The paper describes methodology of nonparametric kernel estimation of probability density
function of seismic event location. The estimated density function is crucial to calculate
probability seismic hazard (PSH). This function can be used in calculation of PSH instead of
typical function which defines probability density as constant value in whole zone. The
enclosed example shows result of calculations for specified area.
Przekazano: 31 marca 2007 r.
337