Janusz MIREK*, Katarzyna MIREK** Nieparametryczna estymacja
Transkrypt
Janusz MIREK*, Katarzyna MIREK** Nieparametryczna estymacja
WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie Materiały Warsztatów str. 331–337 Janusz MIREK*, Katarzyna MIREK** * Akademia Górniczo-Hutnicza, WGGiOŚ, Zakład Geofizyki, Kraków ** Akademia Górniczo-Hutnicza, WGGiOŚ, Zakład Geoinformatyki i Informatyki Stosowanej, Kraków Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa położenia źródła sejsmicznego Streszczenie W treści artykułu opisano metodykę wyznaczania funkcji gęstości prawdopodobieństwa położenia źródła sejsmicznego w oparciu o nieparametryczne dwuwymiarowe estymatory jądrowe do celów probabilistycznej analizy hazardu sejsmicznego (PAHS). W PAHS, w czasoprzestrzennych strefach, najczęściej stosuje się rozkład równomierny zakładający jednakowe prawdopodobieństwo wystąpienia epicentrum w każdym punkcie strefy. Wykorzystanie estymacji jądrowej umożliwia określenie funkcji gęstości prawdopodobieństwa wystąpienia zjawiska dla danej strefy z uwzględnieniem lokalnych niejednorodności w rozkładzie epicentrów. 1. Wstęp Probabilistyczna analiza hazardu sejsmicznego (PAHS) opiera się na parametrach wstrząsu sejsmicznego takich jak czas wystąpienia wstrząsu, jego wielkość określona poprzez np. energię lub magnitudę, oraz współrzędne epicentrum. Znajomość rozkładów prawdopodobieństwa tych wielkości daje podstawę do określenia hazardu sejsmicznego w danym rejonie. Dotychczas do modelowania rozkładu źródeł sejsmicznych stosowało się z reguły rozkład równomierny (np. Lasocki i in. 2001) o dwuwymiarowej gęstości prawdopodobieństwa, stałej w danej strefie: 1 f ( x, y ) S 0 dla ( x, y ) S dla ( x, y ) S (1.1) gdzie S jest powierzchnią badanej strefy, a |S| jej polem powierzchni. Jednakże występowanie źródeł wewnątrz strefy nie jest równomierne i takie założenie jest dalekie od ideału. Aby dokładniej określić model dystrybucji wewnątrz strefy można zastosować podejście nieparametryczne estymacji funkcji gęstości prawdopodobieństwa. Takie podejście pozwala określić dwuwymiarowy, ciągły rozkład gęstości prawdopodobieństwa wystąpienia źródła w strefie i odzwierciedla faktyczny rozkład źródeł. Estymacja nieparametryczna wymaga jednak bardzo dużej mocy obliczeniowej, szczególnie przy zaawansowanych metodach określania parametrów estymacji jądrowej (np. 4.2). Testowanie metody przeprowadzono na czterdziestoprocesorowym klasterze obliczeniowym ASGARD zbudowanym w Zakładzie Geofizyki WGGiOŚ AGH. 331 J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa … 2. Estymacja nieparametryczna Do określenia charakterystyk probabilistycznych badanej próby statystycznej najczęściej używa się metod parametrycznych (Silverman 1986). Polegają one na założeniu, że próba ma znany rozkład określony funkcją analityczną, a następnie wyznaczeniu jej parametrów. Zastosowanie metod parametrycznych daje więc bardzo dobre rezultaty w przypadkach, w których jest dobrze znany rozkład zmiennej. Jeśli rozkład jest bardziej skomplikowany, np. rozkład wielomodalny, metody parametryczne nie dają pożądanych rezultatów (Kay 1993). Z pomocą przychodzą tutaj jądrowe estymatory nieparametryczne. Jądrowy estymator gęstości prawdopodobieństwa (Silverman 1986; Nadaraya 1989) zdefiniowany jest jako suma wartości funkcji jądrowych rozpiętych nad elementami próby (2.1) 1 n x Xi fˆ ( x) K nh i1 h (2.1) gdzie n jest liczebnością próby, Xi elementem próby, K jest funkcją jądrową, a h tzw. parametrem wygładzania utożsamianym czasem z szerokością okna. Na rysunku 2.1 przedstawiono ideę konstrukcji estymatora jądrowego na przykładzie czteroelementowej próby losowej. Nad każdym elementem próby narysowano funkcję jądrową (jądro normalne) i grubszą linią sumę, która stanowi estymatę funkcji gęstości prawdopodobieństwa. Aby można było zastosować funkcję jako jądro musi ona spełniać warunek (2.2). K ( x)dx 1 (2.2) Dodatkowo zakłada się, że funkcja jądrowa jest symetryczna względem zera i ma w tym punkcie maksimum. Rys. 2.1. Estymacja jądrowa funkcji gęstości prawdopodobieństwa Fig. 2.1. Kernel estimation of probability density function 332 WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie Ocenę jakości estymacji można przeprowadzić na podstawie błędu średniokwadratowego (MSE), który zdefiniowany jest jako wartość oczekiwana kwadratu błędu estymacji w punkcie x: 2 MSEx E fˆ ( x) f ( x) (2.3) gdzie fˆ jest estymatorem funkcji rzeczywistej gęstości prawdopodobieństwa f . Całkowity wskaźnik jakości estymacji uzyskuje się poprzez scałkowanie MSEx po całej przestrzeni zmiennej losowej. Wartość tej całki określana jest jako scałkowany błąd średniokwadratowy. 2 MISE E fˆ ( x) f ( x) dx (2.4) Analizując wyrażenie (2.4) można wykazać, że najbardziej efektywnym jest jądro Epanecznikowa. Pomimo, że inne jądra mają mniejszą efektywność, to spadek efektywności nie jest duży. Np. dla jądra jednostajnego, które jest najprostsze, efektywność jest tylko o 7% mniejsza, a dla jądra normalnego o 5%. Praktycznie oznacza to, że aby uzyskać takie same wyniki jak dla jądra Epanecznikowa należy zwiększyć liczebność próby stosownie o 7% i 5%. Nie są to duże wartości i przy wyborze jądra należy się kierować raczej własnościami uzyskiwanego estymatora i np. oczekiwaną wydajnością obliczeń niż efektywnością. Zwykle stosuje się jądro normalne z uwagi na własności funkcji ex. 3. Dwuwymiarowy jądrowy estymator funkcji gęstości prawdopodobieństwa W przypadku estymacji funkcji gęstości prawdopodobieństwa wystąpienia epicentrum wstrząsu należy rozważyć przypadek dwuwymiarowej zmiennej losowej [Xi Yi], gdzie X i Y są współrzędnymi epicentrów. Dwuwymiarowe, radialne jądro normalne przyjmie wtedy postać 1 K ( x, y ) e 2 x2 y 2 2 (3.1) a estymator jądrowy gęstości prawdopodobieństwa w takiej przestrzeni jest zdefiniowany przez 1 n x X i y Yi fˆ ( x, y) 2 K , nh i1 h h (3.2) Jądro K jest nazywane jądrem radialnym, gdyż jego wartość zależy od odległości punktu próby losowej od punktu r 2 x 2 y 2 , dla którego wyznaczamy wartość funkcji fˆ . Poziomice jądra (3.1) tworzą na płaszczyźnie okręgi. Aby jądro było efektywniejsze, należy dostosować jego kształt do kształtu funkcji gęstości prawdopodobieństwa, której kształt może być skorelowany np. z kształtem pola eksploatacji lub lokalną tektoniką. Do modyfikacji kształtu funkcji jądra (3.1) stosuje się transformację liniową 333 J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa … T x x r R 1 y y 2 (3.3) gdzie R jest macierzą kowariancji zmiennych X i Y. Postać jądra z zastosowaniem transformacji liniowej wygląda więc następująco: K ( x, y ) 1 e 2 R x T x R 1 y y 2 (3.4) Należy zauważyć, że macierz R na diagonalnej ma wartości wariancji zmiennych X i Y, a w przypadku zmiennych niezależnych przyjmie poza diagonalną wartości zerowe. Jeśli jako macierz R podstawimy macierz jednostkową, to uzyskamy jądro (3.1). Podobny rezultat można uzyskać normując przed przetwarzaniem zmienne losowe X i Y poprzez podzielenie ich przez odchylenie standardowe. 4. Dobór parametru wygładzania h i jego modyfikacja Wartość parametru wygładzania h decyduje o kształcie funkcji jądrowej. Duża wartość powoduje rozciągnięcie i spłaszczenie funkcji jądrowej, natomiast mała wartość wysmukla tę funkcję (Kulczycki 2005). Wartość parametru h, a co za tym idzie, kształt funkcji jądrowej wpływa na jakość estymatora jądrowego. Parametr ten jest dobierany tak, aby zminimalizować scałkowany błąd średniokwadratowy MISE (2.4) (Groenborn, Wellner 1992). Problem polega jednakże na tym, że nie znamy rzeczywistej funkcji gęstości prawdopodobieństwa f. Można zatem założyć a priori kształt estymowanej funkcji i na tej podstawie minimalizować wyrażenie (2.4). Jeśli założymy, że rozkład w analizowanym obszarze jest normalny, można wykazać, że optymalna wartość parametru h wynosi h0 n 1 6 var( X ) var(Y ) 2 (4.1) gdzie n jest liczebnością próby. Należy pamiętać, że wartość ta jest optymalna tylko dla przypadku, kiedy zmienne losowe X i Y mają rozkład normalny. Taka sytuacja może zaistnieć, np. w wydzielonych strefach czasoprzestrzennych, jeśli taki warunek był np. brany pod uwagę w procesie wydzielania stref. W przypadku gdy analizowany obszar jest większy, a funkcja gęstości prawdopodobieństwa ma wiele lokalnych maksimów, wartość (4.1) można traktować, jako pierwsze przybliżenie, którego wartość może być szybko wyznaczona. Dokładniejsze określenie współczynnika h można uzyskać metodą uwiarygodnienia krzyżowego (crossvalidation), która także jest oparta na minimalizacji scałkowanego błędu średniokwadratowego MISE. Polega ona na wyznaczeniu wartości minimalnej funkcji g(h) zdefiniowanej poniższą zależnością: 334 WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie n n x x j yi y j 2 K (0,0) g (h) h 2 n 2 G i , h n i1 j 1 h (4.2) gdzie funkcja G(x,y) dla jądra radialnego (3.1) określona jest przez 1 Gx, y e 4 ( x2 y 2 ) 4 2 K ( x, y) (4.3) W przypadku jądra z uwzględnioną transformacją liniową (3.4) funkcja G(x,y) przyjmuje postać: G x, y 1 4 R e x T x R 1 y y 4 2 K ( x, y ) (4.4) Poszukiwania minimum funkcji G(x,y) prowadzi się zwykle w przedziale [h0/4, 4h0], gdzie h0 jest przybliżoną wartością współczynnika h wyznaczoną na podstawie (4.1). Parametr h – obliczony na podstawie (4.2) – może być stosowany w całej przestrzeni, dla każdego jądra. Jednakże w badanym obszarze są miejsca o większym skupieniu danych i miejsca, gdzie danych tych jest mniej. Celowym wydaje się więc zmniejszenie wartości parametru w obszarach o większym zagęszczeniu danych, aby uwypuklić ewentualne lokalne zmiany funkcji gęstości prawdopodobieństwa, lub też zwiększenie parametru w obszarach, gdzie danych jest mniej, w celu rozciągnięcia funkcji jądrowej i tym samym wygładzenie funkcji. Można zatem poddać parametr h modyfikacji ze względu na ilość danych w danym obszarze. Ponieważ wartość funkcji gęstości prawdopodobieństwa jest zależna od ilości danych w danym rejonie, można więc estymatora jądrowego fˆ – wyznaczonego dla stałego parametru h – użyć jako pierwszego etapu obliczeń, a następnie na jego podstawie modyfikować wartość parametru h i ponownie wyznaczyć wartość fˆ . Wartość współczynnika modyfikującego s można określić jako: fˆ ( xi , yi ) si ~ s c (4.5) gdzie c jest dodatnią stałą, a ~ s jest średnią geometryczną wartości estymowanych dla stałego h funkcji fˆ w punktach określonych przez dane wejściowe: ~ s e 1 n ln fˆ ( xi , yi ) n i 1 (4.6) W ostatecznej formie estymator funkcji gęstości prawdopodobieństwa określony jest poprzez wyrażenie: 335 J. MIREK, K. MIREK – Nieparametryczna estymacja funkcji gęstości prawdopodobieństwa … 1 n 1 x X i y Yi fˆ ( x, y) 2 2 K , nh i1 si hsi hsi (4.7) Stała c we wzorze (4.5) decyduje o intensywności modyfikacji i w praktyce zawiera się w przedziale [0,1]. Badając wpływ stałej c na wartość błędu estymacji najlepsze wyniki uzyskuje się dla wartości c = 0,5 i taka wartość z reguły stosowana jest w różnych zastosowaniach. 5. Podsumowanie Pomimo dużego zapotrzebowania na moc obliczeniową komputerów, metody estymacji jądrowej dają bardzo dobre rezultaty. Na rys. 5.1 przedstawiono mapę poziomicową rozkładu funkcji gęstości prawdopodobieństwa dla siodła głównego w rejonie GZW. Krzyżykami naniesiono epicentra zarejestrowanych wstrząsów. Do obliczeń wykorzystano 1044 wstrząsy o energii większej niż 1e6 J. Dane pochodzą z lat 1983–2004. Jak widać prawdopodobieństwo wystąpienia wstrząsu w centralnej części siodła jest wielokrotnie wyższe niż w pozostałych rejonach. Rys. 5.1. Funkcja gęstości prawdopodobieństwa wystąpienia epicentrum zjawiska o wnergii E > 1e6 J w obrębie siodła głównego w rejonie GZW Fig. 5.1. Function of probability density of localization of seismic epicenter for energy E > 1e6 J for a part of GZW, Poland 336 WARSZTATY 2007 z cyklu: Zagrożenia naturalne w górnictwie Pozytywne wyniki określenia funkcji gęstości prawdopodobieństwa skłaniają do dalszych prac w tym kierunku, w szczególności do prac mających na celu znalezienie funkcji gęstości zmiennej w czasie. Praca została wykonana w ramach badań statutowych Zakładu Geofizyki Wydziału Geologii, Geofizyki i Ochrony Środowiska AGH, nr 11.11.140.455. Literatura [1] Groenborn P., Wellner J. A. 1992: Information Bounds and Nonparametric Maximum Likehood Estimation, Birkhäuser Verlag, Berlin. [2] Kay S. M. 1993: Fundamentals of Statistical Signal Processing: Estimation Theory, PTR Prentice Hall, New Jersey. [3] Kulczycki P. 2005: Estymatory jądrowe w analizie systemowej, Wydawnictwa Naukowo-Techniczne. Warszawa. [4] Lasocki S. i in. 2001: Prognoza aktywności sejsmicznej indukowanej działalnością górniczą KGHM „Polska Miedź” S.A. w Lubinie wraz z prognozą drgań gruntu dla miasta Polkowice w okresie do końca 2013 roku, Zarząd Gminy Polkowice, (praca niepublikowana). [5] Nadaraya E. A. 1989: Nonparametric Estimation of Probability Densities and Regresion Curves, Kluwer, Dordrecht. [6] Silverman B.W. 1986: Density Estimation for Statistic and Data Analysis, Chapman and Hall, London. Nonparametric estimation of density probability function of seismic source location The paper describes methodology of nonparametric kernel estimation of probability density function of seismic event location. The estimated density function is crucial to calculate probability seismic hazard (PSH). This function can be used in calculation of PSH instead of typical function which defines probability density as constant value in whole zone. The enclosed example shows result of calculations for specified area. Przekazano: 31 marca 2007 r. 337