- Instytut Mechaniki Górotworu PAN

Transkrypt

- Instytut Mechaniki Górotworu PAN
161
Prace Instytutu Mechaniki Górotworu PAN
Tom 9, nr 1-4, (2007), s. 161-172
© Instytut Mechaniki Górotworu PAN
Wykorzystanie metod morfologii matematycznej
oraz rozpoznawania obrazów do opisu geometrii powierzchni
przełamów skalnych
MARIUSZ MŁYNARCZUK, TERESA RATAJCZAK, JAROSŁAW AKSAMIT
Instytut Mechaniki Górotworu PAN, ul. Reymonta 27, 30-059 Kraków
Streszczenie
W pracy opisano badania, które koncentrowały się na wykorzystaniu metod rozpoznawania obrazów do klasyfikacji przełamów skalnych. Powierzchnie tych przełamów odwzorowane były przy użyciu profilomierza laserowego.
Wykorzystanie metod morfologii matematycznej do obróbki danych pomiarowych prowadzi do uzyskania szeregu
parametrów opisujących ukształtowanie powierzchni przełamu skalnego. Z punktu widzenia rozpoznawania obrazów, parametry te mogą być użyte do zdefiniowania tzw. ciągów uczących w uprzednio przyjętej przestrzeni cech.
Bazując na nich oraz definiując odpowiednie funkcje przynależności można podejmować w sposób automatyczny
decyzję o klasyfikacji poszczególnych przełamów skalnych. W pracy zdefiniowano i przetestowano kilka funkcji
przynależności oraz przedstawiono możliwości praktycznego wykorzystania tej metody.
Słowa kluczowe: przełam skalny, chropowatość powierzchni, morfologia matematyczna, rozpoznawanie obrazów
1. Wstęp
Prowadzone w IMG PAN w ostatnich latach badania nad wykorzystaniem metod analizy obrazu
i profilometrii laserowej do opisu ukształtowania powierzchni przełamów skalnych doprowadziły do zaproponowania nowych metod opisu tej powierzchni (Młynarczuk i in., 2001, 2002a, 2002b, 2004, 2006,
Młynarczuk 2002, 2004). W wyniku zastosowania proponowanej metodyki badawczej można otrzymać
szereg parametrów opisujących morfologię przełamu. Jednym z zadań, jakie postawiono sobie w opisywanych pracach było przebadanie czy istnieje możliwość klasyfikacji skał (w ramach pewnej wybranej grupy
skał) w oparciu o tak zmierzone parametry. Niniejszy artykuł koncentruje się na opisie prac mających na
celu zbadania możliwości takiej klasyfikacji poprzez wykorzystanie metod rozpoznawania obrazów.
Tadeusiewicz i Korohoda (1997) dzielą proces przetwarzania obrazu na kilka podstawowych etapów:
− recepcja (akwizycja) obrazu,
− przetwarzanie obrazu (filtracja, eksponowanie ważnych cech, itp.),
− analiza obrazu (wydobycie ważnych cech – segmentacja),
− rozpoznanie obrazu i jego interpretacja.
W dotychczasowych badaniach dotyczących wykorzystania metod analizy obrazu do opisu przełamów skalnych koncentrowano się na trzech pierwszych etapach (akwizycji, przetwarzaniu i segmentacji).
Niniejsza praca prezentuje ostatni etap procesu przetwarzania obrazu, który zmierza do automatycznego
rozpoznawania całości obrazu lub jego elementów.
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
162
2. Zarys metodyki badawczej
W pracach Młynarczuka (2004) oraz Młynarczuka i in. (2004, 2006) zaproponowano wykorzystanie metod morfologii matematycznej i analizy obrazu do opisu ukształtowania powierzchni przełamów
skalnych. Można w nich znaleźć szczegółowy opis tej metodyki badawczej oraz dyskusję otrzymanych
wyników. Niniejszy rozdział ma jedynie charakter informacyjny, wprowadzający czytelnika do rozpatrywanego w pracy zagadnienia i co za tym idzie przedstawia jedynie ogólny zarys metody pomiarowej oraz
sygnalizuje niektóre tylko wyniki.
2.1. Akwizycja danych i odwzorowanie mapy bitowej
U podstaw proponowanej metodyki pomiarowej leży idea, że macierz wartości XYZ, otrzymaną w wyniku skanowania powierzchni przełamu skalnego można przedstawić jako obraz (mapę bitową). Na obrazie
tym piksele o współrzędnych XY odpowiadają położeniu odpowiedniego punktu pomiarowego w macierzy,
a poziom szarości danego piksela odpowiada wysokości danego punktu w mikrometrach (rys. 1). Takie podejście pozwala na wykorzystanie do analizy ukształtowania przełamu skalnego aparatu matematycznego
stosowanego w metodach analizy obrazów, a w szczególności procedur morfologii matematycznej.
a)
b)
c)
Rys. 1. Analizowane pole na przełamie (a) można odwzorować jako wykres 3D (b) lub analizować jako obraz szary (c)
Pomiary będące punktem wyjścia do opisywanych badań wykonane zostały przy użyciu profilomierza laserowego (rys. 2), którego opis można znaleźć w pracy Młynarczuka (1993). Badania prowadzące do
opracowania i testowania metodyki pomiarowej wykonywano na pięciu rodzajach skał o zróżnicowanej
strukturze petrograficznej i odmiennych właściwościach fizyko-mechanicznych. Skałami tymi były: wapień
z Czatkowic, kwarcyt z Wiśniówki, dolomit z Rędzin, piaskowiec z Tumlina oraz dolomit z Laskowej Góry.
Szczegółowy opis tych skał można znaleźć w pracy Młynarczuk i In (2006).
Rys. 2. Profilomierz laserowy
Wykorzystanie metod morfologii matematycznej oraz rozpoznawania obrazów do opisu...
163
2.2. Przetwarzanie i analiza obrazów
Obrazy uzyskane w sposób opisany w poprzednim rozdziale były obiektem analizy prowadzącej do
wyodrębnienia parametrów geometrycznych opisujących obraz (czyli ukształtowanie powierzchni przełamu).
W tym celu wykorzystano w szczególności metody morfologii matematycznej, takie jak: filtry morfologiczne,
operacje geodezyjne prowadzące do wyznaczenia ekstremów lokalnych, linii działów wodnych (watershed),
funkcję dystansu, operacje chybił-trafił (hit or miss), itp. Wykorzystano również narzędzia analizy obrazu
wywodzące się z zastosowań geostatystycznych, np. wariogramy, madogramy, granulometrię itp.
Wykorzystanie tych metod doprowadziło do uzyskania szeregu parametrów geometrycznych opisujących badane przełamy. Ich opis, sposób uzyskiwania oraz interpretację można odnaleźć w pracach
Młynarczuka i in. (2001, 2003, 2006).
3. Rozpoznawanie obrazów
W rozdziale zostaną przedstawione podstawy rozpoznawania obrazów. Szerszy opis tej tematyki
można znaleźć w pracy Tadeusiewicza i Flasińskiego (1991).
Rozpoznawanie obrazów (obiektów) ma na celu określenie przynależności różnego typu obiektów
(lub zjawisk) do pewnych, uprzednio zdefiniowanych klas. Jest ono zazwyczaj prowadzone jest w sytuacji
braku apriorycznej informacji dotyczącej przynależności obiektu. Jedyna informacja jaką dysponujemy
zawarta jest w ciągu uczącym, złożonym z obiektów, dla których znana jest klasyfikacja.
Od strony formalnej możemy przyjąć, że zadanie rozpoznawania obrazów polega na skonstruowaniu
pewnego algorytmu realizujący odwzorowanie A:
A : D ® I È {i0}
(1)
gdzie:
D – zbiór obiektów,
I – zbiór indeksów klas zaś parametr {i0} oznacza brak decyzji.
Odwzorowanie to realizowane jest jako złożenie trzech odwzorowań:
A = F oC o B
(2)
B:D ® X
(3)
które można opisać jako:
– recepcję:
– obliczanie wartości funkcji przynależności:
C : X ® RL
(4)
F : R L ® I È {i0}
(5)
– oraz podejmowanie decyzji:
3.1. Recepcja
Odwzorowanie to prowadzi do zamiany obiektów w punkty pewnej przestrzeni, zwanej przestrzenią
cech. Struktura przestrzeni cech jest z reguły arbitralna i zdeterminowana przez możliwości pomiarowe. Jej
elementami są n-wymiarowe wektory:
x = x1 , x 2 ..., x n Î X
(6)
Składowe xk tych wektorów będziemy traktowali jako liczby rzeczywiste określające ilościową miarę
określonej cechy, co powoduje, że przestrzeń X traktowana będzie jako n-wymiarowa przestrzeń euklidesowa.
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
164
Rysunek 3 prezentuje wyniki uzyskane z pomiarów 5 rodzajów skał (patrz rozdział 1) umieszczone
w dwuwymiarowej przestrzeni cech zdefiniowanej przez różnice wysokości pomiędzy sąsiednimi ekstremami (maksimum – minimum) oraz kątem jaki tworzy (z płaszczyzną z = 0) prosta poprowadzona przez
te ekstrema.
45,00
40,00
K¹t nachylenia [°]
35,00
30,00
25,00
20,00
15,00
10,00
5,00
0,00
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,180
Ró¿nica wysokoœci [mm]
Rys. 3. Lokalne parametry powierzchni przełamów umieszczone w przestrzeni cech
3.2. Ciąg uczący
Omawiane w niniejszej pracy metody rozpoznawania obrazów bazują na wykorzystaniu tzw. ciągów
uczących. Ciąg uczący U można zdefiniować jako zbiór par:
k
U = {( x , i k ),
k = 1,2.. N }
(7)
Elementy zbioru U nazywamy przykładami. Każdy przykład składa się z wektora cech x k pewnego
obiektu d k oraz z informacji na temat numeru klasy i k, do której obiekt powinien być zaliczony. Wybór
elementów ciągu uczącego powinien zapewnić reprezentatywność. W praktyce często stanowi on jednak
losowo wybraną próbę ze zbioru rozpoznawanych obiektów.
Poprzez dodanie do obiektów przestrzeni cech przedstawionych na rys. 3 informacji o ich poprawnej
klasyfikacji (która dla tych obiektów jest nam znana) możemy uzyskać ciąg uczący. Przedstawiony on został
na rys. 4.
45,00
40,00
K¹t nachylenia [°]
35,00
30,00
Czatkowice
25,00
Rêdziny
Leskowa Góra
20,00
Tumlin
15,00
Wiœniówka
10,00
5,00
0,00
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,180
Ró¿nica wysokoœci [mm]
Rys. 4. Obiekty z rys. 3 uzupełnione o informację dotyczącą klasyfikacji tworzą ciąg uczący
Wykorzystanie metod morfologii matematycznej oraz rozpoznawania obrazów do opisu...
165
3.3. Funkcje przynależności
Funkcja przynależności prowadzi do ustalenia pewnej miary podobieństwa nieznanego obiektu do
poszczególnych klas (których jest z definicji L, stąd odwzorowanie w R L). W praktyce odbywa się to poprzez wyznaczanie pewnej funkcji przynależności C(x) wektora cech x badanego (nieznanego) obiektu do
wszystkich klas zdefiniowanych w ciągu uczącym. Wybór funkcji przynależności C(x) jest zagadnieniem
kluczowym w procesie rozpoznawania obrazów, a różnice w poszczególnych metodach (opisanych w rozdziale 3.5) sprowadzają się przeważnie do różnych definicji funkcji C(x).
Rysunek 5 prezentuje rozpatrywaną uprzednio przestrzeń cech oraz nieznany punkt A (reprezentowany
przez wektor cech A), który ma podlegać rozpoznaniu. Na tym etapie rozpoznawania obrazów wybieramy
pewną funkcję przynależności i obliczamy jej wartości (czyli miary przynależności) pomiędzy obiektem A
oraz każdą z analizowanych 5 skał. W efekcie otrzymujemy następujące parametry CCzatkowice(A), CRędziny(A),
CL.Góra(A), CTumlin(A), CWiśniówka(A).
45,00
40,00
K¹t nachylenia [°]
35,00
30,00
Czatkowice
Rêdziny
25,00
Leskowa Góra
20,00
Tumlin
15,00
Wiœniówka
10,00
A
5,00
0,00
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,180
Ró¿nica wysokoœci [mm]
Rys. 5. Położenie obiektu A w przestrzeni cech
3.4. Podejmowanie decyzji
Etap ten prowadzi do podjęcia ostatecznej decyzji dotyczącej rozpoznania obiektu (lub jego braku).
Zazwyczaj odbywa się to poprzez przyjęcie reguły majoryzacyjnej:
é
ù
"xÎ S ê[F (C 1 ( x), C 2 ( x),..., C L ( x)) = i ] º "hÎI [C h ( x) < C i ( x)]ú
h ¹i
êë
úû
(8)
Najczęściej podejmowana jest decyzja o przynależności obiektu d opisywanego wektorem cech x do
tej klasy i dla której wartość funkcji przynależności C i(x) jest maksymalna.
3.5. Metody rozpoznawania obrazów
Jak wspomniano w rozdziale 3.3 w literaturze jest zdefiniowanych wiele funkcji przynależności, co
prowadzi do istnienia wielu metod rozpoznawania obrazów. W badaniach skupiono się na metodach sklasyfikowanych w dwóch zasadniczych grupach, a mianowicie:
− metody minimalnoodległościowe:
° metoda najbliższego sąsiada (NN),
° metoda α najbliższych sąsiadów (αNN).
− metody wzorców:
° metoda optymalnych otoczeń kulistych (OOK),
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
166
° metoda jednakowych otoczeń kulistych (JOK),
° metoda najbliższej mody (NM),
− metody aproksymacyjne (MA).
3.5.1.
Metody minimalnoodległościowe
Najczęściej stosowaną metodą jest metoda najbliższego sąsiada (NN). Jej zasada polega na tym, ze
jako rozpoznanie wybiera się tą klasę ciągu uczącego, do której należy obiekt najbliższy (w myśl przyjętej
metryki ρ) rozpoznawanemu obiektowi. Tak więc funkcję przynależności można w tym przypadku zdefiniować jako:
C i( x) =
1
(9)
i, k
r ( x, x ) + e '
gdzie:
x i,k – wektor cech dla obiektu k klasy i,
x – wektor cech rozpoznawanego obiektu,
C i(x) – funkcja przynależności obiektu x (opisanego wektorem cech x) do klasy i.
Podejmowanie decyzji następuje przy zastosowaniu metody majoryzacynjej (rozdz. 3.4). Istnienie
(stosunkowo małego i dodatniego) parametru ε’ jest podyktowane koniecznością uniknięcia braku rozwiązań
w dla przypadków gdy ρ(x, x i, k) = 0.
Przyjęcie tej metody prowadzi do podjęcia ostatecznej decyzji dotyczącej sytuacji przedstawionej
na rys. 5. Efektem rozpoznania jest przypisanie nieznanego obiektu A do klasy reprezentującej wapień
z Czatkowic (rys. 6).
45,00
40,00
K¹t nachylenia [°]
35,00
30,00
Czatkowice
Rêdziny
25,00
Leskowa Góra
20,00
Tumlin
15,00
Wiœniówka
10,00
Czatkowice (metoda NN)
5,00
0,00
0,000
0,020
0,040
0,060
0,080
0,100
0,120
0,140
0,160
0,180
Ró¿nica wysokoœci [mm]
Rys. 6. Efektem rozpoznania jest przypisanie nieznanego obiektu A do klasy reprezentującej wapień z Czatkowic
Niekiedy stosuje się modyfikację metody NN poprzez wyznaczenie odległości do α najbliższych
sąsiadów (obiektów) z ciągu uczącego. Nieznany obiekt klasyfikuje się do tej klasy, która najczęściej występuje pośród tych „α najbliższych obiektów” (αNN). Modyfikacja ta ma za zadanie eliminację wpływu
ewentualnych błędów występujących w ciągu uczącym.
3.5.2.
Metody wzorców
W metodach tych odwzorowanie C sprowadza się do określenia zawierania się nieznanego obiektu x
w obszarze wzorca i-tej klasy W i. Funkcję przynależności można więc zapisać w postaci:
ì1 dla x Î W i
Ci( x) = í
i
î0 dla x Ï W
(10)
Wykorzystanie metod morfologii matematycznej oraz rozpoznawania obrazów do opisu...
167
Typowym przykładem metody wzorców są metody otoczeń kulistych. Polegają one na obtoczeniu
każdego elementu ciągu uczącego kulą o promieniu ε.
Promień ε może być różny dla każdej kuli. Mamy wtedy do czynienia z metodą optymalnych otoczeń
kulistych (OOK):
e i, k =
1é
i, k
m
min
r ( x , x )ù
m
i
ê
úû
2 ë x ÏU
(11)
Możliwe jest też zdefiniowanie stałego promienia dla wszystkich kul. Prowadzi to do zdefiniowania
metody jednakowych otoczeń kulistych (JOK):
e = min ( mini e i , k )
i ÎI
k Î[1, N ]
(12)
Inna z metod opartych na wzorcach polega na eliminacji niektórych elementów ciągu uczącego i zastąpieniu każdej klasy jednym reprezentantem – modą:
i
M = m1, m 2 ,...mN
(13)
Istnieje wiele sposobów wyznaczania mody. Stosunkowo często wyznacza się ją jako „środek ciężkości” danej klasy. Decyzja o klasyfikacji podejmowana jest (podobnie jak w metodzie NN) w oparciu
o odległość nieznanego obiektu od najbliższej mody (NM):
Ci( x) =
3.5.3.
1
i
r ( x, M ) + e '
(14)
Metody aproksymacyjne
Przedstawione do tej pory metody opierały się na podejściu geometrycznym dotyczącym analizy
położenia punktu w przestrzeni cech, a w szczególności jego usytuowaniu w stosunku do obiektów ciągu
uczącego. Możliwe jest jednak inne podejście polegające na przeprowadzeniu w przestrzeni cech powierzchni rozgraniczających poszczególne klasy ciągów uczących. Powierzchnie te dzielą przestrzeń cech na tyle
obszarów ile rozpoznajemy klas. Decyzja dotycząca przynależności rozpoznawanego obiektu podejmowana
jest w oparciu o wyznaczenie przynależności tego obiektu do któregoś z tych obszarów.
Szczegółowy opis metod aproksymacji MA jak również sposobu wyznaczania i optymalizowania
równań płaszczyzn został pominięty ze względu na jego obszerność. Informacje te można odnaleźć w pracy
Tadeusiewicza i Flasińskiego (1991). W pracy wykorzystywana jest tzw. metoda aproksymacji liniowej,
która poprzez wykorzystanie linii (2D) lub płaszczyzn (3D i więcej wymiarów) dzieli przestrzeń cech na
podprzestrzenie zawierające (w sytuacji idealnej) obiekty tylko jednej klasy.
4. Wykorzystanie metody do klasyfikacji przełamów
Jak wspomniano w rozdziale 2 w ostatnich latach wyznaczono szereg parametrów opisujących
powierzchnię przełamu skalnego. W prezentowanych badaniach skoncentrujemy się na rozważeniu kilku
z nich.
Zmierzono przełamy 5 wspomnianych wcześniej skał. Skanowano pola o wielkości 256 × 256 punktów
odległych od siebie o 10 µm. W sumie, dla wszystkich pięciu skał odwzorowano 131 pól pomiarowych.
Zdecydowano się na wykorzystanie 6-wymiarowej przestrzeni cech. Tworzyły ją następujące parametry:
1) średnie pole powierzchni obszarów wyznaczonych przez watershed,
2) średnia różnica pomiędzy ekstremami lokalnymi na obszarach wydzielonych przez watershed,
3) średni kąt, który tworzy odcinek łączący te ekstrema z płaszczyzną z = 0,
4) objętość obrazu gradientu morfologicznego,
5) wartość progu madogramu obrazu przełamu dla h = 300 µm,
6) wartość progu madogramu profilu chropowatości wyodrębnionego z obrazu przełamu (próg obliczano
dla h = 300 µm).
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
168
Opis uzyskiwania tych parametrów można odnaleźć w pracach Młynarczuka i in. (2004, 2006)
Rysunki 7-12 zestawiają w formie graficznej wartości w/w parametrów.
Ze względu na właściwości wykorzystywanych metod rozpoznawania obrazów (bazowanie na parametrach odległości) wartości parametrów z rys. 7-12 zostały unormowane w przedziale od 0 do 100, przy
Œr. pole obszarów [µm2]
120000
100000
80000
60000
40000
20000
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Dolomit z Laskowej G.
Piaskowiec z Tumlina
Rys. 7. Średnie wielkości pól powierzchni dla obszarów wyznaczonych przez watershed
Œr. ró¿nice ekstr. lok. [µm]
250
200
150
100
50
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Dolomit z Laskowej G.
Piaskowiec z Tumlina
Rys. 8. Średnie różnice wysokości pomiędzy ekstremami lokalnym na obszarach wyznaczonych przez watershed
Œr. k¹t pom. ekstr. lok. [°]
45
40
35
30
25
20
15
10
5
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Dolomit z Laskowej G.
Piaskowiec z Tumlina
Objêtoœæ obrazu gradientu
Rys. 9. Średni kąt, który tworzy odcinek łączący ekstrema lokalne z płaszczyzną z = 0
1400000
1200000
1000000
800000
600000
400000
200000
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Dolomit z Laskowej G.
Rys. 10. Objętości obrazów gradientów morfologicznych
Piaskowiec z Tumlina
Próg madogramu dla h = 300
Wykorzystanie metod morfologii matematycznej oraz rozpoznawania obrazów do opisu...
169
120
100
80
60
40
20
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Piaskowiec z Tumlina
Dolomit z Laskowej G.
Rys. 11. Wartość progu madogramu dla h = 300 µm
Próg madogramu po filtracji
(h = 300)
60
50
40
30
20
10
0
Wapieñ z Czatkowic
Dolomit z Rêdzin
Kwarcyt z Wiœniówki
Piaskowiec z Tumlina
Dolomit z Laskowej G.
Rys. 12. Wartość progu madogramu profilu chropowatości wyodrębnionego z obrazu przełamu
(próg obliczano dla h = 300 µm)
czym za 100 przyjęto maksymalną zmierzoną wartość dla każdego z przyjętych parametrów. Następnie,
w sposób losowy wyselekcjonowano po 10 pól pomiarowych dla każdej z badanych skał. Parametry opisujące te pola tworzyły ciąg uczący. Pozostałe 81 pól potraktowano jako „nieznane” i poddano procedurze
rozpoznawania. Rezultaty tego rozpoznawania zestawiono w tabeli 1.
Tab. 1. Zestawienie poprawności klasyfikacji przełamów w przestrzeni cech 6D
Metoda
Ilość poprawnych decyzji
Ilość błędnych decyzji
Ilość braków decyzji
NN
αNN (α = 5)
NM
JOK
OOK
MA
77
77
75
31
67
75
4
4
6
0
2
6
0
0
0
50
12
0
Wyniki wskazują na stosunkowo dobre rozpoznanie tak skomplikowanych struktur, jakimi są przełamy
skalne. Można zauważyć, że najlepsze wyniki dają metody minimalnoodległościowe. Zdecydowanie najmniej
poprawnych rozpoznań daje metoda JOK. Mimo więc tego że jako jedyna nie zwraca ona błędnych decyzji,
to jej przydatność wydaje się być niewielka. Rozpatrując metody pod względem wiarygodności rozpoznań
należy zwrócić baczniejszą uwagę na metodę OOK, która również miała niewielką ilość pomyłek, natomiast
o wiele lepiej radziła sobie w rozpoznawaniu od metody JOK.
Aby określić wpływ selekcji przełamów skalnych do ciągu uczącego na wyniki klasyfikacji dokonano,
podobnie jak w poprzednich badaniach – w sposób losowy, selekcji dwóch innych ciągów uczących (cu.2
i cu.3). Wyniki rozpoznań dla tych przypadków zestawiono w tabeli 2.
Tabela pokazuje, że dla rozpatrywanych metod minimalnoodległościowych oraz aproksymacyjnych
zmiana ciągu uczącego wpływa bardzo nieznacznie na zmianę poprawności działania. Większą różnice
widać dla metody OOK, a szczególnie dla metody JOK. Wydaje się także, że przydatność metody JOK
w prezentowanych badaniach jest znikoma.
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
170
Tab. 2. Zestawienie poprawności klasyfikacji przełamów w przestrzeni cech 6D
dla ciągów uczących cu.2 i cu.3 różnych niż w tabeli 1
Metoda
NN
αNN (α = 5)
NM
JOK
OOK
MA
Ilość poprawnych decyzji
cu.2
80
80
79
17
60
80
Ilość błędnych decyzji
cu.3
77
77
75
8
62
72
cu.2
1
1
2
0
0
1
cu.3
4
4
6
0
1
9
Ilość braków decyzji
cu.2
0
0
0
64
21
0
cu.3
0
0
0
73
18
0
Przyjęcie przestrzeni 6D wiązało się z chęcią jak najszerszego opisania badanych przełamów. Jak
dowodzą tabele 3 i 4 nie zawsze jest to konieczne. Tabele te zawężają przestrzeń cech do 3D. W tabeli 3 są
to pierwsze trzy parametry poprzedniej przestrzeni (przedstawione na rys. 7, 8 i 9), a w tabeli 4 następne
trzy parametry (przedstawione na rys. 10, 11 i 12). W tych (i następnych badaniach ) rozpatrywać się będzie
ciąg uczący jak w tabeli 1.
Tab. 3. Zestawienie poprawności klasyfikacji przełamów w przestrzeni cech 3D – parametry jak na rys. 7, 8 i 9
Metoda
Ilość poprawnych decyzji
Ilość błędnych decyzji
Ilość braków decyzji
NN
αNN (α = 5)
NM
JOK
OOK
MA
73
72
71
5
65
69
8
9
10
1
4
12
0
0
0
75
12
0
Tab. 4. Zestawienie poprawności klasyfikacji przełamów w przestrzeni cech 3D– parametry jak na rys. 10, 11 i 12
Metoda
Ilość poprawnych decyzji
Ilość błędnych decyzji
Ilość braków decyzji
NN
αNN (α = 5)
NM
JOK
OOK
MA
77
78
77
43
70
78
4
3
4
0
3
3
0
0
0
38
8
0
Analiza powyższych tabel sugeruje, że wyniki klasyfikacji przełamów zestawione w tabeli 4 są co
najmniej tak dobre jak te zaprezentowane w tabeli 1. Pokazuje to, jak ważnym etapem w opisywanych metodach jest właściwy dobór przestrzeni cech. Możemy podczas niego znacznie uprościć prowadzoną analizę,
jak również poprzez wybór niewłaściwych (z punktu widzenia metody) parametrów znacznie ją utrudnić.
Prezentowane metody analizują wektory cech badanych obiektów (przełamów) w pewnej przestrzeni.
Dlatego, analizując wzajemne ułożenia punktów musimy narzucić pewną metrykę. Do tej pory prowadziliśmy
pomiary w metryce euklidesowej, która wydaje się być najbardziej oczywista:
m
h
re ( x , x ) =
n
( xnm - xnh )
å
n
2
(15)
=1
Niemniej jednak istnieje wiele różnych metryk, które możemy zaimplementować do problemu rozpoznawania obrazów. W tabelach 5 i 6 zestawiono wyniki uzyskane dla przestrzeni 6D oraz metryki ulicznej
(16) oraz Czebyszewa (17).
n
ru ( x , x ) = å xnm - xnh
m
h
(16)
n =1
m
h
ru ( x , x ) = max xnm - xnh
1£ n £ n
(17)
Wykorzystanie metod morfologii matematycznej oraz rozpoznawania obrazów do opisu...
171
Tab. 5. Zestawienie poprawności klasyfikacji przełamów w 6D – metryka Czebyszewa
Metoda
Ilość poprawnych decyzji
Ilość błędnych decyzji
Ilość braków decyzji
NN
αNN (α = 5)
NM
JOK
OOK
MA
78
77
75
18
62
75
3
4
6
0
1
6
0
0
0
63
18
0
Tab. 6. Zestawienie poprawności klasyfikacji przełamów w 6D – metryka uliczna
Metoda
Ilość poprawnych decyzji
Ilość błędnych decyzji
Ilość braków decyzji
NN
αNN (α = 5)
NM
JOK
OOK
MA
78
76
75
36
70
75
3
5
6
1
2
6
0
0
0
44
9
0
Wykorzystanie innych niż euklidesowa metryk prowadzi do niewielkich zmian w działaniu metod
minimalno odległościowych, natomiast znacznie poprawia działanie metod wzorców, szczególnie metody
OOK. Niemniej jednak zasadniczy wniosek z prowadzonych badań pozostaje niezmienny – przy wykorzystaniu proponowanych metody pomiarowych, oraz ograniczając się do pewnej, wybranej uprzednio grupy
skał, jesteśmy w stanie poprawnie klasyfikować badane przełamy rozdzielcze.
5. Wnioski
Przedstawiono podstawy rozpoznawania obrazów, które mogą być wykorzystane do automatycznej
klasyfikacji powierzchni przełamów skalnych odwzorowanych przy użyciu profilomierza laserowego.
Z zaprezentowanych wyników można wnioskować, że najlepiej z postawionym zadaniem radziły
sobie metody minimalnoodległościowe oraz metoda aproksymacyjna. Dawały one stosunkowo duży odsetek
poprawnych klasyfikacji, sięgający nawet ok. 98%. Świadczy to z jednej strony o ich poprawnym działaniu,
z drugiej zaś o doborze właściwych parametrów definiujących przestrzeń cech. Gorzej spisywały się metody
wzorców, co było pewnym zaskoczeniem zwłaszcza przy metodzie OOK.
W rozpoznawaniu obrazów fundamentalne znaczenie ma dobór przestrzeni cech, w której prowadzona
jest klasyfikacja oraz właściwy dobór obiektów definiujących ciągi uczące. Powyższe postulaty sprowadzają
się w zasadzie do wybrania takich parametrów opisujących badane struktury, które będą „grupowały” przełamy poszczególnych skał w odrębne klasy. Idea zdefiniowania takich parametrów na bazie metod analizy
obrazu i morfologii matematycznej towarzyszy od pewnego czasu badaniom prowadzonym w IMG PAN.
Analizując przedstawione w niniejszej pracy wyniki klasyfikacji przełamów skalnych można stwierdzić, że
prace te dały pozytywne rezultaty.
Pracę wykonano w ramach pracy statutowej realizowanej w IMG PAN Kraków w roku 2007, finansowanej przez Ministerstwo Nauki i Szkolnictwa Wyższego.
Literatura
Isaaks E.H., Srivastava R.M., 1989: Applied Geostatistics, Oxford University Press, New York
Młynarczuk M., 1994: Methods of Determining the Fracture Surface Roughness of Rock Samples by Means of a Laser Profilometer, IV International Conference Stereology and Image Analysis in Material Science, STERMAT,
Wisła 1994.
Młynarczuk M., 2004: Możliwości wykorzystania analizy obrazu i morfologii matematycznej do analizy stereologicznej
172
Mariusz Młynarczuk, Teresa Ratajczak, Jarosław Aksamit
struktur skalnych, Archives of Mining Sciences, vol. 49.
Młynarczuk M., Ratajczak T., Sobczyk J., Aksamit J., 2001: Zastosowanie metod automatycznego przetwarzania
obrazów do analizy morfologii powierzchni wybranych próbek skalnych, Prace Instytutu Mechaniki Górotworu
PAN, Vol. 3, No. 3-4.
Młynarczuk M., Ratajczak T., Aksamit J., 2004: Opis powierzchni przełamów wybranych skał metodami morfologii
matematycznej, Prace Instytutu Mechaniki Górotworu PAN, vol. 6, p. 79-92.
Młynarczuk M., Ratajczak T., Aksamit J., 2004: Zastosowanie metod analizy obrazu i profilometrii laserowej do
ilościowej oceny nieciągłości występujących w skałach analizowanych w skali mikro i makro, Prace Instytutu
Mechaniki Górotworu PAN.
Salembier P., Serra J., Beucher S., 1994: Course on Mathematical Morphology and Image Processing, Ecole des Mines
de Paris/Armines.
Serra J., 1982: Image analysis and mathematical morphology, Academic Press.
Serra J., 1988: Introduction to Morphological Filtering, Image Analysis and Mathematical Morphology, Volume II,
Theoretical Advances, ed. J. Serra, Academic Press.
Tadeusiewicz R., Flasiński M., 1991: Rozpoznawanie obrazów, PWN Warszawa.
Tadeusiewicz R., Korohoda P., 1997: Komputerowa analiza i przetwarzanie obrazów, Wydawnictwo Fundacji Postępu
Telekomunikacji, Kraków.
Application of mathematical morphology and pattern recognition to rock fracture analysis
Summary
Paper presents research focused on application of pattern recognition methods to classification of rock fracture. Rock surfaces were measured by means of laser profilometer. Application of mathematical morphology to the
processing of obtained data allows calculating parameters that describe rock fracture surface. In the pattern recognition methodology these parameters may be used to define so called training sets in the feature space. Based on
the training sets we can define decision functions in order to automatically classify the rock fractures. In the paper
several decision functions are listed and their usefulness to rock fracture classification are tested.
Keywords: rock fracture, rock roughness, mathematical morphology, pattern recognition
Recenzent: Dr hab. Marek Gawor, Instytut Mechaniki Górotworu PAN