sztuczne sieci neuronowe w oszacowaniu zużycia technicznego

Transkrypt

sztuczne sieci neuronowe w oszacowaniu zużycia technicznego
Udostępnione na prawach rękopisu, 8.04.2014r.
Publikacja: Knyziak P., "Sztuczne sieci neuronowe w oszacowaniu zużycia technicznego
prefabrykowanych budynków mieszkalnych" (Artificial Neuronal Networks In Estimation Of
The Technical Deterioration For Prefabricated Residential Buildings), Theoretical foundations
of civil engineering. Polish-Ukrainian-Lithuanian transactions, vol. 16, Oficyna Wydawnicza
Politechniki Warszawskiej, Warszawa 2008, s. 435-442, ISBN 978-83-7207-763-9 (artykuł
konferencyjny - XVII Polish-Russian-Slovak Seminar "Theoretical Foundation of Civil
Engineering" Warsaw-Wroclaw, Poland, 02 - 08 June 2008)
SZTUCZNE SIECI NEURONOWE
W OSZACOWANIU ZUŻYCIA TECHNICZNEGO
PREFABRYKOWANYCH BUDYNKÓW MIESZKALNYCH
Piotr KNYZIAK
Wydział Inżynierii Lądowej - Politechnika Warszawska
1. Wstęp
Oceny zużycia technicznego budynku można dokonać jedną z kilku metod. Różnią się one
szczegółowością podejścia, wymogami odnośnie nakładów pracy i czasu potrzebnego na ich
wykonanie oraz wykorzystaniem ekspertyz.
Istniejące metody oceny zużycia technicznego albo dają wyniki, pozwalające jedynie z
grubsza oszacować zużycie budynków (metody czasowe) – te nadają się właściwie wyłącznie
do celów księgowania amortyzacji, albo pozwalają na bardzo szczegółową ocenę (metody
wizualne) – w celu precyzyjnego określenia stanu każdego elementu budynku (włącznie z
prowadzeniem odkrywek i badań laboratoryjnych) i przygotowania harmonogramu remontów
bieżących lub remontu generalnego. Brak jest metody zapewniającej możliwość szacowania
zużycia technicznego, określania wartości odniesienia, wartości nominalnej. W związku z
powyższym poszukiwane są nowe rozwiązania, które przy rozpatrywaniu zużycia
technicznego wielu budynków pomogłyby w oszacowaniu ich bieżącej wartości i
pozwoliłyby na prognozowanie zmian. Dodatkowym efektem wykorzystywania nowej
metody powinno być również ułatwienie prowadzenia polityki remontowej w spółdzielniach
mieszkaniowych.
Jednym ze sposobów szacowania może być analiza danych za pomocą sztucznych sieci
neuronowych (SSN). Zajmując się jakimś problemem zazwyczaj na początku staramy się
zbudować algorytm, gdyż dążymy do rozwiązań precyzyjnych. Dopiero, jeśli ten sposób
zawodzi szukamy innych rozwiązań. Sposób w jaki poznajemy zagadnienia zależny jest od
ich złożoności, najprostsze są rozwiązywane algorytmiczne, przy dużej złożoności potrzebne
jest wnioskowanie indukcyjne. W tej klasie mieszczą się sztuczne sieci neuronowe (zobacz
rys. 1). Są one narzędziem, które pozwala na przetwarzanie dużej liczby danych i jest mało
wrażliwe na błędy. Wśród tych danych mogą być te naprawdę istotne, ale i te które można
pominąć. Szczegółowa ich analiza pozwala odpowiedzieć na pytanie, co należy badać
dokładnie a co wystarczy jedynie oszacować na podstawie łatwo dostępnych informacji. Z
natury SSN wynika uzyskiwanie przybliżonych wartości, lecz należy wziąć pod uwagę, że
wszystkie metody cechują się określonym stopniem dokładności.
Rys. 1. Sieci neuronowe a wnioskowanie [1]
W poniższej pracy przedstawiono metodę określania zużycia technicznego budynków
prefabrykowanych za pomocą sztucznych sieci neuronowych. Prace polegały na analizie
różnych zakresów danych za pomocą różnych typów SSN. Wybrany został optymalny typ
sieci oraz topologia. Przeprowadzona została analiza wrażliwości sieci na dobór parametrów z
bazy danych. Zostały porównanie wyniki otrzymane metodą tradycyjną z wynikami
otrzymywanymi za pomocą sztucznych sieci neuronowych.
Prace mające na celu wykorzystanie metod sztucznej inteligencji do określania zużycia
technicznego budynków długo użytkowanych (wybudowanych do 1918r.) były już w
pewnym zakresie prowadzane. Analizowano jednak budynki wykonane z elementów
drobnowymiarowych, najczęściej o drewnianej konstrukcji stropów międzypiętrowych i
drewnianej konstrukcji dachu. Budynki prefabrykowane są użytkowane od niecałych
pięćdziesięciu lat, mają inne cechy i wymagają odrębnej analizy. Prawie w całości
nadzorowane są przez spółdzielnie mieszkaniowe lub w ostatnich latach przez zrzeszenia
mieszkańców, więc można przyjąć, że ciągle jest nad nimi sprawowany specjalistyczny
nadzór. Niniejsza praca bazuje na wnikliwej analizie historii remontów budynków, ich stanu
technicznego oraz analizie skuteczności zastosowania różnych typów i topologii sztucznych
sieci neuronowych.
2. Dane i wstępne przetwarzane
Dane zbierano od stycznia 2005 roku do marca 2006 roku w 15 osiedlach 11 spółdzielni
mieszkaniowych w Warszawie. W bazie danych zawarto informacje o 95 budynkach, w tym
33 budynkach wielkoblokowych i 62 wielkopłytowych. W każdym osiedlu wybrano kilka
reprezentatywnych budynków. Zbierano dane w trakcie przeglądów oraz informacje o
przeglądach i remontach z istniejącej dokumentacji budynków. Wykonano dokumentację
fotograficzną. Przeglądy przeprowadzono w większości w okresie zimowo-wiosennym, gdy
uwidacznia się najwięcej usterek.
W szczególny sposób położono nacisk na uzyskanie zarówno szczegółowych danych o
obecnym stanie jednostkowych obiektów jak i całych osiedli budynków mieszkalnych.
Stworzona na podstawie zebranych osobiście przez autora danych baza pozwoliła nie tylko na
całościową ocenę budynków, ale również na analizę stanu elementów składowych (wykonano
zestawienie danych oraz zdjęcia wad i uszkodzeń).
Analizowane budynki, w trakcie wykonanych oględzin, były w dobrym ogólnym stanie
technicznym. Nie wykazywały widocznych oznak, które świadczyłyby o jakimkolwiek
niebezpieczeństwie, które mogłoby grozić ich mieszkańcom. Rysunek 1 przedstawia wyniki
oceny zużycia budynków z bazy danych wykonanej metodą wizualną [3][7].
Rys. 2. Zużycie budynków z bazy danych [1]
W początkowej fazie prac wykonano wstępne przetwarzanie danych. W wyniku analizy
danych wyodrębniono 3 grupy parametrów do przetwarzania za pomocą SSN. Grupę I
stanowiły dane bezpośrednio związane z oceną stanu technicznego elementów budynku.
Wykorzystując tą grupę jako dane wejściowe uzyskano najlepsze efekty uczenia sieci. W tej
grupie znalazły się parametry:
• rok budowy,
• stan balkonów i loggii,
• stan tynków zewnętrznych,
• stan stolarki okiennej mieszkań,
• stan przewodów instalacji c.o.,
• stan przewodów inst. wody zimnej i ciepłej,
• stan pokrycia dachu,
• stan izol. termicznej ścian osłonowych,
• stan izol. termicznej ścian szczytowych,
• stan izol. termicznej dachu.
II grupę stanowił zbiór 10 parametrów zawierających informacje o uszkodzeniach i
koniecznych remontach elementów budynku.
III grupę stanowił zbiór 5 parametrów zawierających informacje związane z
oddziaływaniem otoczenia na budynek.
Wyodrębnione parametry w większości wykazywały, co najwyżej średnią korelację z
danymi odnośnie zużycia wg metody wizualnej. Wartości korelacji mogły wynikać z
ograniczonego zakresu ocen, jaki był stosowany do oceny stanu elementów.
Skalowanie i normalizacja przeprowadzana była w zależności od przyjętej funkcji
aktywacji neuronów. Wstępne przeskalowanie polegało na podzieleniu wartości przez różnicę
pomiędzy wartością maksymalną i minimalną. Wartości powyższe mogły być pobrane z
danych lub przyjęte przez autora. Np. dla danych typu „rok budowy” przyjęto, iż minimalna
wartość czasu użytkowania to 10 lat, gdyż w 1995r. oddano w Warszawie ostatnie budynki
prefabrykowane a wartość maksymalna to 55, gdyż w 1957 roku oddano pierwsze budynki
(zbieranie danych odbywało się od 7.01.2005r. do 23.03.2006r.)
3. Uczenie i testowanie różnych typów sztucznych sieci neuronowych
W celu usystematyzowania prac przyjęto następującą metodykę analizy stanu technicznego
budynków za pomocą sztucznych sieci neuronowych:
• przygotowanie bazy danych dla budynków wykonanych z elementów
prefabrykowanych,
• wstępne przetworzenie danych z bazy, dobór sygnałów wejściowych,
• dobór typu i architektury sieci,
• analiza wrażliwości, ograniczenie liczby sygnałów wejściowych,
• wykorzystanie nauczonej sieci do określania stanu technicznego budynków nie
należących do bazy danych.
Podstawą metody jest uczenie sieci neuronowej na podstawie znanych wartości.
Problemami do rozwiązania były:
• określenie jak najmniejszego zbioru parametrów (na podstawie którego dokładność
wyników jest wystarczająca) - w ramach wcześniejszych prac wyznaczone zostały
zawężone zbiory parametrów,
• dobór typu sieci,
• dobór topologii sieci,
• dobór metody i parametrów uczenia sieci.
Sztuczne sieci neuronowe były uczone z wykorzystaniem danych o zużyciu budynków
uzyskanych wg metody wizualnej (wartości przedstawia rys. 1). Zużycie może przyjmować
różnorodne wartości dla poszczególnych lat użytkowania budynków.
Zbiór danych do analizy przy wykorzystaniu I, II i III grupy parametrów posortowano ze
względu na wartości kolumn: rok budowy i zużycie wg metody wizualnej. Następnie
dokonano podziału zbioru danych na 7 części. Każda z części zawierała 13-14 rekordów.
Sprawdzono czy dane do poszczególnych grup dobrane zostały z całego przedziału wartości i
czy nie tworzą skupisk. Następnie przyjęto podział na podzbiory:
• zbiór uczący – 5 części,
• zbiór weryfikujący – 1 część,
• zbiór testujący – 1 część.
W procesie testowania i testowania różnych rodzajów sieci wykorzystano sieci typu:
• MLP - Multilayer Perceptron,
• RBF - Radial Basis Function,
• SVM - Support Vector Machine.
Przyjęto klasyczny algorytm doboru typu i topologii sztucznej sieci neuronowej:
1. przygotowanie bazy danych zawierającej przykłady,
2. przetwarzanie danych - skalowanie, normalizacja, standaryzacja, zmniejszanie
wymiarowości problemu,
3. dobór elementów z rekordów danych,
4. podział danych na grupy: danych uczących, danych weryfikujących, danych
testujących,
5. wybór typu i topologii sztucznej sieci neuronowej,
6. wybór algorytmu uczenia i ustalenie jego parametrów,
7. uczenie sieci,
8. weryfikacja jakości otrzymywanych wyników,
9. powtarzanie kroków (5, 6, 7) w celu optymalizacji architektury sieci neuronowej,
10. analiza danych niewykorzystywanych w procesie uczenia z wykorzystaniem
optymalnej sieci.
W procesie modelowania sieci doświadczalnie dobierano topologie i parametry sieci
starając się uzyskać najlepszy rezultat. Przyjmowano za wyznaczniki dobrej jakości sieci
następujące przesłanki:
• współczynnik korelacji wyników - bliski 1,
• wartości błędów uczenia i weryfikacji - niskie i podobnej wartości.
W procesie uczenia sieci wykorzystywano następujące kryteria zakończenia, tzw. kryteria
stopu:
• osiągnięcie założonej maksymalnej liczby epok – zawsze wykorzystywane ze
względu na konieczność ograniczenia procesów nie spełniających innych
warunków,
• błąd walidacji zaczyna się zwiększać (z możliwością zatrzymania po określonej
dodatkowo liczbie epok).
4. Wybór najlepszego modelu sieci
Zestawienie najlepszych wyników dla poszczególnych grup parametrów i typów sieci
przedstawia Tabela. 1. Spośród wszystkich wyników najlepszy osiągnęła sieć typu MLP o
architekturze 10-4-1 (1 warstwa ukryta z 4 neuronami, sigmoidalna funkcja aktywacji
„TanhAxon”, gradientowa metoda uczenia z momentem o wartości 0.8) wykorzystująca jako
sygnały wejściowe do sieci I grupę parametrów.
4,74
0,51
58,7
19,8
1,59
35,6
0,9852
SVM-01
24,51
35,20
3,48
403,2
50,5
3,89
111,9
0,8946
MLP-03
27,14
25,03
6,53
490,4
68,8
5,53
143,5
0,7755
RBF-02
30,17
24,57
5,50
413,2
60,5
3,62
180,5
0,7712
SVM-01
60,79
32,40
16,23
1220,1
99,3
2,24
323,0
0,4106
MLP-03
45,97
55,02
6,53
491,0
70,0
2,71
159,9
0,7879
RBF-14
50,25
64,78
6,97
524,1
67,0
0,29
174,4
0,7773
SVM-01
105,99
109,12
11,52
865,9
93,9
18,66
179,7
0,4556
II
III
r- współczynnik
korelacji
9,43
Max Abs Error
- testowanie
RBF-14
Min Abs Error
- testowanie
1,99
MAE testowanie
2,63
NMSE testowanie
Min. MSE uczenie
MLP-05
MSE testowanie
Typ i numer sieci
I
x 10-3
0,30
34,4
Min. MSE weryfikacja
Grupa parametrów
Tabela. 1. Zestawienie wyników dla różnych grup parametrów i różnych typów SSN
13,6
0,74
30,4
0,9873
MSE - pierwiastek błędu średniokwadratowego, NMSE - MSE/wariancja), MAE - średni błąd absolutny,
Min/Max Abs Error – najmniejszy/największy błąd absolutny, wartość „r” -współczynnik korelacji.
Analizując wyniki otrzymane przy użyciu I grupy parametrów można dojść do wniosku, iż
pozwala ona stosunkowo dobrze oszacować wartość zużycia budynku. Szczególnie wyniki
otrzymane z wykorzystaniem sieci typu MLP cechują się niskimi wartościami wszystkich
typów błędów. Parametry należące do II grupy pozwalają uzyskać wyniki o znacznym
rozrzucie w stosunku do wartości porównawczych. Współczynnik korelacji dla sieci typu
MLP i RBF pozostaje dla tych przykładów na stosunkowo wysokim poziomie (do 0,7755),
dla sieci typu SVM przyjmuje już niskie wartości (do 0,4106). Parametry należące do III
grupy w najmniejszym stopniu nadają się do szacowania wartości zużycia budynków.
Otrzymywane wyniki przyjmują „spłaszczone” wartości, tzn. dla różnych wartości danych
oryginalnych uzyskiwane są jednakowe lub podobne wartości wyjściowe z sieci. Mimo, iż
współczynnik korelacji dla sieci typu MLP i RBF pozostaje wysoki to pozostałe typy błędów
przyjmują znacząco większe wartości.
Rys. 3. Porównanie wartości zużycia budynków z bazy danych
i obliczonych przez najlepszą sieć
Otrzymywane wyniki w poszczególnych próbach (po 15-100 symulacji w każdej), dla
danych typów sieci i grup parametrów, co do wartości nie odbiegały od siebie w znaczącym
stopniu. W wyniku poszukiwania optymalnych parametrów uczenia sieci uzyskiwano wyniki
w niewielkim stopniu lepsze od wcześniejszych. Uzyskanie wyniku lepszego lub gorszego od
innych w dużym stopniu uzależnione było od początkowego doboru wag i tego czy w
procesie uczenia udało się osiągnąć minimum jak najbardziej zbliżone do minimum
globalnego.
5. Analiza wrażliwości
W kolejnym kroku prac dokonano analizy wrażliwości sieci na dobór parametrów z bazy
danych. Do analizy wykorzystano I grupę parametrów i najlepszą topologię sieci uzyskaną w
trakcie wcześniejszych prac. Przyjęto klasyczny algorytm analizy wrażliwości sieci na dobór
parametrów z bazy danych:
1. przyjęcie „dużej sieci” wg wcześniej wytypowanego typu i architektury, uczenie,
testowanie, określenie błędu wyników,
2. zmniejszanie sieci o 1 element, kolejno dla wszystkich „i” elementów, uczenie,
testowanie, określenie błędu,
3. odrzucenie najmniej istotnych elementów – poniżej pewnego progu,
4. odrzucanie kolejnych elementów (powtarzanie kroków 2 i 3) aż do uzyskania
niewielkiego wektora wejść,
5. ustalenie parametrów dla których uzyskano zadowalające odpowiedzi sieci
neuronowej.
Przeprowadzone kolejne symulacje polegające na ograniczaniu liczby parametrów
doprowadziły do uzyskania pięciu parametrów w najistotniejszy sposób wpływających na
wynik oszacowania wartości zużycia technicznego budynku:
• stolarka okienna mieszkań,
• przewody inst. wody zimnej i ciepłej,
• pokrycie dachu,
• izolacja termiczna ścian osłonowych,
• izolacja termiczna ścian szczytowych
Analizując wszystkie wyniki uznano, że sieć działająca na bazie pieciu parametrów może
spełniać stawiane wymagania. Uzyskiwane wyniki w dużej mierze uzyskują dokładność 10%
a nieliczne przekraczają 20%. Wyniki działania tej sieci w porównaniu do wyników
otrzymanych metodą tradycyjną przedstawia rysunek 2.
Rys. 4. Wyniki dla sieci bazującej na pięciu parametrach
6. Podsumowanie i wnioski
Zaproponowana metoda szacowania wartości zużycia technicznego prefabrykowanych
budynków mieszkalnych za pomocą sztucznych sieci neuronowych mogłaby być
wykorzystywana efektywnie w zasadzie dla dużych zespołów budynków. Poważne awarie i
uszkodzenia mogą być odkrywane jedynie bezpośrednio, w trakcie corocznych kontroli
budynków i żadne metody teoretyczne ich nie zastąpią. Jednak dla uzyskania orientacyjnego
poziomu odniesienia i przybliżonego oszacowania dla wielu zastosowań mogłaby to być
metoda bardzo użyteczna. Należy w tym miejscu zauważyć, że obecnie wykonywane
oszacowania zużycia budynków dla celów ubezpieczeniowych opierają się zazwyczaj na
metodach czasowych, które są znacznie mniej precyzyjne. Jedną z ważnych zalet metody jest
obiektywizm, wyniki w małym stopniu zależą od subiektywnych ocen osób wykonujących
przeglądy.
Do komercyjnego wykorzystania metoda ta powinna zostać przystosowana głównie
poprzez rozszerzenie typów budynków, rozszerzenie bazy danych, stworzenie
komputerowych programów obsługi ułatwiających pracę.
Analizując otrzymane wyniki można sformułować następujące wnioski:
• Sztuczne sieci neuronowe są efektywnym narzędziem szacowania zużycia
technicznego prefabrykowanych budynków mieszkalnych.
• Najlepszy wynik oszacowania osiągnięto dla sieci typu Multilayer Perceptron o
architekturze 10-4-1. Osiągnięty współczynnik korelacji równy 0.9873 należy
uznać za wysoki a wartości błędów (np. MSE = 0.0003, MAE = 0.0136) za niskie.
• Przeprowadzone symulacje doboru różnych typów i topologii sieci dla trzech grup
parametrów pozwoliły na wyłonienie grupy 10 parametrów na podstawie których
możliwe jest szacowanie wartości zużycia budynków z dobrą dokładnością.
Większość
oszacowań
zużycia
wykonanych
jest
z
dokładnością
nieprzekraczającą 10%.
• Przeprowadzona analiza wrażliwości sieci na dobór parametrów z bazy danych
pozwoliła dokonać wyboru grupy parametrów w najistotniejszy sposób
wpływających na dokładność oszacowania.
• Zaproponowana metoda może znaleźć zastosowanie w praktyce inżynierskiej.
7. Literatura
[1] Knyziak P.: Analiza stanu technicznego prefabrykowanych budynków mieszkalnych za
pomocą sztucznych sieci neuronowych. Rozprawa doktorska. Wydział Inżynierii
Lądowej, Politechnika Warszawska. 2007.
[2] Knyziak P., Witkowski M.: Ocena stanu technicznego prefabrykowanych budynków
mieszkalnych w Warszawie. Inżynieria i Budownictwo, 12/2007, s.639-641.
[3] Lewicki B.: Metodyka oceny stanu technicznego konstrukcji budynków
wielkopłytowych. Instytut Techniki Budowlanej, Warszawa 2002.
[4] Runkiewicz L., Szymański J.: Uszkodzenia i zagrożenia występujące w budynkach
mieszkalnych wielkopłytowych. V Konferencja „Warsztat Pracy Rzeczoznawcy
Budowlanego. Kielce 1999.
[5] Thierry J.: Remonty budynków i wzmacnianie konstrukcji. Arkady. Warszawa 1982.
[6] Waszczyszyn Z., Urbański P.: Neuronowa predykcja stopnia zużycia technicznego
budynków mieszkalnych, XLVIII Konf. Naukowa KILiW PAN i KN PZITB, OpoleKrynica, 365-372, 2002.
[7] Zużycie obiektów budowlanych. WACETOB, Warszawa 2000.
ARTIFICIAL NEURONAL NETWORKS IN ESTIMATION OF THE TECHNICAL
DETERIORATION FOR PREFABRICATED RESIDENTIAL BUILDINGS
This paper presents the method of analysis of the technical deterioration of prefabricated
buildings using artificial neural networks. The data ware analyzed using several different
types and many topologies of the ANN. Optimal type and topology of the net ware chosen.
Analyze of sensitivity for data ware performed. Results received from traditional method and
from ANN were compared.