Pobierz artykuł PDF

Transkrypt

Pobierz artykuł PDF
WYKORZYSTANIE TECHNIK EWOLUCYJNYCH W PROCESIE
NOWOCZESNEJ PERSONALIZACJI PORTALI INTERNETOWYCH
TOMASZ STA
Katedra Inynierii Wiedzy
Akademia Ekonomiczna w Katowicach
Streszczenie
Wikszo wysiłków projektantów portali internetowych skupia si na etapach
zintegrowania rónorodnych zasobów w portalu oraz na jego wdroeniu. Okazuje
si, e udostpnienie zasobów informacyjnych w portalu jest niewystarczajce do
efektywnego jego wykorzystania. W Globalnej Sieci Informatycznej kady uytkownik
chce by traktowany indywidualnie i jednoczenie chce maksymalnie skróci czas
wyszukiwania odpowiedniej dla siebie informacji. Istotne staj si wic zagadnienia
personalizacji zasobów. W artykule autor wskazuje na moliwo wykorzystania algorytmów mrowiskowych wspomagajcych proces nowoczesnej personalizacji na
przykładzie portalu informacyjnego uczelni.
Słowa kluczowe: portale internetowe, personalizacja zasobów, algorytmy mrowiskowe
1. Nowoczesna personalizacja
Personalizacja (w szerokim ujciu) to dostosowanie aplikacji (jej ustawie
, sposobu działania
lub wygldu) do indywidualnych potrzeb uytkownika. To proces pozwalajcy na dopasowanie
interfejsu oraz adaptacj funkcjonalnoci, struktury i treci w celu sprostania preferencjom pojedynczego uytkownika. [1]. W odniesieniu do stron internetowych personalizacja to „wykorzystanie znanych, odkrytych profili preferencji uytkowników do dynamicznego dostosowywania zawartoci serwisu na potrzeby poszczególnych uytkowników”[2]. Proces personalizacji mona
okreli jako masow indywidualizacj, oferowanie szerokiemu audytorium konkretnych, dostosowanych do upodoba
zasobów. Najwikszym priorytetem personalizacji jest usatysfakcjonowanie odbiorcy poprzez oferowanie mu właciwych treci, produktów i usług.
Proces personalizacji realizowany jest poprzez mechanizmy, które umoliwiaj realizacja tzw.
cyklu personalizacji [3]. Na cykl ten (przedstawiony na rysunku 1) składaj si:
• stałe utrzymywanie aktualnej i spójnej wiedzy na temat uytkownika,
• planowanie kontaktu z uytkownikiem na podstawie tej wiedzy,
• kontakt przeprowadzany w sposób umoliwiajcy poszerzanie wiedzy o uytkowniku.
POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ
Seria: Studia i Materiały, nr 8, 2007
131
Rys. 1. Cykl personalizacji- na podstawie [3]
Cykl personalizacji powinien by realizowany nieprzerwanie, przez co moliwa bdzie adaptacja wyników procesu personalizacji do nieustannie zmieniajcych si warunków, w jakich funkcjonuje portal i jego uytkownicy (zmiany organizacyjne w firmie, zmiany preferencji uytkowników, dynamiczne zmiany zasobów informacyjnych, itp.)
Analizujc moliwoci personalizacji internetowego portalu informacyjnego naley wyodrbni personalizacj treci oraz personalizacj formy (prezentacji)[4]. Personalizowanie treci polega
na oferowaniu uytkownikowi zasobów informacyjnych w odpowiedniej iloci i zawartoci (np.
stopniu szczegółowoci) w celu przyspieszenia pracy z tymi informacjami. Ten rodzaj personalizacji zwalnia uytkownika z uciliwej operacji przeszukiwania zasobów i poszukiwania potrzebnych w danym momencie informacji [5]. Odpowiednia strategia personalizowania treci w portalu
moe by jednym z najwaniejszych czynników wpływajcych na efektywno pracy jego uytkowników.
Do personalizowanych treci (zawartoci) zaliczy mona równie wszelkiego typu przekazy
reklamowe (banery, informacje, odnoniki sponsorowane, itp.). Odpowiednie personalizowanie
treci marketingowych moe sta si istotnym czynnikiem w procesie pozyskiwania nowych klientów, informowania otoczenia przedsibiorstwa o ofercie firmy, a w pewnych okolicznociach
moe sta si dodatkowym ródłem dochodów dla właciciela portalu.
Szczególnym przypadkiem personalizacji treci jest personalizacja nawigacji, czyli odpowiedni dobór elementów ukazujcych si uytkownikowi, za pomoc których moe on porusza
si po zasobach portalu. W pewnych sytuacjach okaza si moe celowe oferowanie takich samych elementów, odsyłajcych jednak uytkownika do rónych zasobów. Przykładowo logo korporacji bdzie odnonikiem do oferty przedsibiorstwa lub strony głównej dla uytkowników
spoza organizacji lub te to samo logo moe by odnonikiem do zasobów informacyjnych przeznaczonych dla okrelonej grupy pracowników korporacji.
Drugim rodzajem personalizacji jest personalizacja prezentacji (formy), która umoliwia
uytkownikowi stworzenie własnego fragmentu portalu, poprzez dokonanie wyboru elementów
(ich liczby) układu, kolorystyki, itp. Personalizacja formy dotyczy de facto wygldu interfejsu
uytkownika. Ten rodzaj personalizacji jest szczególnie wskazany, gdy uytkownik ma do dyspozycji wiele elementów mogcych zawiera informacje czy usługi oferowane przez portal. Personalizacja formy pozwala wybra sposób prezentacji najistotniejszych elementów i umoliwia ułoe-
132
Tomasz Sta
Wykorzystanie technik ewolucyjnych w procesie nowoczesnej personalizacji portali internetowych
nie ich na ekranie w sposób odpowiadajcy preferencjom uytkownika. Ten rodzaj personalizacji
pozwala równie na zredukowanie liczby elementów ukazujcych si na ekranie do podzbioru
elementów najczciej wykorzystywanych. W tym przypadku jednak efekt podobny mona uzyska wykorzystujc personalizacj treci.
Wikszo obecnie funkcjonujcych witryn i portali udostpniajcych procesu personalizacji
oferuje bardzo ograniczone instrumentarium. Najczciej przeprowadzane działania umoliwiajce
personalizacj portalu zostały przedstawione w pracy [6].
Podobnie jak zmienia si cały Internet, równie proces personalizacji rozwija si, staje si coraz bardziej nowoczesny. Aby personalizacj mona było okreli mianem nowoczesnej musi ona
spełnia kilka przesłanek. Nowoczesna personalizacja powinna by (por. [7]):
• dynamiczna – konieczne jest reagowanie w czasie rzeczywistym na działania
uytkownika, poprzez analiz wybieranych przez uytkownika odnoników
i zasobów, czy inne bardziej skomplikowane techniki np. analiz połoenie kursora
manipulatora,
• inteligentna - wykorzystujca techniki odkrywania wiedzy,
• automatyczna – jej celem jest odcienie uytkownika i przerzucenie wikszoci
operacji zwizanych z personalizacj na system komputerowy,
• transparentna dla uytkownika.
Obecnie w zakresie udostpniania uytkownikowi informacji w portalu wykorzystuje si kilka
strategii. Jednym ze stosowanych rozwiza
jest umoliwienie pracownikowi samodzielnego zdefiniowania zasobów informacyjnych najbardziej go interesujcych. Inn moliwoci jest wykorzystanie mechanizmu ról uytkowników. Działania te realizowane s z daleko posunitym nadzorem – uytkownika portalu, bd grupy administratorów odpowiedzialnych za przydział odpowiednich ról do zasobów portalu. Trudno zatem w tych przypadkach mówi o przeprowadzaniu
nowoczesnej personalizacji.
Jedn z moliwoci realizacji procesu nowoczesnej personalizacji jest, zdaniem autora, wykorzystanie technik ewolucyjnych, a szczególnie algorytmów mrowiskowych.
2. Techniki ewolucyjne w procesie personalizacji
Celem nowoczesnej personalizacji jest przeniesienie odpowiedzialnoci za dostosowywanie
prezentowanych zawartoci z uytkownika na system komputerowy. Algorytm realizujcy ten
proces powinien nalee do grupy systemów uczcych si. Koncepcja systemów uczcych si nie
jest nowa, jednak ze wzgldu na stale rosnce moliwoci obliczeniowe współczesnych komputerów, wykorzystywana jest coraz szerzej, majc zastosowanie do rozwizywania rónorodnych
problemów.
Jedn z wielu metod uczenia si maszyn jest uczenie si ze wzmocnieniem.
W rozpatrywanym problemie personalizacji portalu ten rodzaj uczenia si wydaje si szczególnie
przydatny, gdy bazuje na interakcji systemu uczcego si ze rodowiskiem, a za takie rodowisko, w którym działaj uytkownicy, mona uzna zasoby portalu internetowego.
Proces uczenia si maszyn mona oprze nie tylko na metodach deterministycznych. Naley
odnotowa, i od kilku lat stale wzrasta zainteresowanie stochastycznymi algorytmami rozwizujcymi problemy optymalizacyjne za pomoc mechanizmu uczenia si. Podpowiedziane przez
przyrod techniki ewolucyjne zdaj si wypiera cigle popularne dzi metody deterministyczne i
ze swojej natury s predestynowane do zastosowania w systemach uczcych si ze wzmocnieniem.
POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ
Seria: Studia i Materiały, nr 8, 2007
133
Do młodszych przedstawicieli technik ewolucyjnych nale algorytmy mrowiskowe, których
koncepcja przestawiona została na pocztku lat dziewidziesitych XX wieku, a powstała wskutek dokładnej analizy zachowania si organizmów ywych w ich rodowisku naturalnym. Spojrzenie na załoenia funkcjonowania algorytmów mrowiskowych moe skłania do porówna
rodowiska naturalnego eksplorowanego przez mrówki i portalu, w którym paralelnie pracuje wielu
uytkowników. Wykorzystujc t analogi autor proponuje stworzenie mechanizmu uczcego si
zachowa
uytkownika portalu, a tym samym mechanizmu umoliwiajcego przeprowadzanie
procesu nowoczesnej personalizacji. Przedstawienie ródeł powstania algorytmów mrowiskowych,
zasady ich funkcjonowania, niezbdne załoenia implementacyjne zostały przedstawione midzy
innymi w pracach [8],[9],[10]. Zarysowujc problematyk funkcjonowania algorytmów mrowiskowych mona stwierdzi, i sensem ich działania jest kooperacja mrówek (agentów) za pomoc
pozostawianego ladu zapachowego (nazywanego feromonem – cigle wzmacnianego - autokataliza), podczas eksplorowania dynamicznego rodowiska w jakich yj kolejne pokolenia mrówek.
Najwaniejszym elementem wyróniajcym algorytmy mrowiskowe od innych technik ewolucyjnych (na przykład algorytmów genetycznych) jest wykorzystywanie w algorytmach mrowiskowych zjawisk współdziałania zachodzcych pomidzy agentami (mrówkami) rozwizujcymi
dany problem optymalizacyjny.
Wykorzystanie algorytmu mrowiskowego w procesie personalizacji portalu korporacyjnego
wymaga formalnego zdefiniowania rodowiska, w którym pracowa bd agenci eksplorujcy
zasoby portalu, oraz okrelenia parametrów algorytmu. Algorytm mrowiskowy umoliwiajcy
doskonalenie portalu korporacyjnego mona zdefiniowa w nastpujcy sposób:
AM = [ (N,E), m , pijl (t)]
gdzie:
N – zbiór adresów stron portalu, ew. zasobów informacyjnych (wzłów grafu),
E – elementów zawierajcych odnoniki doprowadzajce do danego zasobu (zbiór wzłów grafu),
m – liczba agentów działajcych w kadej iteracji algorytmu,
p – prawdopodobie
stwo wyboru kolejnego stanu.
Prawdopodobie
stwo przejcia agenta ze strony i na stron j poprzez odnonik l dla k-tej
mrówki w chwili t obliczane jest według wzoru:
[τ ijl ( t ) ] * [η ijl ]β
β
p ijl ( t ) = [τ ij ( t ) ] * [η ij ]
j
0
gdy
j ∈ Z
d
j∉ Zd
gdzie:
- parametr okrelajcy istotno zasobu portalu
η - parametr okrelajcy wag adresu wynikajcy z parametrów personalizacji
– wielko ladu feromonowego
134
Tomasz Sta
Wykorzystanie technik ewolucyjnych w procesie nowoczesnej personalizacji portali internetowych
Zd – zbiór zasobów informacyjnych portalu dostpnych dla uytkownika
Wielko nowego, nakładanego przez poszczególnego agenta (mrówk) ladu feromonowego,
uwzgldniajc modyfikacj algorytmu ‘feromon cykliczny’ mona wyrazi wzorem:
kij(t,t+n)
1
= Lk
0
jesli k - ta mrówka uyw krawedzi (i, j)
w przeciwnym przypadku
gdzie Lk – ocena trasy wyznaczonej przez k-t mrówk
W całym algorytmie ogromnie istotny jest dobór parametrów pocztkowych oraz funkcja celu, czyli sposób oceniania, wartociowania rozwiza
otrzymanych przez poszczególne mrówki
eksplorujce zasoby informacyjne portalu. Jednoczenie naley minimalizowa złoono obliczeniow algorytmu. Dokładne wyjanienie zawiłoci algorytmu wykracza poza ramy (i moliwoci
objtociowe) niniejszego artykułu.
Koncepcja wykorzystania algorytmów mrowiskowych w przeprowadzaniu procesu nowoczesnej personalizacji jest uniwersalna, niezalena od rozwizania portalowego. Moe zosta wykorzystana w komercyjnych rozwizaniach portalowych dedykowanych dla konkretnej firmy, jak
równie w portalach (czy szablonach portali) dystrybuowanych na zasadzie licencji kodu otwartego (open source). Przykładem portalu, w których próbuje si wdroy przedstawion koncepcj
jest powstajcy serwis informacyjny Akademii Ekonomicznej w Katowicach.
3. Moliwoci wykorzystania algorytmów mrowiskowych w portalu uczelni
Przez stosunkowo długi okres czasu serwis internetowy uczelni był zbiorem statycznych stron
utworzonych w jzyku HTML. Strony te obejmowały wszystkie jednostki organizacyjne uczelni,
a dziki mechanizmowi styli prezentowały si w jednolity sposób, sprawiajc i uytkownik miał
wraenie korzystania z rozwizania portalowego. Taka statyczna organizacja serwisu informacyjnego uniemoliwiała w praktyce prezentowanie wanych, acz krótko aktualnych informacji
z ycia Uczelni, przyczyniała si równie do publikowania informacji, które przestały odpowiada
stanowi faktycznemu (np. informacje o tytułach i stopniach naukowych pracowników, prowadzonych przedmiotach, godzinach konsultacji, planach zaj, itp.).
W 2004 roku rozpoczły si prace nad stworzeniem zupełnie nowego serwisu informacyjnego
uczelni, wykorzystujcego technologi internetowych baz danych, jzyków skryptowych itp.,
a wic serwisu aspirujcego do miana portalu Uczelni. Sukcesywnie wdraane zmiany przyczyniły
si do bardzo istotnego skoku jakociowego, a co najwaniejsze dla autora, dynamiczne prezentowanie zasobów informacyjnych uczelni przechowywanych w bazie danych umoliwiło podjcie
próby praktycznego wykorzystania koncepcji algorytmu mrowiskowego w procesie doskonalenia
portalu na przykładzie tworzonego rozwizania portalowego Uczelni.
Wykorzystano funkcjonujcy portal i zmodyfikowano jego struktur bazy danych oraz sposób
wywietlania zawartoci. Rysunek 2 przedstawia najistotniejszy fragment bazy danych obsługujcej portal uczelniany. Szarym kolorem zaznaczono dwie tabele, które zostały utworzone na potrzeby algorytmu mrowiskowego i procesu personalizacji. Zakres modyfikacji struktury bazy danych portalu został zminimalizowany, poniewa w rozpatrywanym problemie ogromnie istotna
POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ
Seria: Studia i Materiały, nr 8, 2007
135
jest szybko działania algorytmu personalizujcego. W jednym momencie z zasobów portalu
moe korzysta wielu uytkowników, a kady z nich (zgodnie z postulatami nowoczesnej personalizacji) powinien zosta traktowany w sposób indywidualny, dodatkowo w sposób przezroczysty
(dla uytkownika istotny powinien by efekt działania algorytmu, nie za sam proces wykonywania oblicze
).
Rys.2. Fragment struktury bazy danych portalu
Przeprowadzona symulacja algorytmu mrowiskowego personalizujcego tre portalu uczelni
umoliwiła utworzenie strony internetowej przedstawionej na rysunku 3. Elementem, który powstał dziki eksploracji rodowiska zasobów przez mrówki jest prawy panel z odnonikami (nad
kalendarzem), reszta elementów portalu tworzona jest bez uwzgldnienia procesu personalizacji.
Przeprowadzony eksperyment potwierdził moliwo wykorzystania algorytmu mrowiskowego,
pokazał jednak słaboci w przyjtej przez autora modyfikacji algorytmu, wskazał równie dalsze
kierunki działa
.
Odnonik ‘Rekrutacja’ pojawił si jako najbardziej dopasowany do wymaga
uytkownika,
gdy rzeczywicie w rozpatrywanym okresie (koniec semestru letniego) informacje rekrutacyjne
bardzo czsto były w centrum zainteresowania uytkowników korzystajcych w portalu uczelni.
Ze wzgldu na przyjte parametry zasobu oraz informacje zgromadzone w bazie danych na licie
pojawił si odnonik do harmonogramu zaj. Zdaniem autora, wybór tego zasobu przez algorytm
został podyktowany działaniem studentów, którzy nie korzystajc z moliwoci zalogowania si
(przeprowadzenia procesu identyfikacji i autoryzacji) sprawdzali harmonogram roku akademickiego. Kolejnym zauwaonym utrudnieniem jest opisywanie zasobów. W portalu istnieje odnonik
o nazwie ‘tutaj’, który prowadzi do dokumentu w formacie PDF. Algorytm wybrał ten zasób,
136
Tomasz Sta
Wykorzystanie technik ewolucyjnych w procesie nowoczesnej personalizacji portali internetowych
jednak skorzystał ze standardowego opisu, który wyrwany z kontekstu nie informuje uytkownika,
a nawet wprowadza go w błd. Na licie odnoników zaproponowanych przez algorytm znalazł si
równie link do dystrybucji systemu operacyjnego Linux (Knoppix), prawdopodobnie dlatego, e
zasób ten był w centrum zainteresowania studentów wykorzystujcych go na jednym z przedmiotów zaj, a brak procesu logowaniu uniemoliwił dokładniejsz identyfikacj uytkownika.
Rys. 3. Strona główna portalu AE w Katowicach – z prawej strony panel z personalizowanymi
odnonikami
4. Podsumowanie
Wykorzystywanie mechanizmu personalizacji w portalach internetowych stało si koniecznoci. Szczególn uwag naley skierowa w stron nowoczesnej personalizacji, która uwzgldnia
powinna dynamik zmian zasobów portalu, a nade wszystko powinna by przeprowadzana
w sposób zautomatyzowany. Zastosowanie technik ewolucyjnych (systemów uczcych si)
w procesie personalizacji umoliwia spełnienie przez ten proces kryteriów nowoczesnoci.
Przeprowadzona symulacja na przykładzie portalu Akademii Ekonomicznej w Katowicach
ukazuje moliwoci wykorzystania algorytmów mrowiskowych w procesie personalizacji treci.
Aby oferowany uytkownikowi zbiór zasobów był jak najbardziej zgodny z oczekiwaniami uytkownika niezbdne wydaje si wykorzystanie (w sytuacjach gdy to moliwe) mechanizmu identy-
POLSKIE STOWARZYSZENIE ZARZDZANIA WIEDZ
Seria: Studia i Materiały, nr 8, 2007
137
fikacji i autoryzacji uytkownika w portalu. Konieczne wydaje si wprowadzenie dodatkowych
mechanizmów filtrowania, niezbdne równie jest odpowiednie opisanie zasobów portalu, tak aby
mogły by prezentowane oddzielnie, niezalenie od kontekstu w jakim wystpuj w portalu. Jak
wskazuje cykl personalizacji wraz z przyrostem wiedzy o uytkownikach portalu bdzie równie
rosła dokładno mechanizmu personalizacji. Naley oczekiwa, i testowane algorytmu przez
odpowiednio długi okres czasu zwikszy adekwatno prezentowanych zasobów, a tym samym
zwikszy zadowolenie uytkowników.
Zdaniem autora celowe jest prowadzenie dalszych bada
nad moliwociami wykorzystania
algorytmów mrowiskowych, które odpowiednio sparametryzowane i zastosowane powinny umoliwia stworzenie efektywnego mechanizmu nowoczesnej personalizacji.
Bibliografia
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Chen Y., Magoulas G.: Adaptable and Adaptive Hyper-media Systems. IRM Press, 2005.
Mobasher B., Cooley R., Srivastava J.: Creating Adaptive Web Sites Through Usage-Based
Clustering of URLs. Proc. Of the 1999 IEEE Knowledge and Data Engineering Exchange
Workshop, 1999.
Personalization Cycle. http://www.borland.com
Gołuchowski J.: Technologie informatyczne w zarzdzaniu wiedz w organizacji. Wydawnictwo Akademii Ekonomicznej im. K. Adamieckiego w Katowicach. 2005
Ruas F., Meira W., Araujo P., Ribeiro F.: Modeling Web Site Personalization Strategies. Department of Computer Science Federal University of Minas Gerais. Brazil 2000.
Adamczyk J.: Rodzaje stron internetowych. Internet 2002.
Stawarz T.: Teoretyczne podstawy adaptacyjnych stron, techniki odkrywania wiedzy stosowane do ich personalizacji oraz modułowa implementacja takich rozwiza.
http://datamining.home.pl/_pdfy/sta04teo.pdf
Boryczka U., Boryczka M.: Ewolucja w Systemach Mrówkowych, Instytut Informatyki Stosowanej, Uniwersytet lski 1996.
Sta T.: Perspektywy wykorzystania systemów ewolucyjnych na potrzeby doskonalenia portali
korporacyjnych. Systemy Wspomagania Organizacji 2004. Praca zbiorowa pod red. Teresy
Porbskiej-Mic i Henryka Sroki. Wydawnictwo Akademii Ekonomicznej w Katowicach.
2003.
Sta T.: Zastosowanie modyfikacji algorytmów mrowiskowych w procesie optymalizacji
połcze
komunikacyjnych (Bus Routing Problem). Systemy Wspomagania Organizacji 2000.
Praca zbiorowa pod red. Jerzego Gołuchowskiego i Henryka Sroki. Wydawnictwo Akademii
Ekonomicznej w Katowicach. 2000.
138
Tomasz Sta
Wykorzystanie technik ewolucyjnych w procesie nowoczesnej personalizacji portali internetowych
USAGE OF EVOLUTIONARY TECHNIQUES IN A PROCESS OF MODERN
PERSONALIZATION OF INTERENT PORTALS
Summary
In majority, designers of Internet portals focus their efforts on stages of integration of differentiated resources of the portal and on its implementation. It was appeared that making available information recourses in Internet portal is not sufficient for its efficient usage.
In Global Information Network each user wants to be treated individually and
simultaneously wants to shorten time of searching of appropriate for him information. So, there are essential issues of personalization of recourses. In the paper author shows possibility of usage of anthill algorithms supporting a process of modern
personalization on a case of information portal of university.
Keywords: Internet portals, knowledge personalization, anthill algorithms
TOMASZ STA
e-mail: [email protected]
Katedra Inynierii Wiedzy
Akademia Ekonomiczna w Katowicach
ul. Bogucicka 3, 40-287 Katowice