sterowanie behawioralne ruchem mobilnego robota kołowego z

Transkrypt

sterowanie behawioralne ruchem mobilnego robota kołowego z
MODELOWANIE INŻYNIERSKIE nr 51, ISSN 1896-771X
STEROWANIE BEHAWIORALNE RUCHEM
MOBILNEGO ROBOTA KOŁOWEGO
Z ZASTOSOWANIEM UKŁADÓW Z LOGIKĄ
ROZMYTĄ
Marcin Szuster1a
1
a
Katedra Mechaniki Stosowanej i Robotyki, Politechnika Rzeszowska
[email protected]
Streszczenie
W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pionier 2-DX
w nieznanym środowisku ze statycznymi przeszkodami. Układ sterowania składa się z dwóch warstw: warstwy
planowania trajektorii i warstwy realizacji ruchu. Zadaniem warstwy planowania trajektorii jest generowanie parametrów ruchu kół robota w czasie rzeczywistym na podstawie sygnałów z układu sensorycznego. W warstwie tej
zastosowano koncepcję sterowania behawioralnego, zrealizowanego z zastosowaniem układów z logiką rozmytą.
Warstwa realizacji ruchu generuje sygnały sterowania modułami napędowymi robota, w warstwie tej zastosowano
algorytmy aproksymacyjnego programowania dynamicznego. Weryfikację algorytmu sterowania przeprowadzono
z zastosowaniem robota Pioneer 2-DX, wyposażonego w skaner laserowy przestrzeni.
Słowa kluczowe: aproksymacyjne programowanie dynamiczne, mobilny robot kołowy, sterowanie behawioralne,
sterowanie nadążne, układy z logiką rozmytą
BEHAVIOURAL CONTROL OF THE WHEELED MOBILE
ROBOT USING FUZZY LOGIC SYSTEMS
Summary
In the article a hierarchical control system of the Wheeled Mobile Robot Pioneer 2-DX movement in the unknown environment with static obstacles is presented. The control system consists of two layers: the path planning layer and the tracking control layer. On the basis of the sensory system signals the path planning layer generates the desired trajectory in real time. In this layer of the hierarchical control system, the conception of behavioural control was used. It was realised using Fuzzy Logic systems. The tracking control system is the lower layer
of the hierarchical control system. It generates control signals for the WMR’s motors and is realised using Approximate Dynamic Programming algorithms. Using the WMR Pioneer 2-DX verification of the proposed hierarchical control system was performed. The WMR was equipped with the scanning laser range finder for obstacles
detection.
Keywords: approximate dynamic programming, wheeled mobile robot, behavioral control, tracking control, fuzzy
logic system
1. WSTĘP
Rozwój robotyki mobilnej, który nastąpił w ciągu
ostatnich lat, znacznie poszerzył obszar jej zastosowań.
Jednocześnie możliwa stała się realizacja bardziej skomplikowanych zadań, co pociągnęło za sobą konieczność
zastosowania złożonych algorytmów sterowania robotów
mobilnych. Jednakże nadal jednym z najistotniejszych
problemów pozostaje generowanie w czasie rzeczywistym
bezkolizyjnych trajektorii ruchu mobilnych robotów
kołowych i ich realizacja. W literaturze problem ten jest
często poruszany, co świadczy o jego aktualności i braku
108
Marcin Szuster
uniwersalnych rozwiązań sprawdzających się we wszystkich warunkach.
GS i OA oraz dodatkowy algorytm FL do miękkiego
przełączania realizacji poszczególnych zadań w zależności od warunków środowiska. Takie podejście umożliwia
generowanie bezkolizyjnych trajektorii ruchu w zadaniu
typu „podążaj do celu z omijaniem przeszkód” (GSOA,
ang. Goal Seeking with Obstacle Avoiding). Realizacja
takiego zadania w większości przypadków nie jest możliwa, gdy stosuje się jeden z typów sterowań behawioralnych GS lub OA. W literaturze można spotkać rozwiązania umożliwiające generowanie trajektorii ruchu w
zadaniu typu GSOA, w których udział poszczególnych
sterowań behawioralnych typu GS i OA jest stały,
ustalony w sposób heurystyczny przez autora opracowania. W prezentowanym algorytmie nawigacji udział ten
zmienia się w czasie ruchu WMR w zależności od odległości do celu i przeszkód znajdujących się w otoczeniu
robota. Drugą warstwę hierarchicznego układu sterowania stanowi algorytm sterowania ruchem nadążnym
WMR, który generuje sygnały sterowania modułami
napędowymi zapewniające realizację trajektorii ruchu
wygenerowanej przez warstwę nadrzędną. W warstwie
realizacji ruchu zastosowano algorytmy ADP w konfiguracji Dualnego Heurystycznego Programowania Dynamicznego (DHP, ang. Dual-Heuristic Dynamic Programming), zrealizowane w formie struktur aktorkrytyk, w których zastosowano NN Random Vector
Functional Link (RVFL).
Istnieje wiele różnych metod planowania trajektorii
ruchu mobilnych robotów kołowych (WMR, ang. Wheeled Mobile Robot) [1,2,3,4,7,11,12], wśród których
można wyróżnić dwie główne grupy: metody lokale i
globalne. W metodach globalnych proces planowania
trajektorii ruchu WMR odbywa się off-line, metody te
bazują na znajomości mapy otoczenia robota. W metodach lokalnych algorytm nawigacji wyznacza trajektorię
ruchu, korzystając jedynie z informacji o odległości do
przeszkód w bezpośrednim otoczeniu robota, dostarczanej przez układ sensoryczny. Metody lokalne mogą być
stosowane do generowania trajektorii ruchu w czasie
rzeczywistym, nadają się do nawigacji robota w nieznanym środowisku. Kolejnym problemem dotyczącym
aplikacji robotów mobilnych jest opis ich dynamiki
z zastosowaniem nieliniowych, dynamicznych równań
ruchu, w których niektóre parametry mogą być nieznane
lub zmieniać się w czasie ruchu robota. Powoduje to
konieczność stosowania algorytmów, których parametry
mogą adaptować się do zmieniających się warunków
pracy obiektu sterowania. Obecnie coraz chętniej stosuje
się nowoczesne metody sztucznej inteligencji (AI, ang.
Artificial Intelligence), takie jak sztuczne sieci neuronowe (NN, ang. Neural Networks) czy algorytmy z logiką
rozmytą (FL, ang. Fuzzy Logic), w układach sterowania
ruchem nadążnym WMR, czy algorytmach generowania
trajektorii ruchu [2,3,7,12]. W ostatnich latach można
również zaobserwować znaczący wzrost zainteresowania
algorytmami aproksymacyjnego programowania dynamicznego (ADP, ang. Approximate Dynamic Programming) [13,14,15], których idea wywodzi się z programowania dynamicznego Bellmana, a zastosowanie NN
umożliwia aplikacje w sterowaniu w czasie rzeczywistym
[12,14].
Wyniki badań prezentowane w artykule są kontynuacją prac autora, związanych z algorytmami planowania
trajektorii ruchu [9,10] oraz sterowania ruchem nadążnym WMR [8]. Artykuł składa się z następujących
części: w części pierwszej zawarto wprowadzenie
w tematykę artykułu, część druga zawiera opis obiektu
sterowania, w części trzeciej przedstawiono hierarchiczny
układ sterowania WMR, w części czwartej zaprezentowano budowę stanowiska laboratoryjnego zastosowanego
w badaniach. W części piątej przedstawiono wyniki
badań weryfikacyjnych algorytmu, część ostatnia podsumowuje artykuł.
W artykule zaprezentowano hierarchiczny układ sterowania ruchem mobilnego robota kołowego Pioneer
2-DX. Algorytm sterowania składa się z dwóch warstw.
Pierwsza z nich, nadrzędna, to warstwa generowania
bezkolizyjnych trajektorii ruchu WMR w nieznanym
środowisku 2D ze statycznymi przeszkodami, w której
zastosowano koncepcję sterowania behawioralnego. Idea
sterowania behawioralnego wynika z obserwacji świata
organizmów żywych i odwzorowania ich elementarnych
zachowań typu „podążaj do celu” (GS, ang. Goal
Seeking), czy „omijaj przeszkody” (OA, ang. Obstacle
Avoiding) przez robot mobilny. Algorytmy te są zaliczane do grupy metod lokalnych, w których proces generowania trajektorii ruchu bazuje na sygnałach z układu
sensorycznego WMR Pioneer 2-DX, który w prezentowanym artykule składał się ze skanera laserowego
przestrzeni Hokuyo UBG-04LX-F01. W warstwie planowania trajektorii ruchu zastosowano algorytmy FL do
generowania sterowań behawioralnych w zadaniach typu
2. MOBILNY ROBOT KOŁOWY
PIONEER 2-DX
Obiektem sterowania jest mobilny robot dwukołowy,
z trzecim kołem samonastawnym, Pioneer 2-DX. Ruch
WMR jest analizowany w płaszczyźnie xy. WMR Pioneer 2-DX przedstawiono na rys. 1.a), jego schemat
w torze pomiarowym ze statycznymi przeszkodami
przedstawiono na rys. 1.b). WMR składa się z ramy 4,
dwóch kół napędzających 1 i 2 oraz koła samonastawnego 3. Jest to obiekt nieholonomiczny, którego dynamika
jest opisana nieliniowymi równaniami ruchu. Zadaniem
algorytmu sterowania jest wygenerowanie bezkolizyjnej
trajektorii ruchu WMR do celu G(
, ), znajdującego
się w odległości
od punktu A( , ) ramy robota,
z którym związano ruchomy układ współrzędnych x1y1,
109
STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO…
( – wektor oporów
sił odśrodkowych i Coriolis’a, )'
ruchu, *+
– wektor zakłóceń o ograniczonych wartościach, , – wektor sygnałów sterowania.
gdzie:
- kąt pomiędzy prostą pG a osią x,
- kąt
obrotu ramy WMR,
- kąt pomiędzy prostą pG a osią
x1 ruchomego układu współrzędnych,
,
,
odległości do przeszkód zmierzone przez skaner laserowy
przed WMR, po prawej i lewej stronie ramy robota,
,
,
- kąty pomiędzy osią i-tego pomiaru i
Wyznaczono dyskretne błędy nadążania
-
#
-
osią ramy WMR, i=1,2,3,
- sygnał sterujący j-tego
koła, j=1,2,
- prędkość kątowa j-tego koła.
,
+
#
+
,
(2)
,
(3)
gdzie +
- wektor zadanych kątów obrotu kół, +
wektor zadanych prędkości kątowych, generowany przez
warstwę planowania trajektorii w czasie ruchu WMR.
Na podstawie błędów (2) zdefiniowano uogólniony błąd
nadążania
.
-
! Λ-
gdzie Λ - stała macierz diagonalna o dodatnich współczynnikach.
Na podstawie modelu dynamiki WMR oraz definicji
błędów nadążania (2) i (3) wyznaczono wartość uogólnionego błędu nadążania WMR w kroku k+1
.
#/0 '
#/2
( ! /+ '
! "$ ,
%
,
,
+
(!
+1
(4)
gdzie
/+ '
/0 '
,
/3 '
+
(
,
,
+1
+
"$% &'
/2
(
,
.
+1
(
(
! )'
! /3 '
" Λ-
"$% *+
,
,
+
#
+1
,
(,
+1
,
(,
(5)
gdzie /0 '
Rys. 1 a) Robot Pioneer 2-DX, b) schemat robota mobilnego
w laboratoryjnym torze pomiarowym
tym z zastosowaniem metody Eulera.
Dynamika WMR Pioneer 2-DX została zamodelowana z zastosowaniem formalizmu Maggiego [5,6]. Model
ciągły dynamiki WMR został zdyskretyzowany z zastosowaniem metody Eulera. Przyjęto wektor stanu
,
,
,
w
którym
odpowiada
3. HIERARCHICZNY UKŁAD
STEROWANIA
Hierarchiczny układ sterowania ruchem WMR składa się z dwóch warstw: warstwy generowania bezkolizyjnej trajektorii ruchu WMR, zrealizowanej z zastosowaniem algorytmów FL, oraz warstwy realizacji ruchu,
zrealizowanej z zastosowaniem algorytmu DHP.
wektor
wektorowi
prędkości
kątowych w zapisie ciągłym. Dyskretny model dynamiki
WMR przyjęto w postaci układu równań
# "$
#"$
%
%
&'
*+
!"
(
#,
,
,
! )'
3.1 WARSTWA GENEROWANIA
TRAJEKTORII RUCHU
(
Koncepcja sterowania behawioralnego opiera się na
próbie odwzorowania elementarnych zachowań organizmów żywych przez roboty mobilne. Przykładami takich
zachowań są zadania typu GS i OA. Pierwsze z nich
polega na generowaniu i realizacji trajektorii ruchu
o torze z położenia początkowego, do celu wyznaczonego
we współrzędnych mapy, przy czym nie jest istotna
(1)
gdzie k – indeks kroków iteracji, h – parametr dyskretyzacji czasu, M – dodatnio określona macierz bezwładności WMR Pioneer 2-DX,
– wektor kątów obrotu
kół napędzających, &'
(
( – wektor zawierający wszystkie nielinio-
wości modelu WMR, +1 – wektor zawierający zadane
wartości przyspieszeń kątowych kół napędzających, jego
obecność wynika z zapisu wektora +
w kroku k-
– wektor momentów od
110
Marcin Szuster
informacja o lokalizacji przeszkód w otoczeniu robota.
W drugim z zachowań elementarnych generowana jest
bezkolizyjna trajektoria ruchu, jednak nie jest możliwe
zdefiniowanie celu. W zadaniu tym istotna jest informacja z układu sensorycznego robota o odległościach do
przeszkód. Jednak w robotyce mobilnej najczęściej
spotykane jest zadanie typu GSOA, które jest połączeniem zadań typu GS i OA. Polega ono na wygenerowaniu i realizacji bezkolizyjnej trajektorii ruchu robota do
wyznaczonego celu z ominięciem statycznych przeszkód.
W proponowanym algorytmie sterowania warstwę
planowania
trajektorii
ruchu
zrealizowano
z zastosowaniem układów FL. Składa się ona z trzech
struktur sterowania, z których pierwsza generuje
sygnały sterowania behawioralnego w zadaniu typu GS
,
4
5
,
8 ,
67
druga
struktura
dmx=4 [m] - maksymalny zasięg pomiaru skanera laserowego, 9
min'
,
,
( - minimalna
odległość do przeszkód, i=1,2,3,
,
95
odległość
(/
E
do przeszkód po lewej stronie WMR,
min'
( – minimalna odległość do prze-
E
([ # 0.58 – znormalizowana minimalna odległość
/'
E
do przeszkód po lewej stronie ramy robota,
B
szkód po prawej stronie,
2 4Z
E
/'
E
!
E
B
2 4Z
E
!
([ # 0.58 - znormalizowana
minimalna odległość do przeszkód po prawej stronie
WMR, dGM, dOD, uS – lingwistyczne etykiety funkcji
przynależności do zbiorów rozmytych przesłanek
i konkluzji, gdzie: BM0 – bardzo mały, bliski 0, BM –
bardzo mały, M – mały, S – średni, D – duży, BD –
bardzo duży, BD1 – bardzo duży, bliski 1. Schemat bazy
reguła układu FL pokazano na rys. 2.
warstwy
8 . Trzeci element warstwy generowania
967
min'
EU – minimalna znormalizowana odległość do przeszkód przed WMR,
min'
( – minimalna
E
planowania trajektorii generuje sygnały sterowania
behawioralnego w zadaniu typu OA, ,9
4
B
trajektorii, zrealizowany z zastosowaniem układu FL,
generuje sygnał :; służący do miękkiego przełączania
między realizacją sterowań behawioralnych zadań typu
GS i OA, na podstawie informcji o odległości do celu
oraz odległości do przeszkód, zgodnie z zależnością
,
gdzie
,
4
:;
5
,
,
8
67
! '1 # :;
–
(,9
(6)
,
całkowite
sterowania warstwy generowania trajektorii,
sygnały
5
-
sygnał sterujący zadaną prędkością ruchu punktu
A ramy WMR, 67
- sygnał sterujący zadaną prędkością kątową obrotu ramy WMR 7 . Na podstawie tych
Rys. 2. Schemat bazy reguł
sygnałów są generowane zadane prędkości kątowe obrotu kół napędzających WMR zgodnie z zależnością
=
+
>
+
?
@
AB
A
B
7B
# 7B
C=
5
67
>,
Przestrzenie wejść do układu FL podzielono na 5
zbiorów
trójkątnych i
trapezowych,
natomiast
w konkluzjach zastosowano 7 funkcji przynależności.
Otrzymano powierzchnię modelu FL przedstawioną na
rys. 3.
(7)
gdzie r, l1 – wymiary wynikające z geometrii WMR,
A B - zdefiniowana maksymalna prędkość punktu A,
7 B - maksymalna prędkość kątowa obrotu ramy WMR.
Układ FL generujący sygnał :;
, który zmienia udziął
poszczególnych sterowań behawioralnych w całkowitych
sygnałach
sterowania
warstwy
generowania
bezkolizyjnych trajektorii ruchu, został zealizowany
na podstawie modelu Mamdaniego, z trójkątnymi lub
trapezowymi funkcjami przynależności do zbiorów
rozmytych przesłanek i konkluzji. Posiada on bazę
m=25 reguł typu
DE : JEŻELI '
gdzie
celu,
9
/
B
EU
EU
B
JEST NO( I '
TO :;
JEST :S,
B
9
JEST PQ(
(8)
Rys. 3. Powierzchnia modelu rozmytego.
/ EU - znormalizowana odległość do
- maksymalna odległość do celu, 9B
Z zastosowanej bazy reguł wynika, że jeżeli WMR
znajduje się w pobliżu przeszkód, w generowanej
- znormalizowana odległość do przeszkód,
111
STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO…
1 jeżeli
gdzie gb – macierz diagonalna, ib ,
jk
j l m , w przeciwnym przypadku ib ,
0, m –
dodatnia stała, i=1,2, bB - wektor sygnałów sterowania nadzorującego, wyznaczonych stosując analizę stabilności układu zamkniętego z zastosowaniem teorii
stabilności Lapunova, ha – dodatnio określona macierz
diagonalna wzmocnień regulatora PD.
trajektorii ruchu dominujący udział ma zachowanie typu
OA, gdy WMR znajduje się w pobliżu celu, dominuje
zachowanie typu GS, natomiast w pozostałych
przypadkach wynikowe zachowanie jest połączeniem
zachowań typu GS i OA w różnych proporcjach.
Strukturę generującą sterowania w zadaniu typu GS
zbudowano z zastosowaniem dwóch układów FL.
Generuje ona sygnały sterowania
i
na
5
67
Sygnał sterowania generowanego przez NN RVFL
struktury aktora określony jest zależnością
podstawie znajomości położenia i orientacji ramy WMR
oraz położenia celu. Trajektoria jest generowana w taki
sposób, aby zminimalizować odległość do celu
,
'n
,
(
o
p'q n
(, (13)
gdzie n
– wektor wejść do i-tej NN aktora, o
–
wektor wag warstwy wyjściowej sieci adaptowanych
w czasie ruchu WMR, S(.) – wektor sigmoidlanych
bipolarnych funkcji aktywacji neuronów, DA – macierz
stałych wag warstwy wejściowej.
poprzez ruch ramy WMR w kierunku punktu G, gdy
minimalizowany jest kąt
#
,o
(9)
zawarty między osią ramy WMR a prostą pG.
Strukturę generującą sterowania w zadaniu typu OA
zbudowano z zastosowaniem dwóch układów FL, które
generują sygnały sterowania 95 i 967
na podstawie
Schemat struktury hierarchicznego układu sterowania
ruchem WMR Pioneer 2-DX przedstawiono na rys. 4.
sygnałów z układu sensorycznego WMR. Generowana
jest
bezkolizyjna
trajktoria
ruchu
powodująca
minimalizację błędu
_9
#
B
,
B
(10)
co powoduje ruch WMR środkiem wolnej przestrzeni.
3.2 WARSTWA REALIZACJI RUCHU
Wygenerowana trajektoria jest realizowana przez
warstwę sterowania ruchem nadążnym WMR. W
warstwie tej zastosowano nowoczesne meteody AI w
postaci algorytmów ADP [13,14,15] w konfiguracji DHP,
zrealizowanych z zastosowaniem NN RVFL. Sposób
generowania sygnałów sterowania w algorytmch ADP
bazuje na idei sterowania optymalnego Bellmana,
jednakże dzięki zastosowani metod AI umożliwia
aproksymację funkcji wartości przez NN struktury
krytyka oraz generowanie sygnału sterowania przez NN
struktury aktora. Całkowity sygnał sterowania ruchem
nadążnym
WMR
,
,
składa
Rys. 4. Schemat hierarchicznego układu sterowania
Neuronowy algorytm sterowania ruchem nadążnym
został szczegółowo omówiony w [8].
się
z sygnału sterowania generowanego przez strukurę
aktor-krytyk DHP , , sygnału sterowania regulatora
PD, ,`a
, sygnału sterowania nadzorującego ,b
4. STANOWISKO BADAWCZE
,
Schemat stanowiska badawczego pokazano na rys. 5.
o strukturze wynikającej z analizy stabilności
zamkniętego
układu
sterowania
zrealizowanej
z zastosowaniem teorii stabilności Lapunova, oraz
dodatkowego sygnału sterowania ,c . Całkowity
sygnał sterowania ruchem nadążnym przyjęto w formie
,
d
$e#,
! ,b
# ,`a
# ,c
f, (11)
Rys. 5. Schemat stanowiska badawczego.
gdzie
,b
,c
,`a
" Λ-
gb ,bB
ha .
#
,
,
+1
,
Zaproponowany hierarchiczny układ sterowania
przetestowano na stanowisku badawczym składającym
się z WMR Pioneer 2-DX, wyposażonego w skaner
laserowy przestrzeni Hokuyo UBG-4LX-F01, układu
(12)
112
Marcin Szuster
zasilania oraz komputera PC z kartą kontrolnopomiarową dSpace DS1102, oraz oprogramowaniem
Matlab/Simulink i dSpace ControlDesk.
Zadane położenia GA(4.8, 3.5), GB(9.3, 3.5) i GC(7.0,
0.75) oznaczono symbolami X. Ich lokalizacje dobrano
tak, aby wygenerowanie bezkolizyjnej trajektorii ruchu
WMR do celu nie było możliwe z zastosowaniem sterowań behawioralnych typu GS lub OA. Rozwiązanie tego
problemu wymaga zastosowania algorytmu planowania
trajektorii, który generuje sygnały sterowania będące
połączeniem sterowań behawioralnych zadań typu GS
i OA w odpowiednich proporcjach, w zależności od
warunków środowiska, przez co umożliwia wygenerowanie bezkolizyjnej trajektorii ruchu w złożonym zadaniu
typu GSOA. Na rys. 6a-c można zauważyć występowanie różnic między rzeczywistą mapą otoczenia WMR a
położeniem przeszkód zlokalizowanych przez układ
sensoryczny robota. Wynika to z zakłóceń pojawiających
się w trakcie ruchu WMR po nierównym podłożu, co ma
wpływ na pracę czujnika laserowego przestrzeni, jak
również z niejednolitej faktury powierzchni przeszkód
i ich ustawienia pod różnym kątem do wiązki laserowej.
Kolejnym problemem zaobserwowanym w trakcie realizacji badań było przesunięcie zmierzonego położenia
przeszkód względem mapy rzeczywistej, wynikające
z obliczania lokalizacji przeszkód na podstawie położenia
i orientacji ramy WMR, ustalanych na podstawie pomiaru kąta obrotu kół realizowanego z zastosowaniem
enkoderów inkrementalnych. Pojawiające się błędy
sumują się w czasie ruchu, co wpływa na coraz większe
przesunięcie lokalizacji wykrytych przeszkód w stosunku
do ich rzeczywistego położenia. Wpływ tego zjawiska
można ograniczyć poprzez zastosowanie zewnętrznej
metody lokalizacji WMR w torze pomiarowym.
5. WYNIKI EKSPERYMENTU
Przeprowadzono szereg eksperymentów weryfikujących proces planowania trajektorii oraz realizacji ruchu.
W tym rozdziale, w celu uproszczenia zapisu, pominięto
indeks k w oznaczeniach zmiennych. Przyjęto wartość
h=0.01 [s] parametru dyskretyzacji czasu. Trajektoria
ruchu była generowana w czasie rzeczywistym przez
warstwę nadrzędną hierarchicznego układu sterowania
na bazie sygnałów z układu sensorycznego robota, oraz
realizowana przez warstwę sterowania ruchem nadążnym. Zadanie było uznawane za zrealizowane, jeżeli
w trakcie ruchu WMR nie wystąpiła kolizja z przeszkodą oraz gdy po zakończeniu ruchu punkt A ramy WMR
znalazł się w odległości do celu
r 0.05 [m]. Tory
ruchu WMR z położenia początkowego w punkcie
S(0.6, 0.95), do celu w punktach GA(4.8, 3.5),
GB(9.3, 3.5), GC(7.0, 0.75), wraz z mapą toru pomiarowego i współrzędnymi przeszkód zlokalizowanych przez
czujnik laserowy przestrzeni, oznaczonych szarymi
kropkami, przedstawiono na rys. 6.
otrzymane w trakcie realizacji
Odległości do celu
ruchu WMR przedstawiono na rys. 7. Realizacja bezkolizyjnej trajektorii ruchu WMR do punktu GC(7.0, 0.75)
wymaga chwilowego zwiększenia odległości do zadanego
położenia końcowego w celu ominięcia przeszkody.
Rys. 7. Przebiegi wartości odległości lG do celów GA, GB i GC
Poniżej
przedstawiono
wyniki
eksperymentu
otrzymane w trakcie realizacji ruchu WMR do punktu
GC. Na rys. 8a przedstawiono przebieg wartości współczynnika
koordynacji
sterowań
behawioralnych
aB, generowanego przez układ FL, którego wartość
zależy od odległości do przeszkód, oraz do celu. W czasie
eksperymentu zmiany wartości tego sygnału powodują
zmianę wpływ poszczególnych sterowań behawioralnych
Rys. 6. Mapa otoczenia z torem ruchu robota Pioneer 2-DX do
celu a) GA(4.8, 3.5), b) GB(9.3, 3.5), c) GC(7.0, 0.75)
113
STEROWANIE BEHAWIORALNE RUCHEM MOBILNEGO ROBOTA KOŁOWEGO…
na realizowane zadanie. W czasie stu16; 18y [s] można
zaobserwować wzrost znaczenia sygnałów sterowania
behawioralnego typu OA w całkowitych sygnałach
sterowania, co wynika ze zmniejszenia odległości do
przeszkody. Natomiast po czasie s z 30 [s] następuje
całkowite przełączenie warstwy generowania trajektorii
ruchu na realizację zadania typu GS, ze względu na
odległość do celu. Otrzymane sygnały sterowania warstwy planowania trajektorii ruchu 5 i 67 przedstawio-
fazie ruchu w zależności od odległości do przeszkód,
w sposób zapewniający bezkolizyjny ruchu WMR.
W końcowej fazie ruchu większe znaczenie w całkowitych wartościach sygnałów sterowania mają sygnały
sterowania zadania typu GS, sygnał sterowania 67
zmienia się tak, aby możliwe było osiągnięcie celu GC
przez punkt A ramy WMR.
Na podstawie wartości sygnałów sterowania warstwy
planowania trajektorii ruchu WMR generowano w czasie
ruchu zadane wartości parametrów kątowych obrotu kół
napędzających. Na rys. 9a przedstawiono przebiegi
wartości zadanych prędkości kątowych obrotu kół
napędzających WMR. Zadane parametry ruchu zostały
zrealizowane z zastosowaniem warstwy realizacji ruchu,
poprzez podanie do układów napędowych WMR sygnałów sterowania ruchem nadążnym, pokazanych na rys.
9b. Trajektoria ruchu WMR została zrealizowana
z błędami nadążania, których przebiegi dla i=2 koła
WMR przedstawiono na rys. 9c.
no na rys. 8b, są one połączeniem w odpowiednich
proporcja sygnałów sterowań behawioralnych zadań
typu GS (rys. 8d), oraz OA (rys. 8c), gdzie współczynnikiem proporcjonalności jest wartość sygnału aB.
Rys. 9 a) Przebiegi wartości zadanych prędkości kątowych
obrotu kół 1 i 2 robota, b) przebiegi wartości całkowitych
sygnałów sterowania ruchem nadążnym, c) przebiegi wartości
błędów nadążania koła i=2 robota
Rys. 8 a) Przebieg wartości sygnału aB, b) przebiegi wartości
i 67 , c) przebieg wartości sygnałów sterowania
behawioralnego typu: c) OA ( 95 , 967 ), d) GS ( 5 ,
)
67
sygnałów
5
W warstwie realizacji ruchu hierarchicznego układu
sterowania zastosowano algorytm DHP, w którym
znajdują się NN RVFL o m=8 neuronach każda, realizu-
Wartość sygnału sterowania prędkością kątową obrotu
własnego ramy WMR, 67 , zmienia się w początkowej
114
Marcin Szuster
jące zadania struktur aktora i krytyka. Przyjęto zerowe
wartości początkowe wag sieci. Przebiegi wartości wag
NN i=1 krytyka przedstawiono na rys. 10.
środowisku
2D
ze
statecznymi
przeszkodami,
zastosowano
w
niej
koncepcję
sterowania
behawioralnego. Składa się ona z dwóch struktur
generujących sterowania behawioralne w zadaniach typu
GS i OA, które zostały zrealizowane z zastosowaniam
układów FL, oraz z algorytmu koordynujacego wpływ
poszczególnych sterowań behawioralnych na generowaną
trajektorię ruchu, w zależności od odległości do celu oraz
przeszkód znajdujących się w otoczeniu WMR. Warstwę
realizacji ruchu stanowi układ sterowania ruchem
nadążnym WMR, w którym zastosowano algorytm ADP
w konfiguracji DHP. Algorytm ten składa się z dwóch
struktur,
aktora
oraz
krytyka,
zrealizowanych
z zastosowaniem NN RVFL. Algorytm działa on-line
i nie wymaga fazy uczenia wstępnego wag NN. Wartości
błędów realizacji zadanej trajektorii ruchu, oraz wartości
wag NN pozostają ograniczone w trakcie ruchu WMR
Pioneer 2-DX.
Rys. 10. Przebiegi wartości wag NN i=1 krytyka.
6. PODSUMOWANIE
W artykule przedstawiono hierarchiczny układ
sterowania ruchem WMR Pioneer 2-DX, który składa
się z dwóch warstw. Warstwa nadrzędna generuje
bezkolizyjną trajektorię ruchu robota w nieznanym
Literatura
1.
Arkin R. C.: Behavioural-based robotics. Cambridge: MIT Press, 1998.
2.
Burghardt A: Sterowanie behawioralne minirobota kołowego. „PAK” 2004, Vol. 11, p. 26 - 29.
3.
Drainkov D., Saffiotti A.: Fuzzy logic techniques for autonomous vehicle navigation. New York: Springer, 2001.
4.
Fahimi F.: Autonomous robots : modeling, path planning, and control. New York: Springer, 2009.
5.
Giergiel J., Zylski W.: Description of motion of a mobile robot by Maggie’s Equations. „Journal Theoretical and
Applied Mechanics” 2005, 3, Vol. 43, p. 511 - 521.
6.
Giergiel M., Hendzel Z., Żylski W.: Modelowanie i sterowanie mobilnych robotów kołowych. Warszawa: PWN,
2002.
7.
Hendzel Z.: Fuzzy reactive control of wheeled mobile robot. “Journal Theoretical and Applied Mechanics” 2004,
3, Vol. 42, p. 503 - 517.
8.
Z. Hendzel, M. Szuster: Discrete model-based adaptive critic designs in wheeled mobile robot control.
L. Rutkowski et al. (eds.): ICAISC 2010, Part II, „LNCS” 2010, Vol. 6114, p. 264 - 271.
9.
Z. Hendzel, M. Szuster: Neural dynamic programming in reactive navigation of wheeled mobile robot.
L. Rutkowski et al. (eds.): ICAISC 2012, Part II, „LNCS” 2012, Vol. 7268, p. 450 - 457.
10. Hendzel Z., Szuster M.: Neuronowe programowanie dynamiczne w sterowaniu behawioralnym mobilnym robotem kołowym. „Acta Mech. Automatica” 2011, 1, Vol. 5, p. 28 - 36.
11. Maaref, H., Barret, C.: Sensor-based navigation of a mobile robot in an indoor environment. „Robot. Auton.
Syst.” 2002, Vol. 38, p. 1-18.
12. Millan, J.: Reinforcement learning of goal-directed obstacle-avoiding reaction strategies in an autonomous mobile
robot. „Robot. Auton. Syst.” 1995, 4, Vol. 15, p. 275 - 299.
13. Powell W.B.: Approximate dynamic programming: solving the curses of dimensionality. Princeton: WilleyInterscience, 2007.
14. Prokhorov D., Wunch D.: Adaptive critic designs. „IEEE Trans. Neural Netw” 1997, Vol. 8, p. 997 - 1007.
15. Si, J., Barto, A.G., Powell, W.B., Wunsch, D.: Handbook of learning and approximate dynamic programming.
IEEE Press, Wiley-Interscience, 2004.
115