Opracowanie - Instytut Łączności

Transkrypt

Opracowanie - Instytut Łączności
Zakład Sieci (Z-2)
WYBRANE ASPEKTY
ELEKTRONICZNEJ ŁĄCZNOŚCI MULTIMEDIALNEJ
STOSOWANEJ W NOWOCZESNYCH JEDNOSTKACH
SAMORZADOWEJ ADMINISTRACJI PUBLICZNEJ
Zadanie nr 3
Metody pomiarowe do oceny parametrów QoS platformy łączności
elektronicznej używanej do udostępniania usług multimedialnych na potrzeby
nowoczesnych jednostek administracji samorządowej
Praca nr 02 30 001 8
Warszawa - Miedzeszyn
Grudzień 2008 r.
- 1 -
Zakład Sieci (Z-2)
Zadanie nr 3
Metody pomiarowe do oceny parametrów QoS platformy łączności
elektronicznej używanej do udostępniania usług multimedialnych na potrzeby
nowoczesnych jednostek administracji samorządowej
Praca nr 02 30 001 8
Kierownik projektu:
Opracował zespół w składzie:
mgr inż. Dariusz Gacoń
mgr inż. Gut Henryk – kierownik zadania
inż. Waldemar Latoszek
inż. Sylwester Nowak
mgr inż. Jacek Saniewski
mgr inż. Włodzimierz Zalewski
Warszawa - Miedzeszyn
Grudzień 2008 r.
- 2 -
SPIS TREŚCI
1 WPROWADZENIE................................................................................................................... 4
1.1 Wstęp....................................................................................................................................... 4
1.2 Przedmiot i cel pracy ............................................................................................................. 5
2 USŁUGI MULTIMEDIALNE STOSOWANE W NOWOCZESNYCH URZĘDACH
JEDNOSTEK SAMORZĄDOWYCH – WYMAGANIA NA JAKOŚĆ PRZEKAZU
MULTIMEDIALNEGO ........................................................................................................... 6
2.1 Uwagi ogólne........................................................................................................................... 6
2.2 Wideotelefonia ........................................................................................................................ 7
2.2.1 Charakterystyka funkcjonalna usługi.............................................................................................7
2.2.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................10
2.3 Wideokonferencja ................................................................................................................ 11
2.3.1 Charakterystyka funkcjonalna usługi...........................................................................................11
2.3.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................12
2.4 Wideotekst – usługi transakcyjne....................................................................................... 13
2.4.1 Charakterystyka funkcjonalna usługi...........................................................................................13
2.4.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................13
3 ANALIZA WPŁYWU PARAMETRÓW QoS PLATFORMY ŁĄCZNOŚCI
ELEKTRONICZNEJ NA JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO .................... 14
3.1 Model odniesienia komunikacji multimedialnej nowoczesnego urzędu jednostki
samorządowej ....................................................................................................................... 14
3.2 Analiza wpływu parametrów QoS warstwy dostępowej na jakość przekazu
aplikacji multimedialnych................................................................................................... 15
3.3 Analiza wpływu parametrów QoS warstwy szkieletowej na jakość przekazu
aplikacji multimedialnych................................................................................................... 20
4 PRZEGLĄD I CHARAKTERYSTYKA OGÓLNA METOD OCENY JAKOŚCI
PRZEKAZU MULTIMEDIALNEGO .................................................................................. 24
4.1 Uwagi ogólne......................................................................................................................... 24
4.2 Metody oceny subiektywnej ................................................................................................ 25
4.3 Metody oceny obiektywnej .................................................................................................. 27
4.4 Parametryczne metody oceny ............................................................................................. 32
5 PODSUMOWANIE................................................................................................................. 34
LITERATURA ............................................................................................................................ 35
ZAŁĄCZNIK 1: Specyfikacja pomiarów podstawowych parametrów QoS dla sieci
pakietowych oraz jakości usług VoIP i IP TV ................................................................... 38
- 3 -
1
WPROWADZENIE
1.1 Wstęp
Przemiany społeczno-gospodarcze, które dokonują się obecnie w krajach wysoko
rozwiniętych i w Polsce, mogą być postrzegane jako proces transformacji społeczeństwa
przemysłowego w społeczeństwo informacyjne XXI-wieku. Przemianom tym towarzyszy
intensywny rozwój zarówno technik informatycznych (komputery, oprogramowanie), jak i
telekomunikacyjnych. Te ostatnie migrują w kierunku inteligentnych sieci telekomunikacyjnych,
umożliwiających świadczenie tzw. usług „około telefonicznych” oraz – usług przekazywania
wiadomości za pomocą co najmniej dwóch środków przekazu, takich jak mowa, ruchomy obraz,
grafika itp., zwanych często mediami. Potrzeba wprowadzenia takiej kompleksowej wymiany
informacji występuje zarówno w systemach informacji naukowej, medycznej, jak i w systemach
edukacyjnych, bankowych, czy też w systemach komunikacji elektronicznej, używanych coraz
częściej przez jednostki samorządowe administracji publicznej. Tę nową technikę komunikacji
tworzą z jednej strony potrzeby bardziej ekspresyjnego, czyli multimedialnego komunikowania
się ludzi, zaś z drugiej strony – wzrost możliwości operacyjnych sprzętu komputerowego i coraz
to większa przepływność współczesnych systemów telekomunikacyjnych.
Drugim wyraźnie wyeksponowanym trendem w rozwoju współczesnej telekomunikacji
jest rozwój struktur sieciowych w kierunku jednolitej, konwergentnej architektury sieciowej
opartej na szybkiej transmisji pakietowej z rodziną protokołów TCP/IP. Obecnie protokoły te są
stosowane nie tylko w komputerowych sieciach rozległych, takich jak sieć Internet, ale także w
sieciach lokalnych i coraz częściej w sieciach telekomunikacyjnych. Telekomunikacja XXIwieku to zatem wielo-medialna wymiana wiadomości cyfrowych, przesyłanych w jednolitej
strukturze pakietów niezależnie od tego, czy pakiety te zawierają zakodowane sygnały audio
i/lub wideo, czy też sygnały transmisji danych.
- 4 -
1.2 Przedmiot i cel pracy
Wyżej nakreślona wizja konwergentnej sieci telekomunikacyjnej z jednolitym protokołem
komunikacyjnym, takim jak protokół TCP/IP sieci Internet, jest niewątpliwie rozwiązaniem
kuszącym. Jednakże urealnienie tej wizji w skali globalnej, przy obecnym stanie
technologicznym, nie jest przedsięwzięciem technicznie prostym, i jako takie wymaga
rozwiązania wielu trudnych problemów. Szereg z nich koncentruje się wokół problematyki
gwarantowania odpowiedniego poziomu jakości usług transportowych dla przekazów
multimedialnych z zastosowaniem tego typu sieci.
Wprowadzenie elektronicznych form kontaktu urzędu z obywatelem, a także –
komunikacji elektronicznej pomiędzy komórkami organizacyjnymi wewnątrz danego urzędu,
czy też między urzędami różnych szczebli, wynikające z inicjatywy eEurope 1 , wymaga budowy
odpowiedniej infrastruktury teleinformatycznej w urzędach jako takich oraz wdrożenia
szerokiego zakresu usług sieciowych. Z uwagi na ważność i poufność przekazywanych danych
oraz multimedialny charakter tych przekazów, realizacja tych usług powinna być oparta na
rozwiązaniach organizacyjnych i sieciowych gwarantujących jakość oferowanych usług QoS (od
ang. Quality of Sernice). Problematyka ta, odniesiona do systemów komunikacji multimedialnej
nowoczesnych urzędów jednostek samorządowych opartych na pakietowej łączności
elektronicznej, jest przedmiotem niniejszej pracy. W szczególności praca ta zawiera:
⎫
opis funkcjonalny usług multimedialnych, takich jak: wideotelefonia, wideokonferencja i
wideotekst, które są lub mogą być stosowane w nowoczesnych urzędach jednostek
samorządowych oraz specyfikację parametrów QoS (na poziomie aplikacji) dla tych usług
(rozdz. 2);
⎫
specyfikację platformy łączności elektronicznej systemów łączności multimedialnej wyżej
wymienionych urzędów oraz analizę wpływu parametrów transmisyjnych tej platformy na
jakość aplikacji multimedialnych stosowanych w tych urzędach (rozdz. 3);
⎫
przegląd i charakterystykę ogólną wybranych metod do oceny przekazu multimedialnego z
grupy metod oceny subiektywnej, obiektywnej i parametrycznej (rozdz. 4) oraz
⎫
specyfikacje pomiarów podstawowych parametrów QoS dla sieci pakietowych oraz
pomiarów jakości usług VoIP i IP TV, z użyciem analizatora sieci IP firmy Agilent typu
N2620A, zakupionego ze środków inwestycyjnych IŁ-PIB z 2008 roku.
1
Zapisy zawarte w Inicjatywie eEurope zobowiązują organy administracji publicznej wszystkich i państw
członkowskich Unii Europejskiej, a zatem i Polski, do świadczenia usług na rzecz obywateli i przedsiębiorców w
oparciu o łączność elektroniczną i komunikację multimedialną.
- 5 -
2
USŁUGI MULTIMEDIALNE STOSOWANE W NOWOCZESNYCH
URZĘDACH JEDNOSTEK SAMORZĄDOWYCH – WYMAGANIA NA
JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO
2.1 Uwagi ogólne
Najogólniej rzecz biorąc, usługi multimedialne to taka kategoria łączności, która
umożliwia zdalne przekazywanie wiadomości pomiędzy odbiorcami za pomocą co najmniej
dwóch środków przekazu, takich jak: mowa, ruchomy obraz, tekst, grafika, itp., zwanych często
mediami. Zwykle usługi te są utożsamiane z tzw. serwerami usług, które reprezentują sobą
pewne zestawy urządzeń, realizujących funkcje przechowywania i udostępniania materiału
multimedialnego związanego z danymi usługami. Serwery określonych usług multimedialnych
są zależne od tych usług i są przez nie całkowicie definiowane. Z tego względu w dalszej części
pracy nie będą omawiane techniczne rozwiązania serwerów, lecz jedynie usługi, które je
funkcjonalnie definiują.
Usługi multimedialne, realizując w ramach sesji wiele połączeń telekomunikacyjnych,
mogą łączyć ze sobą wielu uczestników, a także dodawać i/lub usuwać źródła informacji, czy też
dołączać dodatkowych uczestników sesji lub ich eliminować. Usługi te są powszechnie
kojarzone z takimi pojęciami, jak: biblioteka wideo, programy edukacyjne, tele-zakupy, usługi
bankowe, wideotelefonia, wideokonferencja, poczta elektroniczna, gry komputerowe, wideo na
żądanie, serwis informacyjny i reklamowy itd. Powołana przez Międzynarodową Unię
Telekomunikacyjną specjalna Komisja Studiów SG16 (Multimedia Services and Systems)
wszystkie te aplikacje sklasyfikowała w pięć, standaryzowanych kategorii usług
multimedialnych, takich jak:
⎫ wideotelefonia,
⎫ wideotekst,
⎫ interaktywna prezentacja audiowizualna,
⎫ wideokonferencja oraz
⎫ telekonferencja audiograficzna.
Jak wcześniej wspomniano, inicjatywa eEurope zobowiązuje organy władzy publicznej do
świadczenia usług na rzecz obywateli i przedsiębiorców w oparciu o łączność elektroniczną i
komunikację multimedialną. Wprowadzenie elektronicznych form kontaktu urzędu z
obywatelem, a także – komunikacji elektronicznej pomiędzy komórkami organizacyjnymi
wewnątrz danego urzędu, czy też między urzędami różnych szczebli, rzecz jasna nie będzie
obejmować wszystkich z wyżej wymienionych kategorii usług multimedialnych. Uwzględniając
specyfikę tych kontaktów z jednej strony i korzyści ze stosowania elektronicznych form
kontaktu ze strony drugiej, można zaryzykować stwierdzenie, że kontakty te będą realizowane z
wykorzystaniem jedynie trzech kategorii usług multimedialnych, takich jak: wideotelefonia
(PSTN lub IP), wideokonferencja (PSTN lub IP) oraz niektóre aplikacje wideotekstowe (e-mail,
elektroniczna skrzynka podawcza, EDI, strony informacyjne WWW), realizowane głównie na
bazie sieci Internet. Z tego względu tylko te kategorie usług multimedialnych są omawiane w
dalszej części rozdziału. W odniesieniu do każdej z nich podaje się krótką charakterystykę
funkcjonalną usługi oraz specyfikuje się wymagania odnośnie tych parametrów QoS jakości
świadczenia usługi na poziomie aplikacji, które są istotne dla tych aplikacji.
- 6 -
2.2 Wideotelefonia
2.2.1 Charakterystyka funkcjonalna usługi
Wideotelefonia jest rozumiana jako [17, 24] usługa telekonwersacji audiowizualnej, która
umożliwia przeprowadzanie na bieżąco dwukierunkowej, symetrycznej transmisji głosu i
ruchomych kolorowych obrazów pomiędzy dwoma dowolnymi abonentami, za pomocą
istniejących sieci telekomunikacyjnych. Usługa ta może być dostępna za pośrednictwem
urządzeń terminalowych wolno stojących, tzw. wideotelefonów lub odpowiednio wyposażonych
komputerów osobistych typu IBM PC.
Za datę wprowadzenia wideotelefonii uważa się powszechnie rok 1964, kiedy to
amerykańska firma AT&T po raz pierwszy zaprezentowała urządzenie umożliwiające
równoczesny przekaz głosu i wolnozmiennych obrazów osób rozmawiających z użyciem
publicznej komutowanej sieci telefonicznej. W początkowym okresie rozwoju, wideotelefonia ze
względu na wysokie koszty zarówno urządzeń terminalowych, jak eksploatacji była dedykowana
głównie dla abonentów biznesowych i z tego względu rozwijała się bardzo wolno. Na przełomie
lat 1990/1991 na rynku pojawiły się wideotelefony nowej generacji, umożliwiające przesyłanie
głosu i ruchomego obrazu z szybkością odświeżania ok.20 ramek/sek.. Przykładem takich
urządzeń jest wideotelefon T-View 100 firmy Alcatel. Wyglądem zewnętrznym przypomina on
typowy telefon (rys. 2.2-1), uzupełniony ekranem ciekłokrystalicznym i wbudowaną w niego
mini-kamerą telewizyjną. Na ekranie wyświetlany jest obraz ruchomy, przedstawiający na ogół
rozmówcę z drugiego końca łącza, zaś kamera filmuje twarz osoby korzystającej z
wideotelefonu. W ten sposób abonenci połączenia wideofonicznego słyszą i widzą się
nawzajem.
Rys. 2.2-1. Wideotelefon stacjonarny T-View 100 firmy Alcatel
Od 1999 roku usługa wideotelefonii jest także oferowana w sieciach UMTS telefonii
komórkowej trzeciej generacji 2 . Tak jak wideotelefon stacjonarny, wideokomórka ma
wbudowaną kamerę cyfrową i kolorowy ekran ciekłokrystaliczny, i jest wyposażona w
odpowiednie kodeki gwarantujące identyczną jakość dźwięku jak przy połączeniach
2 Telefon komórkowy o takich możliwościach zaprezentowała między innymi firma Panasonic na wystawie CeBIT 2000
w Hanowerze
- 7 -
„kablowych”. Wideokomórka ma także wbudowany interfejs PC Card, który jest używany do
komunikacji z komputerem PC z prędkością 76,8 kbit/s.
Inną, burzliwie rozwijającą się formą wideotelefonii jest komunikacja multimedialna z
użyciem sieci IP, realizowana pomiędzy komputerami osobistymi wyposażonymi w kamery
telewizyjne i odpowiednie oprogramowanie. W celu zapewnienia jednolitego standardu dla
implementacji tej usługi w sieciach IP, w ramach prac normalizacyjnych ITU-T opracowano
zalecenie H.323 [30], specyfikujące architekturę (rys. 2.2-2), która umożliwia realizację
połączeń wideo-telefonicznych w sieciach pakietowych, pomiędzy urządzeniami pochodzącymi
od różnych producentów.
Urządzenia
wej/wyj audio
Kodek audio
G.711, G.722
G.723, G.728, G.729
Kodek wideo
H.261, H.263
Warsttwa H.225.0
Urządzenia
we/wy wideo
Aplikacje danych
użytkownika
Kontrola systemu
Interfejs
użytkownika do
kontroli i
zarządzania
Interfejs do sieci
RTP
Zarządzanie H.245
Sygnalizacja Q.931
Kontrola RAS
Rys. 2.2-2. Struktura terminalu H.323
Typowe terminale wideo-telefoniczne na ogół generują ciągły strumień danych utworzony
z dwóch wzajemnie zsynchronizowanych strumieni medialnych, z których jeden przenosi
sygnały audio, zaś drugi – sygnały wideo. Sygnały audio są poddawane procesowi kompresji,
który może być realizowany zgodnie z jednym z niżej wymienionych zaleceń:
⎫ G.711 ITU-T (kodowanie podstawowego sygnału telefonicznego, z pasmem od 300 do
3400 Hz, sygnałem cyfrowym o przepływności 64 kbit/s);
⎫ G.722 ITU-T (kodowanie sygnału audio z pasmem użytkowym 50 – 7000 Hz strumieniem
cyfrowym o przepływności 64 kbit/s);
⎫ G.723 ITU-T (kodowanie podstawowego sygnału telefonicznego sygnałem cyfrowym o
przepływności: 40 kbit/s, 32 kbit/s lub 24 kbit/s);
⎫ G.723.1 ITU-T (kodowanie sygnału audio dostosowane do potrzeb standardu H.324 dla
sieci z transmisją modemową, wykorzystujące algorytm ACELP, który zmniejsza
wymaganą przepływność binarną sygnału cyfrowego do 5,3 kbit/s lub do 6,4 kbit/s);
⎫ G.728 ITU-T (kodowanie sygnału telefonicznego z pasmem użytkowym od 300 do 3400 Hz
sygnałem cyfrowym o przepływności binarnej 16 kbit/s, przy wynikowym opóźnieniu
kompresji mniejszym od 2 ms i jakości sygnału odtworzonego porównywalnej z bardzo
dobrej jakości sygnałem telefonicznym);
- 8 -
⎫
G.729 ITU-T (kodowanie podstawowego sygnału telefonicznego z użyciem algorytmu CS ACELP (Conjugate Structure - Algebraic CELP), zapewniającego dalsze zmniejszenie
wymaganej przepływności binarnej do 8 kbit/s).
Kompresja sygnałów wideo może być z kolei realizowana z użyciem metody kompresji
zgodnej z zaleceniem:
⎫
H.261 ITU-T, specyfikującym zasady kompresji sygnału wizyjnego według algorytmu CIF
(Common Intermediate Format) oraz QCIF (Quarter CIF);
⎫
H.263 ITU-T, definiującym metodę kompresji sygnału wideo według algorytmu SQCIF.
W terminalach H.323 dane wychodzące z kodeka wideo są organizowane w makro bloki
(MB) przenoszące grupę 256 pikseli (dane wideo) oraz dodatkowe informacje sterujące, które
łącznie z informacjami przenoszonymi przez nagłówek grupy bloków (GOB) umożliwiają
dekodowanie obrazu po stronie odbiorczej. Całkowita liczba ramek z kodeka audio jest
pakowana do pakietu RTP (zgodnie z zaleceniem H.225.0), ograniczonego długością samych
ramek oraz całkowitą liczbą bitów przypadającą na jeden pakiet. Dokument RFC 1980,
opisujący wykorzystanie protokołu RTP do transmisji głosu, sugeruje wysyłanie pakietu z
próbkami, co 20 ms. Tak uzyskane strumienie audio i wideo są następnie przetwarzane za
pomocą oddzielnych sesji protokołu RTP (Real Time Protocol), zapewniającego transmisję w
czasie rzeczywistym sygnałów z atrybutami czasu rzeczywistego.
Funkcje transmisyjne dla protokołu RTP realizuje protokół UDP, który jest
odpowiedzialny za zwielokrotnienie i kontrolę poprawności transmisji (CRC) utworzonych
strumieni medialnych. Do jego podstawowych zadań należy zapewnianie poprawnej kolejności
przesyłanych informacji, zabezpieczenie przed powtórzeniami, bez gwarancji wiarygodności
transmisji. Pracę protokołu RTP wspiera również protokół RTCP (Real-time Transport Control
Protocol), dostarczający mechanizmów dla synchronizacji przenoszonych ramek audio i wideo
dla sesji czasu rzeczywistego. Protokół RTCP przetwarzając znaczniki czasowe, umieszczone w
nagłówkach pakietów RTP, zapewnia zachowanie sekwencji przesyłanych pakietów (z danymi
wideo i audio), a także kontroluje opóźnienia pomiędzy kolejnymi pakietami. Oprócz tego
przenosi także identyfikator warstwy transportowej źródła RTP, który w odbiorniku jest
wykorzystywany do synchronizacji sygnałów audio i wideo. Pomimo ulepszenia transportu
pakietów w czasie rzeczywistym przez sieć IP, protokół RTP nie ma mechanizmów
rezerwujących zasoby sieci, zatem nie gwarantuje wymaganej jakości usługi. Sytuację tę
zmienia protokół RSVP, który może rezerwować zasoby dla strumienia RTP. Protokół
rezerwacji zasobów RSVP jest protokołem sygnalizacji zdefiniowanym przez IETF,
przenoszącym żądania QoS przez sieć. RSVP wypełnia lukę pomiędzy aplikacją, systemem
operacyjnym i mechanizmami QoS specyficznymi dla nośnika sieciowego. Protokół RSVP
wysyła komunikaty w formacie, który jest od tego nośnika niezależny, dzięki czemu możliwa
jest obsługa QoS w całej ścieżce transmisyjnej w sieciach, które łączą różne rodzaje
niskopoziomowych urządzeń sieciowych.
Datagram przygotowany przez protokół RTP jest z kolei opatrzony nagłówkiem warstwy
UDP, a
następnie enkapsulowany w pakiety protokołu IP. Protokół IP, który jest
odpowiedzialny za przesyłanie datagramów pomiędzy użytkownikami sieci, jest protokołem
bezpołączeniowym. Oznacza to, że w trakcie transmisji nie sprawdza się poprawności
datagramów przesyłanych przez sieć. Nie ma zatem gwarancji ich dostarczenia, ponieważ mogą
one zostać po drodze zagubione przekłamane lub uszkodzone. Jeżeli w trakcie transmisji został
wykryty błąd, to pakiet jest niszczony przez stację, która ten błąd wykryła. W takim przypadku
nie ma żadnych powtórzeń transmisji i kontroli przepływu danych. Funkcje korekcji i
wykrywania błędów transmisji muszą być wykonane przez protokoły innych warstw.
- 9 -
2.2.2 Wymagania na QoS dla warstwy aplikacyjnej usługi
Wymaganiem minimum" dla usługi wideotelefonii jest, aby w normalnych warunkach
"
pracy, przekazywana informacja wideo była wystarczająca dla odzwierciedlenia na ekranie
ruchu ciągłego u osoby biorącej udział w telekonwersacji. Na podstawie kryterium jakości
świadczenia usługi (Quality of Service) wyróżnia się następujące kategorie wideotelefonii, a
mianowicie:
⎫
wąskopasmową PSTN [27] dla publicznej komutowanej sieci telefonicznej,
⎫
wąskopasmową UMTS dla sieci komórkowej 3-generacji,
⎫
wąskopasmowa ISDN [25] dla sieci N-ISDN,
⎫
wąskopasmowa IP dla sieci pakietowej oraz
⎫
szerokopasmową [26] dla sieci B-ISDN / ATM.
Jakość wideotelefonii małej szybkości, ze względu na wąskie pasmo przekazu oraz inne
ograniczenia techniczne, jest z natury rzeczy ograniczona i z tego względu usługa ta raczej nie
jest odpowiednia dla wielu praktycznych zastosowań profesjonalnych. W przypadku tej usługi
mniejszą przepustowość sieci wykorzystuje się tak efektywnie, jak to tylko jest możliwe
realizując metody elastycznego wykorzystania kanału do transmisji sygnałów: fonii, obrazu
ruchomego i nieruchomego, a także sygnałów danych.
Tabela 2.2-1. Przepływności wymagane w wideotelefonii
Wymagana przepływność
[kbit/s]
Rodzaj wideotelefonii
Wąskopasmowa PSTN
33 ÷ 56
Wąskopasmowa UMTS
64 ÷ 144
Wąskopasmowa ISDN
64 ÷ 144
Wąskopasmowa IP
256 ÷ 512
Szerokopasmowa
>2048
Tabela 2.2-2. Dopuszczalne opóźnienia wymagane w wideotelefonii
Rodzaj danych
Sygnały audio
Dopuszczalne opóźnienie [ms]
Sygnały wideo
300
Dopuszczalne względne opóźnienie [ms]
- 10 -
150
10
2.3 Wideokonferencja
2.3.1 Charakterystyka funkcjonalna usługi
Usługa wideokonferencji jest rozumiana [1, 2, 22] jako taka usługa audiowizualna, która
umożliwia przeprowadzanie w czasie rzeczywistym (tzn. na bieżąco) telekonferencji, w której
pomiędzy uczestnikami spotkania", usytuowanymi w różnych miejscach globu ziemskiego, są
"
wymieniane sygnały foniczne razem ze stowarzyszonymi, kolorowymi obrazami ruchomymi,
przedstawiającymi na ogół uczestników tego spotkania. Oprócz funkcji głównej (przekazywanie
fonii i stowarzyszonych obrazów ruchomych), usługa ta udostępnia także przekazywanie danych
innego rodzaju, takich jak: obrazy nieruchome wysokiej rozdzielczości, pliki tekstowe,
dokumenty itd. Usługa daje również możliwość jednoczesnej prezentacji wszystkim
uczestnikom konferencji wcześniej zarejestrowanych sekwencji audio-wideo, a także
zapamiętanych dokumentów tekstowych i obrazów graficznych z możliwością ich adnotacji i
uaktualniania.
Model funkcjonalny usługi wideokonferencji jest pokazany na rys. 2.3-1. Według tego
modelu uczestnicy wideokonferencji, wyposażeni w odpowiednie terminale multimedialne
(TMM) o strukturze funkcjonalnej pokazanej na rys. 2.2-2, mają dostęp do serwera
wideokonferencji (SWK) przez tzw. zespół sterowania wielopunktem (MCU − Multipoint
Control Unit). Ten ostatni jest elementem funkcjonalnym sieci telekomunikacyjnej i jest
dostępny w taki sam sposób, jak każdy abonent sieci. Steruje on wymianą informacji
multimedialnych pomiędzy uczestnikami konferencji, a także zapewnia dostęp do zasobów
serwera wideokonferencji.
TMM
TMM
TMM
Sieć telekomunikacyjna
MCU
SK
SWK
AOK
BD
ZOMM
POMM
Rys. 2.3-1. Model funkcjonalny wideokonferencji i architektura serwera. Oznaczenia wyjaśniono w tekście
W serwerze wideokonferencji, oprócz sterownika komunikacyjnego (SK) i aplikacji
obsługi konferencji (AOK), wyróżnia się trzy główne bloki funkcjonalne: pamięć obiektów
multimedialnych (POMM), zarządcę obiektów multimedialnych (ZOMM) oraz bazę danych
(BD). Pamięć POMM przechowuje obiekty multimedialne wideokonferencji, takie jak: zapisy
wideo uczestników konferencji, transkrypcje sygnałów fonicznych, wspólne dokumenty
(obszary) robocze prezentowane w czasie konferencji, odtwarzane sekwencje wideo, a także
pojedyncze klatki" zapisów wideo, wykorzystywane do przyszłych specyficznych prezentacji.
"
Zarządca obiektów multimedialnych, tak jak typowy serwer informatyczny, ma wbudowanych
wiele funkcji do manipulacji obiektami multimedialnymi przechowywanymi w POMM.
Najważniejszymi z nich są funkcje: transkrypcji, generacji wskaźnika mówcy i wskaźnika słowa
kluczowego, konwersji kodów, lokalizacji wskaźnika-kursora. W bazie danych są
- 11 -
przechowywane dane alfanumeryczne, wytwarzane przez wyżej wymienione funkcje ZOMM, a
także inne dane niezbędne do eksploatacji i zarządzania wideokonferencją.
2.3.2 Wymagania na QoS dla warstwy aplikacyjnej usługi
Wymaganiem minimum" dla warstwy aplikacyjnej wideokonferencji jest, aby w
"
normalnych warunkach pracy przekazywana informacja wideo była wystarczająca dla
właściwego odzwierciedlenia w obrazach (wyświetlanych zarówno w oknie głównym, jak i w
oknach podrzędnych ekranu) ruchu ciągłego dwóch lub więcej osób biorących udział w
spotkaniu. W związku z tym, najniższą możliwą jakością obrazu, dopuszczalną w
wideokonferencji, jest rozdzielczość obrazu wynosząca 128x96 punktów (tabela 2.3-1), a
najwyższą – rozdzielczość 408x1152 punkty. Dźwięk jest przesyłany w paśmie telefonicznym,
przy przepływnościach od 16 do 46kbit/s, lub z podwyższoną jakością z pasmem 7 kHz, przy
transmisji 48/56 kbit/s. Wymaga się także, aby sekwencje wideo były zsynchronizowane z
głosem uczestników oraz innymi przesyłanymi informacjami (tabela 2.3-2).
Tabela 2.3-1. Przepływności wymagane w wideokonferencji
Sygnały wideo
Rodzaj konferencji
Wąskopasmowa ISDN
Szerokopasmowa
ISDN, ATM, LAN
Sygnału audio
Kompresja
Rozdzielczość
[punkty]
H.263, H.261 144x176
288x352
128x96 do
1408x1152
Pakietowa o gwarantowanej
przepływności
128x96 do
1408x1152
Pakietowa bez gwarantowanej
przepływności
128x96 do
408x1152
Analogowa sieć telefoniczna
128x96 do
352x288
Kompresja
Pasmo
[kHz]
3,1
7,0
3,1
7,0
G.711
G.722, G.728
G.277
G.722
G.728
G.277
G.722
G.728
G.277, G.722,
G.728, G.723,
G.729
G.723
Sygnały audio
Dopuszczalne opóźnienie [ms]
3,1
7,0
56 ÷ 2048
3,1
Dopuszczalne względne opóźnienie [ms]
- 12 -
150
10
64 ÷ 2048
64 ÷ 2048
Sygnały wideo
300
64 ÷ 128
3,1
7,0
Tabela 2.3-2. Dopuszczalne opóźnienia wymagane w wideokonferencji
Rodzaj danych
Wymagana
przepływność
[kbit/s]
56
2.4 Wideotekst – usługi transakcyjne
2.4.1 Charakterystyka funkcjonalna usługi
Usługa wideotekstu (VT) jest definiowana jako teleusługa [20], która użytkownikom
terminali wideotekstowych umożliwia komunikowanie się z bazami danych oraz innymi
aplikacjami komputerowymi za pomocą odpowiednich standaryzowanych procedur
dostępowych, wykorzystując publiczne sieci telekomunikacyjne. Przekazywane wiadomości
mają tu na ogół postać informacji alfanumerycznych i/lub graficznych (obrazy nieruchome),
które dodatkowo mogą być uzupełniane sygnałami fonicznymi. Dostęp do bazy danych jest
realizowany pod bezpośrednią lub pośrednią kontrolą użytkownika.
Usługa wideotekstu z definicji udostępnia oprogramowanie, które dostawcom informacji
daje możliwość tworzenia, utrzymania i zarządzania bazami danych, a także możliwość
zarządzania tzw. zamkniętą grupą użytkowników. Praktyczne aplikacje usługi są proste w
obsłudze zarówno dla zwykłego użytkownika, jak i dla specjalisty. Przekazywane wiadomości są
prezentowane na ekranach odpowiednio zmodyfikowanych odbiorników telewizyjnych lub
innych terminali ekranowych, takich jak np. komputery osobiste.
Istnieje wiele praktycznych aplikacji usługi wideotekstowej. Jednakże zastosowaniami
najbardziej popularnymi z punktu widzenia nowoczesnych urzędów jednostek samorządowych
wydają się być:
⎫
strony WWW,
⎫
poczta elektroniczna,
⎫
elektroniczna wymiana dokumentów (EDI) oraz
⎫
elektroniczna skrzynka podawcza.
Wszystkie wyżej wymienione aplikacje funkcjonują z użyciem publicznej, komutowane
sieci telefoniczne i/lub sieci transmisji danych, co czyni je usługami ogólnodostępnymi (każdy
posiadacz popularnego PC wyposażonego w modem może być abonentem usługi
wideotekstowej).
2.4.2 Wymagania na QoS dla warstwy aplikacyjnej usługi
W usługach wideotekstowych, na poziomie warstwy aplikacyjnej, zawsze jest wytwarzany
jeden strumień informacyjny, w którym na ogół są przenoszone dane tekstowe razem z
uzupełniającymi te dane plikami dyskowymi, zawierającymi różnego rodzaju dokumenty, kody
programów, zakodowane obrazy nieruchome, czy też odtwarzalne (w terminalach odbiorczych)
sekwencje audio i/lub wideo. Ponieważ z definicji usługi wideotekstowe stosują
bezpołączeniowy przekaz wiadomości, więc nie są tu specyfikowane jakiekolwiek formalne
wymagania odnośnie szybkości i opóźnień tego przekazu. Wymaga się jedynie, aby wiadomości
te były przekazywane z możliwie niewielką wynikową stopą błędów, zależną od konkretnej
aplikacji (tabela 2.4-1).
Tabela 2.4-1. Wynikowa stopa błędów BER wymagana na poziomie warstwy aplikacyjnej
typowych usług wideotekstowych
Rodzaj usługi wideotekstowej
Poczta elektroniczna (e-mail)
Strony sieci WWW
Elektroniczna wymiana dokumentów (EDI)
Elektroniczna skrzynka podawcza
- 13 -
BER
10-5
10-5
10-7
10-7
3
ANALIZA WPŁYWU PARAMETRÓW QoS PLATFORMY
ŁĄCZNOŚCI ELEKTRONICZNEJ NA JAKOŚĆ PRZEKAZU
MULTIMEDIALNEGO
3.1 Model odniesienia komunikacji multimedialnej nowoczesnego urzędu
jednostki samorządowej
Zgodnie z planem informatyzacji państwa na lata 2007-2013 urzędy jednostek
administracji samorządowej powinny umożliwić obywatelom zdalny dostęp do elektronicznych
dokumentów urzędu i upowszechniać zarówno elektroniczną formę kontaktów obywateli z
urzędem, jak i elektroniczny sposób załatwiania spraw, z możliwością śledzenia biegu tych
spraw w urzędzie. W tym celu każdy urząd powinien posiadać: elektroniczną skrzynkę
podawczą, system elektronicznego obiegu dokumentów wewnątrz urzędu, elektroniczny system
archiwizacji dokumentów oraz bazę formularzy obowiązujących w urzędzie (w formie
elektronicznej), dostępną dla petentów. Jednym słowem urzędy te powinny powszechnie
korzystać z aplikacji wideotekstowych zarówno w relacji urząd-obywatel, jak i urzędnikurzędnik tego samego lub oddzielnych urzędów. Z uwagi na oszczędność czasu i pieniędzy,
wymiana informacji pomiędzy pracownikami tego samego lub oddzielnych urzędów powinna
być dokonywana z użyciem multimedialnych form przekazu informacji, takich jak:
wideokonferencja, telefonia lub wideotelefonia internetowa. Elektroniczna forma wymiany
informacji zarówno wewnątrz urzędu, jak i pomiędzy urzędami wymaga utworzenia
optymalnego systemu łączności elektronicznej, gwarantującego przepływ informacji
multimedialnych na odpowiednio wysokim poziomie jakości QoE. W ogólnym przypadku, w
systemie tym wyróżnia się dwie warstwy (rys. 3.1-1), takie jak:
⎫
warstwa łączności miejscowej, tworzona na bazie lokalnej sieci komputerowej (LAN)
urzędu i wykorzystywana do multimedialnego przekazu informacji wewnątrz urzędu oraz
⎫
warstwa łączności zewnętrznej, tworzona w oparciu o platformę szerokopasmowej sieci
dostępowej i platformę sieci szkieletowej opartej zwykle na sieci pakietowej IP lub ATM z
gwarantowaną jakością przekazu QoS.
Urząd "B"
Urząd "A"
LAN
LAN
FireWall
Serwer
urzędu
"A"
Serwer
urzędu
"B"
FireWall
Platforma dostępowa
SIP
MCU
Platforma dostępowa
Platforma sieci IP QoS
Rys. 3.1-1. Model odniesienia komunikacji multimedialnej nowoczesnego urzędu; gdzie: MCU –serwer usługi
wideokonferencji internetowej, SIP – serwer usługi wideotelefonii internetowej
- 14 -
Warstwa łączności zewnętrznej jest wykorzystywana do komunikacji urzędu z otoczeniem
(obywatele, firmy, inne urzędy) z użyciem wyżej wymienionych usług multimedialnych i to ona
stanowi „wąskie gardło” tej komunikacji, gwarantując lub nie wynegocjowane parametry jakości
QoE świadczenia tych usług. Szerzej problematyka ta jest omawiana w kolejnych punktach tego
rozdziału.
3.2 Analiza wpływu parametrów QoS warstwy dostępowej na jakość
przekazu aplikacji multimedialnych
Współczesne sieci telekomunikacyjne są rozwijane w kierunku architektur z coraz to
mniejszą liczbą węzłów usługowych, zdolnych do świadczenia coraz to szerszej gamy usług
telekomunikacyjnych i obsługi coraz to większej liczby abonentów. Konsekwencją takiego stanu
rzeczy jest powiększanie się obszarów dostępowych sieci, które w coraz to większym stopniu są
tworzone w oparciu o sieci cyfrowe z architekturą pasywnej lub aktywnej światłowodowej
techniki dostępowej. Jednakże ostatni kilometr z tych obszarów sieci, ze względów
ekonomicznych, nadal jest tworzony w oparciu o istniejące media transmisyjne, takie jak: kable
telekomunikacyjne, linie energetyczne niskiego napięcia, kable koncentryczne w sieciach
CATV. W tym obszarze sieci, cyfrowy kanał dostępowy do serwerów usług multimedialnych
może być tworzony z użyciem czy to modemów transmisji danych pasma telefonicznego, czy też
bardziej wyrafinowanych technik dostępowych, takich jak techniki cyfrowej linii abonenckiej
xDSL [15, 16, 18, 47, 51]. Techniki te różnią się między sobą zarówno gwarantowanym
zasięgiem transmisji, jak i udostępnianymi możliwościami transportowymi. Ponieważ
możliwości transportowe tych technik są zdecydowanie mniejsze od przepływności binarnych
łączy światłowodowych, więc faktycznie to one stanowią wąskie gardło telekomunikacji
multimedialnej, i jako takie są dalej szczegółowo omawiane.
Techniki cyfrowego łącza abonenckiego (xDSL) działają w obszarze abonenckiej sieci
dostępowej i jako medium transmisyjne wykorzystują telekomunikacyjne kable miejscowe, z
żyłami miedzianymi lub bimetalowymi, o izolacji z polietylenu jednolitego lub piankowego, lub
typu foam-skin. W tym obszarze sieci dostępowej, najważniejszym medium transmisyjnym
pozostaje nadal symetryczna para przewodów miedzianych, a szerokość pasma podstawowego
0,3 ÷ 3,4 kHz nie wynika z własności transmisyjnych linii abonenckiej, lecz z przepustowości
filtrów instalowanych w punktach styku linii z siecią transportową. Bez tych filtrów kable
miedziane mogą bowiem przenosić pasmo do około 1 MHz, a jedynym ograniczeniem dla
szybkości transmisji jest długość kabla i jakość jego wykonania. Możliwość tę wykorzystują
dalej opisane techniki:
⎫ HDSL (High data rate Digital Subscriber Line) – symetrycznego cyfrowego łącza
abonenckiego ;
⎫ ADSL (Asymmetric Digital Subscriber Line) – asymetrycznego cyfrowego łącza
abonenckiego oraz
⎫ VDSL (Very high data rate Digital Subscriber Line) – cyfrowego łącza abonenckiego o
bardzo dużej szybkości transmisji.
Technika HDSL [18, 53] umożliwia dwukierunkowe przesyłanie strumieni E1 (PCM
2,048 Mbit/s) lub T1 (PCM 1,544 Mbit/s) na jednej, dwóch lub trzech parach przewodów
miedzianych. Jednoparowe łącze HDSL jest często wyróżniane jako technika transmisyjna
SDSL (Single-pair Digital Subscriber Line). Charakteryzuje się ona mniejszym zasięgiem
transmisji (tabela 3.2-1) niż HDSL kilku-parowy, lecz jej podstawową zaletą jest to, że
wykorzystuje tylko jedną parę przewodów miedzianych, którą zawsze dysponuje abonent.
W modemach symetrycznego cyfrowego łącza abonenckiego, sygnał liniowy jest tworzony
w oparciu o modulację 2B1Q lub – CAP (Carrrierless Amplitude Phase Modulation); przy czym
modulacja 2B1Q jest stosowana w łączach HDSL z transmisją: jedno-, dwu- lub trzy- parową,
zaś modulacja CAP-64 i CAP-128 −odpowiednio w łączach HDSL dwu- i jedno- parowych.
- 15 -
Tabela 3.2-1. Przeciętny zasięg transmisji systemów HDSL w kablach miedzianych, z
izolacją polietylenową
Średnica żyły
[mm]
0,4
0,5
0,8
Przeciętny zasięg transmisji [km]
HDSL 1-parowy
Kod 2B1Q Kod CAP-128
3,1
3,3
4,8
5,0
9,2
9,4
HDSL 2-parowy
Kod 2B1Q Kod CAP-64
3,7
4,0
5,4
5,7
10,7
11,0
Technika ADSL [18, 50, 53] została opracowana w laboratoriach Bellcore w USA pod
koniec lat 80. Technika ta wywodzi się od wcześniej omówionej techniki HDSL, a jej
podstawową cechą jest to, że prędkość transmisji od sieci do abonenta jest większa niż prędkość
w kierunku przeciwnym. Obecnie są stosowane dwa rodzaje technik transmisyjnych ADSL, tzn.
szerokopasmowa technika ADSL oraz technika ADSL G.Lite o zmniejszonej przepływności
transportowej (tabela 3.3-2). W łączach cyfrowych ADSL obydwu rodzajów, ze względu na
stosowany sposób modulacji wieloczęstotliwościowej DMT (Discrete Multi-Tone), podkanały
używane do przesyłania sygnałów cyfrowych są lokalizowane w paśmie częstotliwości powyżej
25 kHz. Dolny zakres częstotliwości (0,3 ÷ 3,4 kHz) nie jest ani wykorzystywany, ani zakłócany
przez transmisję cyfrową i jako taki może być wykorzystywany do przesyłania sygnałów
podstawowej usługi telefonicznej (POTS).
Tabela 3.2-2. Przepływność transportowa i przeciętny zasięg transmisji systemów ADSL w
kablach miedzianych o średnicy 0,5 [mm], z izolacją polietylenową
Przepływność transportowa [kbit/s]
ADSL klasyczny
ADSL G.Lite
Od sieci
Do sieci
Od sieci
Do sieci
2048
16
64 ÷ 1536
32 ÷ 512
4096
160
6144
384
8192
640
Zasięg transmisji [km]
ADSL
ADSL
klasyczny
G.Lite
4,8
5÷6
4,0
3,7
2,7
Technika VDSL [18, 47, 52] jest pewnym uzupełnieniem techniki ADSL, i jako taka
umożliwia uzyskanie większych prędkości transmisji skrętką przewodów miedzianych, ale na
mniejszych odległościach (tabela 3.2-3). Podobnie jak ADSL jest techniką asymetryczna, tzn. do
abonenta przenosi znacznie większy strumień danych niż od abonenta do sieci. Ze względu na
stosowaną metodę modulacji DWMT, opartą na tzw. transformacie falkowej (wavelet
transform), kanały cyfrowego łącza VDSL zajmują pasmo powyżej 300 kHz. W ten sposób
pasmo podstawowej usługi telefonicznej (POTS) jest tu poszerzone o pasmo kanałów 2B+D
podstawowej usługi ISDN.
Tabela 3.2-3. Zalecane prędkości i średni zasięg dla transmisji łącza VDSL w parze
przewodów miedzianych o średnicy 0,5 mm
Strumień do abonenta
[Mbit/s]
12,96
25,82
51,84
Strumień od abonenta
[Mbit/s]
1.6 ÷ 2.3
19,2
51,84
Zasięg transmisji
[km]
1,5
1,0
0,3
Wyżej omówione techniki cyfrowego łącza abonenckiego xDSL mają różne zasięgi i
odmienne możliwości transportowe. W strukturze współczesnych sieci dostępowych techniki te
są najchętniej stosowane jako uzupełnienie (na odcinku kilometra lub kilku kilometrów)
pasywnej lub aktywnej sieci światłowodowej, chociaż dwie z nich (HDSL i ADSL) mogą i
- 16 -
często są używane jako autonomiczne, szerokopasmowe systemy dostępowe. Biorą pod uwagę
ich możliwości transportowe i gwarantowaną wiarygodność transmisji, z jednej strony, i
wymagania na przepływność aplikacji multimedialnych wykorzystywanych przez urzędy
jednostek samorządowych, ze strony drugiej, nietrudno zauważyć, że jedynie techniki HDSL i
VDSL (jednakże na odległość nie większą niż 300-metrów) mogą pełnić funkcję warstwy
dostępowej dla komunikacji multimedialnej tych urzędów (tabela 3.2-4).
Tabela 3.2-4. Możliwości wykorzystania technik transmisyjnych xDSL jako warstwy dostępowej w systemach
komunikacji multimedialnej nowoczesnych urzędów jednostek samorządowych
Rodzaj usługi
multimedialnej
Wideotelefonia wysokiej jakości
Wideokonferencja
Usługi wideotekstowe
Warstwa transportowa usługi
Łącze SDSL
5,0 [km]
Tak
Tak
Tak
Łącze
HDSL;
5,7 [km]
Tak
Tak
Tak
Długość łącze ADSL [km]:
2,7
Nie
Nie
Tak
3,7
Nie
Nie
Tak
4,0
Nie
Nie
Tak
4,8
Nie
Nie
Tak
Długość łącza VDSL [km]:
0,3
Tak
Tak
Tak
1,0
Nie
Nie
Tak
1,5
Nie
Nie
Tak
Techniki xDSL działają w obszarze abonenckim sieci telefonicznej, wykorzystują
istniejącą infrastrukturę kabli miedzianych z tego obszaru i jako takie są narażone na
oddziaływanie różnych czynników zewnętrznych, które mogą prowadzić do degradacji
przepływności binarnej łącza i/lub wiarygodności transmisji znacznie poniżej gwarantowanego
poziomu QoS, ustalonego w czasie sprzedaży usługi przez operatora. W większości przypadków
degradacja ta jest następstwem nieprawidłowej eksploatacji sieci przez personel techniczny
operatora, polegającej na:
⎫
pozostawianiu odgałęzień w liniach abonenckich,
⎫
rozbiciu par i utracie symetrii doziemnej linii oraz
⎫
niewłaściwym wypełnianiu telekomunikacyjnego kabla miejscowego usługami cyfrowymi.
Odgałęzienia w linii abonenckiej na ogół powstają wtedy, kiedy abonent rezygnuje z
usługi i jego linia jest rozłączana w dwóch miejscach, tzn. na krosownicy centralowej oraz w
szafie krosowniczej położonej najbliższej abonenta odłączanego. Gdy zachodzi potrzeba
dołączenia nowego abonenta, to do tego celu zwykle jest wykorzystywana odłączona uprzednio
para kabla magistralnego. W takim przypadku do pary kabla magistralnego dołączone zostają
dwie linie abonenckie, z których jedna (łącząca kabel magistralny z szafką krosowniczą
abonenta odłączonego) pozostaje nieobciążona tworząc odgałęzienie linii aktywnej. Tego typu
odgałęzień może być nawet kilka w jednej pętli abonenckiej. Występowanie odgałęzień w linii
abonenckiej jest niezauważalne dla transmisji sygnałów telefonicznych, natomiast jest wysoce
niepożądane w przypadku transmisji xDSL. Szkodliwość odgałęzień przejawia się bowiem:
powstawaniem echa własnego i obcego, zmniejszeniem mocy transmitowanego sygnału, a także
zanikiem niektórych częstotliwości. Te niepożądane efekty prowadzą do zmniejszenia stosunku
S/N mocy sygnału do mocy szumu i w konsekwencji – do spadku wiarygodności transmisji (w
przypadku łączy HDSL), a także do zmniejszenia się przepływności wynikowej łącza, co ma
miejsce w przypadku transmisji ADSL i VDSL.
Rozbicie par kabla, które może występować na krosownicy centralowej i/lub w szafie
krosowniczej, czy też w tzw. mufach kablowych, na ogół objawia się utratą symetrii doziemnej
linii abonenckiej. W konsekwencji linia taka, sama będąc źródłem zakłóceń, na zasadzie
wzajemności, staje się bardziej podatna na absorbowanie zarówno sygnałów generowanych
przez usługi cyfrowe przesyłane w sąsiednich liniach tego samego kabla, jak i zakłóceń
zewnętrznych, wytwarzanych przez: bliskie i dalekie wyładowania atmosferyczne, różnego
rodzaju procesy przemysłowe, radiostacje krótkofalowe, pojazdy mechaniczne itd.
Konsekwencją tego może być trwałe zwiększenie poziomu zakłóceń w linii, a przez to
utrzymująca się degradacją poziomu QoS, odnoszącego się zarówno do gwarantowanej
- 17 -
wiarygodności transmisji (systemy HDSL), jak i zapewnianej przepływności transportowej łącza
(systemy ADSL i VDSL).
Niewłaściwe wypełnianie kabla telekomunikacyjnego usługami cyfrowymi, które polega
czy to na zbyt dużym stopniu zapełnienia kabla tymi usługami, czy też na ich prowadzeniu w
parach tej samej czwórki kablowej lub w parach czwórek przyległych, skutkuje na ogół
znacznym wzrostem poziomu zakłóceń i w konsekwencji degradacją gwarantowanego poziomu
QoS usługi. Dzieje się tak z powodu trudności w uzyskaniu i utrzymaniu stanu idealnej symetrii
linii abonenckich zawartych w rzeczywistym kablu telekomunikacyjnym. Wskutek
występowania sprzężeń elektromagnetycznych między liniami, sygnały elektryczne przesyłane
w tych liniach przenikają z jednej pary kablowej do drugiej. Ze względu na nieidealną symetrię
par, sygnały przenikające do poszczególnych przewodów tych par nie kompensują się
wzajemnie i powodują powstanie zakłócającego napięcia różnicowego między tymi
przewodami. Jako istotne rozróżnia się dwa rodzaje przeników (rys. 3.2-1), a mianowicie:
przenik zbliżny (NEXT – Near End Crosstalk) i przenik zdalny (FEXT – Far End Crosstalk).
Para zakłócająca
1
O
N
NEXT
2
N
O
Para zakłócana
Para zakłócająca
1
N
O
FEXT
2
N
O
Para zakłócana
Rys. 3. 2-1. Przenik zbliżny NEXT i zdalny FEXT
Przenik zbliżny NEXT jest szczególnie niekorzystny w takich przypadkach, kiedy w kablu
z parami nie ekranowanymi znajdą się linie abonenckie wykorzystywane do transmisji sygnałów
cyfrowych w obydwu kierunkach transmisji, a pasma sygnałów nadawanych i odbieranych
pokrywają się. Wynika z tego, że przeniki zbliżne nie występują, jeżeli w kablu ma miejsce
jedynie transmisja jednokierunkowa, tzn. kiedy po jednej stronie kabla są tylko nadajniki, po
drugiej – tylko odbiorniki. Jeżeli zakłócenia te powstają od takiego samego systemu
transmisyjnego, wówczas pasma obu systemów pokrywają się, a powstałe przeniki SNEXT (Self
NEXT) należą do najbardziej szkodliwych.
Przenik zdalny FEXT powstaje wtedy, kiedy dwa sygnały lub więcej (o pokrywających się
widmach) przesyłane są w tym samym kierunku, lecz w różnych torach abonenckich. Na skutek
zjawiska indukcji elektromagnetycznej, do odbiornika na drugim końcu toru transmisyjnego
mogą docierać wtedy, oprócz sygnału podstawowego, sygnały mające swe źródło w torach
sąsiednich. Jeżeli zakłócenia te powstają od takiego samego systemu transmisyjnego, wówczas
pasma obu systemów pokrywają się, i mamy do czynienia z przenikiem SFEXT (Self FEXT),
bardziej szkodliwym niż przenik FEXT.
Poziom zakłóceń wywołanych zjawiskiem przeniku zbliżnego i zdalnego zależy w dużej
mierze od rodzaju kabla (parowy, czy czwórkowy), ułożenia par kablowych, skoku skrętu par,
podziału par w kablu na ekranowane grupy, długości linii abonenckiej, ilości i właściwości
spektralnych (widma) sygnałów zakłócających, źródeł częstotliwości pracy i szerokości
przenoszonego pasma. Przez właściwą lokalizację usług cyfrowych w kablu
- 18 -
telekomunikacyjnym może on być jednakowoż znacznie zmniejszany, a negatywne
oddziaływanie na siebie tych usług w znacznym stopniu zredukowane.
Każde z wyżej omówionych niewłaściwych działań eksploatacyjnych operatora prowadzi
w konsekwencji albo do wzrostu stopy błędów pierwotnych w eksploatowanym kanale
cyfrowym (łącza SDSL i HDSL), albo do degradacji przepływności transportowej kanału, co ma
miejsce w systemach ADSL i VDSL, i wynika z właściwości adaptacyjnych tych systemów. W
obydwu przypadkach, działania te spowodują trwały spadek wynikowej szybkości transferu
danych na poziomie warstwy aplikacyjnej przenoszonych usług multimedialnych. W zależności
od stopnia degradacji tej szybkości, ujemne skutki tych działań mogą się objawiać
wyczuwalnym pogorszeniem poziomu jakości świadczonej usługi, polegającym na
występowaniu „czkawki” w przekazach audio, czy też drżeniem i „smużeniem” wyświetlanych
obrazów. Ze względu na niską, dopuszczalną stopę błędów w transmisjach xDSL 3) negatywne
skutki tych działań dotyczyć mogą jedynie tych usług, które przekazują strumienie z danymi
czasu rzeczywistego, i których łączna wymagana przepływność binarna na poziomie
pakietowym usługi jest niewiele mniejsza od przeciętnej przepływności transportowej
zastosowanego łącza xDSL.
3) Dopuszczalna, systemowa stopa błędów w łączach cyfrowych xDSL wynosi 10-7.
- 19 -
3.3 Analiza wpływu parametrów QoS warstwy szkieletowej na jakość
przekazu aplikacji multimedialnych
Od wielu lat dążeniem projektantów warstwy szkieletowej sieci telekomunikacyjnych, jak
również projektantów sieci komputerowych, jest stworzenie takiej infrastruktury technicznej,
która umożliwiłaby efektywne przekazywanie informacji związanej z różnorodnymi klasami
aplikacji (usługami) opartymi na przekazie mowy, danych, obrazów ruchomych (wideo) i
nieruchomych. Sieć spełniającą te wymagania nazywa się siecią wielo-usługową (multi-service).
Zasadniczą trudnością przy opracowaniu właściwej techniki telekomunikacyjnej dla sieci
wielo-usługowej jest zagwarantowanie należytej jakości przekazu informacji przez sieć dla
każdej z oferowanych klas aplikacji. Ogólnie ujmując, dostępne klasy aplikacji różnią się
pomiędzy sobą zarówno typem (profilem) ruchu generowanego do sieci, wymaganą
przepływnością bitową, jak i wymaganiami dotyczącymi jakości przekazu. Jest zatem oczywiste,
że spełnienie w sieci wielo-usługowej tak przeciwstawnych wymagań dotyczących jakości
przekazu informacji, przy użyciu tej samej infrastruktury, wymaga zarówno nowych rozwiązań
architektonicznych, jak i technik telekomunikacyjnych. Obecnie w zasadzie istnieją dwa rodzaje
sieci: realizująca głównie usługę przekazu mowy i ukierunkowana na przekaz danych. Pierwsza
z tych sieci jest oparta na technice komutacji kanałów, druga zaś – na technice komutacji
pakietów. Zatem zasadniczym problemem przy realizacji sieci wielo-usługowej jest zapewnienie
przekazu mowy w sieci z komutacją pakietów lub zapewnienie przekazu danych w sieci z
komutacją kanałów.
Do realizacji sieci wielo-usługowej opracowano wiele technik, w tym technikę N-ISDN
(Narrowband Integrated Services Digital Network) [10] opartą na komutacji kanałów oraz
technikę ATM (Asynchronous Transfer Mode) opartą na komutacji pakietów. Obie te techniki, w
swoich założeniach, mają pewne mechanizmy służące zapewnieniu odpowiedniej jakości obsługi
dla każdej z klas aplikacji. Faktem jest, iż obecnie najbardziej rozwiniętą siecią mającą pewne
cechy sieci wielo-usługowej, jest globalna sieć Internet, oparta na technice komutacji pakietów z
zastosowaniem protokołu IP (Internet Protocol). Liczba abonentów sieci Internet jest obecnie
porównywalna z liczbą abonentów sieci telefonicznej, zaś ruch przenoszony w tej sieci w
niektórych krajach przekroczył ruch telefoniczny i stale wzrasta. Sieć Internet obecnie nie
zapewnia wprawdzie wymaganej jakości przekazu, jednak rekompensatą może być atrakcyjność
i bogactwo dostępnych w sieci usług (aplikacji) i mały koszt opłat. W ostatnim czasie obserwuje
się duże zainteresowanie wprowadzeniem do sieci Internet usługi przekazu mowy VoIP (Voice
over IP). Rozpowszechnienie tej usługi może doprowadzi w konsekwencji do „przejęcia”
realizacji rozmów telefonicznych przez sieć IP. Biorąc to pod uwagę, sieć Internet należ y
obecnie traktować jako poważnego kandydata do przekształcenia się w sieć wielo-usługową,
oferującą wszystkie dostępne obecnie aplikacje, w tym również usługi multimedialne
wszystkich kategorii oraz podstawową usługę telefoniczną. Obecnie czynnikiem ograniczającym
atrakcyjność Internetu jest to, że nie zapewnia ona należytej jakości przekazu informacji.
Dlatego też wprowadza się do sieci Internet dodatkowe elementy zapewniające wymaganą
jakość obsługi, tj. odpowiednie architektury sieci i skojarzone z nimi mechanizmy QoS (Quality
of Service). Obecnie są nimi dalej opisane architektury: IntServ, DiffServ i MPLS
Model IntServe był pierwszym modelem opracowanym przez organizację IETF,
zajmującą się standaryzacją Internetu. Podstawową własnością tego modelu jest jego
zorientowanie na przesyłanie informacji w relacji pomiędzy punktami końcowymi połączenia.
Aby każdej transmisji pakietów zagwarantować odpowiednie parametry QoS należy przydzielić
odpowiednie zasoby sieciowe dla każdej sesji. Do tego celu wykorzystywany jest protokół
sygnalizacyjny RSVP (Resource ReServation Protocol), który jest odpowiedzialny za
definiowanie i rezerwację zasobów sieciowych niezbędnych do przesyłania pakietów oraz
zestawianie logicznych dróg połączeniowych dla tej transmisji. W modelu tym (rys. 3.3-1)
elementem inicjującym rezerwację jest stacja nadająca A, która informuje odbiorcę B o chęci
przesłania danych oraz o wymaganej dla tej sesji jakości transmisji. Odbywa się to za pomocą
- 20 -
wysłania komunikatu PATH. Odbiorca rezerwuje zasoby wzdłuż całej ścieżki od nadawcy do
odbiorcy przez wysłanie zwrotnie komunikatu RESERVE. Komunikat ten dociera do
wszystkich routerów, znajdujących się na tej drodze. W przypadku dostępności wymaganych
zasobów rezerwacja zostaje uaktywniona i stacja nadająca może przesyłać dane. Protokół RSVP
oparty jest na koncepcji tzw. „miękkiego stanu” (soft state), co oznacza konieczność
okresowego powtarzania rezerwacji. Rezerwacja zasobów wzdłuż ścieżki może zostać
anulowana po wysłaniu stosownego komunikatu, lub gdy stany rezerwacyjne nie zostaną
odświeżone w zadanym czasie. Parametry rezerwacji dla sesji mogą być zmieniane dynamicznie
i są uaktualniane przez komunikaty odświeżające. Należy podkreślić, że RSVP nie jest
protokołem doboru trasy, a służy jedynie do rezerwacji zasobów na trasie wybranej przez
funkcjonujące w sieci protokoły routingu. Sesja określona jest poprzez adres IP oraz
identyfikator portu i typ protokołu transportowego odbiorcy danych, co pozwala na
jednoznaczną identyfikację pakietów należących do danej sesji. Dla każdej sesji należy
przydzielić odpowiednie zasoby sieciowe i obsługiwać ją zgodnie z parametrami QoS do niej
przypisanymi. W ramach tego modelu zdefiniowane zostały dotychczas dwie klasy usług:
⎫
usługa GS (Guaranted Service), gwarantująca szerokość pasma transmisyjnego,
ograniczenie maksymalnych opóźnień w relacji nadawca-odbiorca i brak strat pakietów
spowodowanych kolejkowaniem pakietów w buforach urządzeń sieciowych 3 oraz
⎫
usługa kontrolowanego obciążenia CL (Controlled Load Service) 4 .
komunikat
PATH
komunikat
PATH
komunikat
PATH
IBM RS/6000
nadawca A
IBM RS/6000
odbiorca B
komunikat
RESV
komunikat
RESV
komunikat
RESV
Rys 3.3-1. Zasada działania protokołu RSVP
Elementem wyróżniającym architekturę DiffServ, od wcześniej przedstawionej
architektury IntServ, jest zastosowanie tzw. agenta przydzielania pasma (Bandwidth Broker).
Agent ten odpowiada za: realizację funkcji AC (Admission Control), zarządzanie zasobami sieci
oraz za funkcje związane z konfiguracją routerów brzegowych. Funkcje te są realizowane tylko
w węzłach brzegowych sieci. Zakłada się, iż sieć szkieletowa jest odpowiednio
przewymiarowana, aby nie stanowić ograniczenia dla przekazu pakietów. Istota architektury
DiffServ polega na tym, że routery brzegowe obsługują pojedyncze strumienie pakietów,
3
4
Klasa GS jest przeznaczona dla aplikacji wymagających transmisji w czasie rzeczywistym, wrażliwych na
opóźnienia tranzytowe, jak na przykład transmisja danych audio i video.
Usługa ta nie zapewnia tak silnych gwarancji dotyczących jakości QoS, jak klasa GS. Jeżeli strumień danych należy
do klasy CL, router przydziela do niego takie zasoby, aby możliwa była obsługa z jakością dostępną w sieci
obciążonej, ale nie nadmiernie. Wraz ze wzrostem obciążenia, w odróżnieniu od usługi best effort, jakość obsługi dla
klasy CL nie powinna się pogarszać w sposób znaczący.
- 21 -
natomiast w sieci szkieletowej obsługa odbywa się na podstawie strumieni zbiorczych. Dlatego
też funkcje profilowania ruchu są realizowane jedynie w węzłach brzegowych sieci. Natomiast,
obsługa ruchu zbiorczego (klas ruchu) przez sieć odbywać się zgodnie z przyjętymi modelami
przekazu pakietów PHB (Per-Hop-Behaviour), które określają, w jaki sposób ruch w ramach
danej klasy ruchu ma być przekazywany między poszczególnymi węzłami sieci. Pakiety,
obsługiwane wg tego samego PHB są rozpoznawane w routerach dzięki odpowiedniemu
ustawieniu pola DSCP nagłówka pakietu IP. W ramach architektury DiffServ zdefiniowano dwie
główne grupy PHB: Expedited Forwarding i Assured Forwarding (AF). Grupa EF PHB została
zdefiniowana dla przekazu pakietów wymagających obsługi w reżimie czasu rzeczywistego,
natomiast grupa AF PHB odpowiada za przekaz pakietów w ramach wielu klas ruchu
elastycznego oraz ruchu bez reżimu czasu rzeczywistego. W przypadku obu grup PHB,
zdefiniowane mechanizmy QoS powinny zapewnić jakość przekazu pakietów zgodnie z
wymaganiami QoS przyjętymi dla danej klasy ruchu oraz zapewnić różnicowanie jakości
między poszczególnymi klasami ruchu.
MPLS (Multiprotocol Label Switching) jest techniką selektywnego kierowania pakietów,
funkcjonującą na poziomie łącza danych, która umożliwia prostsze i szybsze kierowanie
pakietów, niż według tradycyjnych schematów, wykorzystywanych w sieciach IP. W protokole
MPLS każdy pakiet wchodzący do sieci jest przydzielany do klasy równoważności
przekazywania FEC na podstawie analizy nagłówka. Każdy pakiet otrzymuje etykietę
odpowiadającą danej klasie równoważności. Przydzielenie pakietu do klasy FEC odbywa się
tylko raz, w chwili wejścia do domeny MPLS. W kolejnych węzłach sieci nie jest konieczne
analizowanie nagłówka pakietu, a decyzja o wyborze następnego odcinka drogi podejmowana
jest na podstawie etykiety. Etykieta ma znaczenie wyłącznie lokalne. Jest to identyfikator o stałej
długości, jednoznacznie określający klasę równoważności przekazywania pakietów pomiędzy
dwoma sąsiednimi węzłami, dla określonego kierunku transmisji. Ciąg takich powiązań
pomiędzy kolejnymi węzłami w obrębie domeny MPLS tworzy ścieżkę komutowaną etykietowo
LSP. Należy podkreślić, że Protokół MPLS w założeniu podstawowym ma służyć uproszczeniu
mechanizmów przekazywania pakietów w routerach. Pewne właściwości tego protokołu mogą
wspomagać inżynierię ruchu w sieciach, zwłaszcza ze względu na możliwości równoważenia
obciążenia w sieci, co ma znaczący wpływ na utrzymanie obsługi pakietów na odpowiednim
poziomie jakości. Jednocześnie uproszczenie procesów kierowania, zwłaszcza w sieci
szkieletowej, uwalnia dodatkowe możliwości przetwarzania informacji w routerach co również
przekłada się na zdolność utrzymania założonej QoS. Protokół MPLS nie jest wyposażony w
bezpośrednie mechanizmy sterowania parametrami QoS. Technika ta umożliwia natomiast
trasowanie jawne w sieci szkieletowej i określenie z wyprzedzeniem przęsła, przez które pakiet
będzie musiał przejść w sieci (explicite routing). Ta właściwość upodabnia ruch w sieci IP do
połączeń od końca do końca (end-to-end) czyli nadaje sieci IP właściwości sieci zorientowanej
połączeniowo. Ruch pakietów w sieci jest wtedy bardziej przewidywalny, co umożliwia
łatwiejsze gwarantowanie jakości usług. Z punktu widzenia jakości usług najlepsze rezultaty
daje kompilacja techniki MPLS z technikami IntServ i DiffServ stosowanymi w sieciach IP do
zapewnienia odpowiedniej jakości QoS przy przenoszeniu np. ruchu generowanego przez
aplikacje multimedialne.
Cechą charakterystyczną sieci IP jest to, że jeśli przesyłany w niej pakiet natrafi na
przepełniony bufor kolejki wejściowej lub wyjściowej dowolnego węzła tej sieci lub zostanie
odebrany z błędem, to pakiet taki nie jest w tym węźle przetwarzany i w konsekwencji jest
gubiony. W przypadku transmisji głosu utrata pojedynczych pakietów nie powoduje słyszalnego
zniekształcenia sygnałów audio. Podobnie jest w przypadku transmisji strumienia wideo. Utrata
pojedynczych pakietów nie powoduje bowiem znacznego pogorszenia jakości odbieranych,
wolnozmiennych obrazów rozmówcy. Dyskwalifikacja połączenia wideo ma miejsce dopiero
wtedy, kiedy intensywność gubienia pakietów będzie na tyle duża, że szybkość odtwarzania
obrazów wideo spadnie poniżej 10 klatek na sekundę [48].
- 22 -
Przy transmisji dźwięku podstawowym kryterium oceny jakości sieci jest opóźnienie w
transmisji pakietów. Opóźnienie to powinno być stałe i nie powinno być większe od 200 ms. Z
przeprowadzonych badań [4] mających na celu określenie dopuszczalnego poziomu opóźnień i
utraty pakietów, okazało się, że w przypadku utraty do 5 % przesyłanych pakietów trudno jest
zauważyć różnicę w jakości dźwięku. Jest natomiast wyraźna, gdy poziom strat dochodzi do
15 %. Jeśli przekracza tę wielkość, rozmowa staje się trudna do zrozumienia. W przypadku
opóźnień ucho ludzkie jest w stanie odczuć je dopiero wtedy, gdy są większe niż 150 ms. Gdy
przekraczają 400 ms, bardzo trudno jest prowadzić rozmowę.
Reasumując można stwierdzić, że jakość wideotelefonii i wideokonferencji zależeć będzie
zarówno od czynników obiektywnych, związanych z obciążeniem ruchowym sieci IP oraz jej
strukturą techniczną, jak i czynników subiektywnych, wynikających ze zdolności percepcyjnych
osób korzystających z tych usług. Zastosowanie w sieci IP wcześniej omówionych
mechanizmów i protokołów czasu rzeczywistego nie wyeliminuje całkowicie ani utraty pakietów
w sieci, ani zmienności ich przychodzenia do terminalu odbiorczego, lecz znacząco je ograniczy,
jednak nie na tyle, aby jakość świadczenia usługi była na poziomie jakości, która jest
gwarantowana w sieciach zorientowanych połączeniowo.
- 23 -
4
PRZEGLĄD I CHARAKTERYSTYKA OGÓLNA METOD OCENY
JAKOŚCI PRZEKAZU MULTIMEDIALNEGO
4.1 Uwagi ogólne
We współczesnych systemach łączności multimedialnej stosowanych jest wiele rozwiązań,
w których sygnały audio i wideo podlegają różnego rodzaju przekształceniom i przetworzeniom
w celu ich efektywnego przesyłania, gromadzenia, rozpoznawania i syntetyzowania.
Stosowanych jest wiele różnych typów koderów, sieci dostępowe i transmisyjne opierają się na
nowych rozwiązaniach, a integracja sieci telekomunikacyjnych i informatycznych stała się
faktem, również w kontekście realizacji połączeń telefonicznych (VoIP – Voice over IP).
Specyfika stosowanych rozwiązań oraz różnorodność systemów i sieci wykorzystywanych do
tworzenia połączeń multimedialnych powoduje, że sygnały przesyłane w czasie tych połączeń
podlegają wielokrotnemu przetwarzaniu, przekodowywaniu i przeładowywaniu zanim dotrą do
odbiorcy. Wszystko to z reguły wpływa negatywnie na jakość tych przekazów i co gorsze w
sposób trudny lub niemożliwy do przewidzenia. Jakość mowy SQ (Speech Quality) jest jednym
z elementów ogólnej oceny QoS (Quality of Service) jakości usługi telekomunikacyjnej
związanej z tworzeniem połączeń telefonicznych. Przy przesyłaniu sygnału wideo,
występującego w usługach wideotelefonii i wideokonferencji, miarą zadowolenia klienta z tych
usług jest w głównej mierze jakość odbieranego obrazu i skojarzonego z nim dźwięku. Jakość tę
mierzy się metodami subiektywnymi, najczęściej w skali MOS (Mean Opinion Score) od 1 do 5,
polegającymi na przeprowadzaniu sformalizowanych odsłuchów dźwięku i pokazów ruchomego
obrazu, co jest procesem długotrwałym i na ogół kosztownym. Z tego względu dąży się do
zastąpienia metod subiektywnych oceny jakości metodami obiektywnymi, polegającymi na
obliczeniu parametru MOS na bazie automatycznego porównania sygnału oryginalnego
(starannie dobranego, o dobrej jakości) i sygnału docierającego do klienta. Tego typu metody
obiektywne, wymagające znajomości oryginału, są nazywane „intruzyjnymi”. Trudniejsze do
opracowania i z reguły mniej dokładne są metody „nieintruzyjne”, niewymagające znajomości
oryginału. Inną grupę metod oceny jakości stanowią metody parametryczne, pozwalające na
oszacowanie jakości usługi na podstawie pewnych wybranych parametrów połączenia
telekomunikacyjnego. Należy do nich na przykład tzw. E-model, zdefiniowany w zalecenie
G.107 ITU-T i stosowany dla połączeń telefonicznych, czy algorytm P.VTQ, wykorzystywany
do oceny jakości usługi VoIP. Wymienione metody są przedmiotem rozważań kolejnych
punktów tego rozdziału.
- 24 -
4.2 Metody oceny subiektywnej
Z uwagi na charakter przekazów multimedialnej (sekwencje audio + sekwencje wideo +
dane cyfrowe), subiektywne badanie jakości tych przekazów musi zawierać elementy badania
jakości zarówno sygnałów mowy, jak i sygnałów wizyjnych.
Metody subiektywnej oceny jakości mowy (sekwencji audio) w istocie rzeczy
sprowadzają się do bezpośredniego wykorzystania w eksperymencie osób, których zadaniem jest
określenie cech mowy na podstawie wrażeń słuchowych, pozwalających bezpośrednio lub
pośrednio oszacować jej jakość [34, 35, 36]. Do najważniejszych subiektywnych metod oceny
jakości transmisji mowy zalicza się obecnie te metody, które dają ocenę MOS w
pięciostopniowej skali jakości. Są nimi:
⎫
metoda ACR (Absolute Category Rating) oraz
⎫
metoda DCR (Degradation Category Rating).
Metoda ACR polega na bezpośrednim określeniu jakości mowy w pięciostopniowej skali
ocen. Obecnie metoda ta jest najczęściej stosowana, gdyż pozwala na stosunkowo szybki i tani
pomiar. Umożliwia to przeprowadzenie badań dla wielu obiektów z różnymi wartościami
parametrów wpływających na jakość transmisji lub kodowania. Metoda ACR jest unormowana
zaleceniem ITU-T P.800. W metodzie tej są wykorzystywane listy testowe złożone z prostych i
nie związanych z sobą semantycznie zdań. Dobierane są zdania średniej długości, z czasem
trwania 2-3 sek. Lista jest podzielona jest na grupy złożone z pięciu zdań. Słuchacze, po
wysłuchaniu grupy zdań podają swoja opinię w pięciostopniowej skali jakości odsłuchu, wysiłku
słuchowego lub preferowanej głośności. Ocena 5 odpowiada bardzo dobrej jakości, natomiast 1
– niedostatecznej. Ocena średnia (MOS) obliczana jest dla każdego badanego warunku
transmisji mowy oraz dla każdej skali ocen, jako wynik uśrednienia po słuchaczach i mówcach.
Wadą metody jest brak precyzji w zdefiniowaniu zadania dla grupy odsłuchowej i naturalna
niezdolność słuchaczy do stabilnej i powtarzalnej oceny w skali punktowej takiej cechy, jak
„jakość transmisji mowy”. Jest tu więc konieczne wykonanie pomiaru dla licznej ekipy
słuchaczy (większej od 12), kilku głosów po stronie nadawczej, staranne przeszkolenie i
trenowanie słuchaczy.
Metoda DCR jest alternatywnym rozwiązaniem dla metody ACR. Pomiar polega tu na
porównaniu wzorcowego sygnału mowy o wysokiej jakości z sygnałem przesłanym przez
badany kanał telekomunikacyjny. Sygnał wzorcowy prezentowany jest zawsze jako pierwszy.
Słuchacze określają stopień pogorszenia jakości sygnału badanego w stosunku do sygnału
wzorcowego w pięciostopniowej skali ocen. Pomiar wykonywany jest dla licznej ekipy
słuchaczy i kilku mówców (podobnie jak w metodzie ACR). Ocena średnia (DMOS) obliczana
jest dla każdego badanego warunku transmisji mowy oraz dla każdej skali ocen, jako wynik
uśrednienia po słuchaczach i mówcach.
Jedną z częściej używanych w Polsce subiektywnych metod oceny jakości mowy jest
badanie wyrazistości. Metoda ta nie daje pełnej informacji o jakości a jedynie uwzględnia aspekt
rozumienia wypowiadanych jednostek akustycznych takich jak: logatomy, sylaby, wyrazy czy
zdania. Najczęściej badania te dotyczą wyrazistości logatomowej. Logatomy to nic nie znaczące
w danym języku wyrazy (jedno-, dwu- lub trzysylabowe). Rozpoznanie logatomu jest zatem
wyłącznie wynikiem usłyszenia wszystkich wchodzących w jego skład fonemów, a nie
skojarzenia ze znanym wyrazem lub analizy kontekstowej. Badanie wyrazistości logatomowej
polega na określeniu procentowym stosunku poprawnie rozpoznanych przez N słuchaczy
logatomów z L do całkowitej liczby logatomów odczytanych 5 . Metryka oceny jakości jest
wyznaczana wg wzoru:
5
Szczegółowy opis metody podaje polska norma PN-90.
- 25 -
N
L
W = ( NL ) −1 ∑∑ Wn ,l
4.2-1
n =1 l =1
gdzie: Wn,l oznacza liczbę poprawnie rozpoznanych logatomów przez n-tego słuchacza z l-tej
listy w stosunku do liczby logatomów odczytanych z tej listy.
Metody subiektywnej oceny obrazu. W wyniku kompresji i rekonstrukcji, a także
wskutek utraty transmitowanych pakietów, obraz ruchomy ulega zniekształceniu i nakładają się
na niego zakłócenia. Te niekorzystne zjawiska zależą od rodzaju kodeka, przepływności binarnej
(stopnia kompresji), samego obrazu, stopy utraconych pakietów. Najczęściej występują
następujące zniekształcenia i zakłócenia:
⎫
efekty blokowe, wynikające z zastosowania kompresji w blokach, np. 8x8 pikseli –
obserwator zauważa granice bloków;
⎫
„przytrzymanie” obrazu, wskutek podstawienia ostatniej poprawnie zdekodowanej ramki
za szereg niepoprawnie zdekodowanych ramek (występuje przy dużych zakłóceniach w
kanale transmisyjnym);
⎫
chwilowy zanik obrazu lub jego części, często połączony z pojawieniem się na ekranie
kolorowej tekstury (występuje przy bardzo dużych zakłóceniach);
⎫
nieciągłość ruchu, związana z nazbyt wielką kompresją obrazu;
⎫
zniekształcenia konturów (nieostrość, załamania, poruszanie się, a także wystąpienie
„fałszywych konturów”) powstałe jako wynik kompresji;
⎫
błędy w odtworzeniu kolorów (zmiana odcieni, nasycenie) oraz
⎫
błędy kwantyzacji (szum typu „sól i pieprz” lub „śnieżenie”).
Wymienione czynniki charakteryzują się różną dokuczliwością dla odbiorcy. Ich wpływ na
percepcję obrazu można stwierdzić przeprowadzając subiektywne badania jakości. Ich metodyka
[41] nie odbiega od odpowiednich badań dla mowy: stosuje się skalę MOS (najczęściej od 1 do
5, choć proponuje się również skale 1-10 i 0-100). Normy określają tylko warunki
przeprowadzenia formalnych badań jakości z udziałem grupy odbiorców przekazu. Metody
subiektywne służą do kalibracji metod obiektywnych, obliczających MOS na podstawie
porównania odebranej i nadanej sekwencji wideo (metody intruzyjne), na podstawie badania
jakości połączenia (metody parametryczne) i na podstawie badania odebranej sekwencji (met.
nieintruzyjne).
Metody oceny subiektywnej są podstawowym narzędziem służącym do kalibracji
pozostałych metod oceny jakości transmisji audio-wizyjnych. Są one jednocześnie najbardziej
kłopotliwe w stosowaniu, gdyż wymagają zorganizowania sformalizowanych odsłuchów i/lub
prezentacji pokazów wideo.
- 26 -
4.3 Metody oceny obiektywnej
Metody oceny jakości mowy. Cechą charakterystyczną obiektywnych metod oceny
jakości mowy jest wyznaczanie odległości (według przyjętej miary) pomiędzy wybranym lub
wybranymi parametrami sygnału mowy oryginalnej i sygnału przetworzonego (przesłanego), a
następnie na podstawie krzywej odwzorowania, określenie oceny w mierze subiektywnej.
Obecnie znanych jest wiele obiektywnych metod oceny jakości mowy. Jednakże do
najważniejszych zalicza się te metody, które najlepiej estymującą wyniki badań subiektywnych,
niezależnie od języka, mówcy i kodera audio. Są nimi:
⎫
metoda PSQM (Perceptual Speech Quality Measure), opisana w zaleceniu ITU-T P.861;
⎫
metoda PESQ (Perceptual Evaluation of Speech Quality) oraz
⎫
metoda 3SQM.
Metoda PSQM. Istota tej metody [37] sprowadza się do określenia odległości pomiędzy
rzeczywistym sygnałem mowy, a sygnałem otrzymanym w wyniku jej przetworzenia (głównie
kodowania). Przy czym, zanim porównanie zostanie dokonane obydwa sygnały podlegają
transformacji z postaci fizycznej na postać psychofizyczną, odzwierciedlającą przetwarzanie
akustycznego sygnału mowy przez ucho człowieka. Na transformację sygnału z postaci fizycznej
na psychofizyczną składa się:
⎫
odwzorowanie czasowo-częstotliwościowe, polegające na wyznaczeniu N-punktowej
dyskretnej transformaty Fouriera z próbek sygnału akustycznego, wydzielonego oknem
czasowym Hanninga o czasie trwania 32 msek i na jej podstawie obliczeniu
krótkookresowej mocy sygnału;
⎫
przeskalowanie częstotliwości, polegające na filtracji sygnału za pomocą tzw. filtrów
barkowych 6 , co wraz z maskowaniem przez szum 7 odzwierciedla właściwości percepcyjne
ucha;
⎫
przeskalowanie poziomu natężenia w decybelach na poziom głośności wyrażany w fonach,
a następnie jego wyrażenie w skali sonowej 8 .
Uproszczony schemat algorytm metody PSQM przedstawiono na rys.4.3-1. W modelu tym
reprezentacje wewnętrzne obu sygnałów są porównywane, a obliczona odległość między nimi
(tzw. wskaźnik PSQM) jest bezpośrednio związana z jakością testowanej mowy. Ostatnim
krokiem w metodzie PSQM jest odwzorowanie skali obiektywnej na subiektywną.
Rys. 4.3-1: Uproszczony schemat algorytmu badania jakości mowy metodą PSQM wg [49]
6
7
8
W filtrach barkowych różnica częstotliwości środkowych i szerokości pasm dwóch sąsiednich filtrów zwiększa się z
częstotliwością
Do sygnału dodawany jest szum Hoth’a modelujący zakłócanie sygnału szumami otoczenia.
Operacja ta ma na celu uwzględnienie faktu, że subiektywne odczucie głośności nie zależy liniowo od poziomu
natężenia sygnału (przejście ze skali decybelowej na fonową) oraz że subiektywne wrażenie zwiększenia głośności
zmienia się nieliniowo wraz ze zmianą głośności (przejście ze skali fonowej na sonową).
- 27 -
Metoda PESQ. Wadą wyżej opisanej metody PSQM jest brak korelacji otrzymywanych
wyników z subiektywnymi ocenami w przypadku telefonii internetowej. Przyczyną
występowania takich rozbieżności są zaburzenia w dziedzinie czasu, występujące podczas
transmisji sygnału mowy w sieciach pakietowych. Rozwiązaniem okazał się mariaż modułu
synchronizacji czasowej (zaczerpniętego z metody PAMS) ze standardem PSQM. Nowo
opracowaną metodę pomiaru znacznie udoskonalono i nazwano PESQ (Perceptual Evaluation of
Speech Quality) 9 . Idea pomiaru PESQ opiera się podobnie jak w przypadku PSQM, na tzw.
reprezentacji wewnętrznej będącej teoretyczną postacią sygnału mowy w umyśle człowieka [39].
Sygnałem wzorcowym (oryginalnym) jest nagrany sygnał mowy naturalnej - najlepiej po jednym
zdaniu dla głosu męskiego i żeńskiego. Tak przygotowany sygnał oryginalny przesyłany jest
badanym kanałem telekomunikacyjnym tworząc na wyjściu systemu sygnał „zdegradowany”.
Oba sygnały stanowią dalej podstawę oceny. W pierwszym etapie oceniane jest opóźnienie
między próbkami i ewentualnie wprowadzana jest odpowiednia korekcja. Następnie oba sygnały
zostają poddane szeregowi transformacji modelujących poszczególne etapy przetwarzania
dźwięku w ludzkim układzie słuchowym, włączając w to przede wszystkim: specyficzną analizę
w dziedzinie częstotliwości i nieliniowość przetwarzania natężenia dźwięku. Ewentualne
przesunięcia próbek w czasie są uwzględniane w dalszych etapach obróbki sygnału. Na końcu
zaimplementowano tzw. model kognitywny, którego zadaniem jest wydanie ostatecznej oceny
na podstawie porównania reprezentacji wewnętrznych obu sygnałów.
Metoda 3SQM jest metodą nieintruzyjną [44], w której nie jest wymagana znajomości
sygnału oryginalnego. Jakość mowy jest oceniana na podstawie analizy typowych zniekształceń
i zakłóceń: widm odbiegających od typowych widm mowy, obecności szumu, nieciągłości
sygnału w czasie. Badania wykazują, że odbiorca koncentruje się na najbardziej dokuczliwym
zniekształceniu i głównie to zniekształcenie wpływa na jego ocenę. Uwzględniono to w
schemacie działań algorytmu (rys.4.3-2). Badania przeprowadzone m.in. przez firmę Opticom
wykazują dużą korelację wyników MOS wyznaczonych według metod 3SQM i PESQ.
Rys. 4.3-2. Przetwarzanie mowy w metodzie 3SQM
Metody oceny jakości obrazu. W procesie oceny jakości obrazu istotne znaczenie mają
cechy zmysłu wzroku, takie jak: czułość wzroku, maskowanie obiektów tłem, wrażliwość na
barwy (np. oko jest bardziej czułe na barwę zieloną, niż na czerwoną i niebieską), bezwładność
(w dziedzinie czasu), rozdzielczość przestrzenna (kątowa). Zmysł wzroku szczególnie jest
uwrażliwiony na kontrast, uwypuklając granice pomiędzy polami o niewiele różniącej się
luminancji. Z drugiej strony, niejednorodne tło jest w stanie całkowicie zamaskować obiekt,
staje się on niezauważalny. Z tego powodu algorytmy szacowania jakości obrazu ruchomego
9 W 2001 roku ITU-T zaaprobowało metodę PESQ jako nowy standard P.862, który zastąpił wcześniej stosowaną
metodę PSQM.
- 28 -
muszą się opierać na modelu percepcji HVS (Human Visual System). W modelu tym [3]
uwzględnia się zjawiska przestrzenne i zachodzące w czasie. Modelując zjawiska „czasowe”,
uwzględnia się dwa rodzaje bezwładności oka: krótko- i długookresową. Wymaga to
przepuszczenia sekwencji wideo przez dwa filtry, o transmitancjach pokazanych na rys.4.3-3.
Rys. 4.3-3. Filtry modelujące bezwładność oka wg [57]
W modelowaniu HVS najważniejszym problemem jest uwzględnienie wrażliwości zmysłu
wzroku na kontrast, a także spadku tej wrażliwości w obecności niejednorodnego tła, czyli cecha
tzw. maskowania. Maksymalna wrażliwość na kontrast (minimalny próg detekcji) występuje w
procesie obserwowania obiektów o rozmiarach ok. ¼ stopnia kątowego. Dla mniejszych
rozmiarów wrażliwość na kontrast CSF (Contrast Sensitivity Function), zdefiniowana jako
odwrotność progu detekcji, zmniejsza się powoli, lecz dla rozmiarów większych wrażliwość ta
zmniejsza się bardzo szybko (rys.4.3-4). W obecności kontrastowego tła CSF spada, tym
bardziej, im bardziej kontrastowość tła przekracza kontrastowość obserwowanego obiektu.
Modelowanie zjawiska maskowania polega na znalezieniu zależności CSF od tła. Zwykle
przyjmuje się, że w obecności tła niekontrastowego próg detekcji wynosi 1. Jeśli kontrastowość
tła osiąga wielkość porównywalną z wielkością kontrastu obiektu względem tła, wówczas próg
detekcji obiektu podnosi się. Oznacza to, że wrażliwość oka maleje i zaznaczają się maskujące
właściwości tła.
Rys. 4.3-4. Wrażliwość na kontrast w funkcji rozdzielczości przestrzennej wg [58]
Ponieważ na zjawisko maskowania ma wpływ rozmiar obiektu, więc wymagana jest
filtracja obrazu z wykorzystaniem dwóch filtrów „przestrzennych”. Pierwszy z nich przepuszcza
duże pola, zaś drugi – drobne szczegóły obrazu. Filtry te uwzględniają również orientację
obiektów w płaszczyźnie obrazu. Jest to potrzebne, gdyż przykładowo tło złożone z poziomych
pasów dobrze zamaskuje obiekt o orientacji poziomej, a w ogóle nie zamaskuje obiektu o
orientacji pionowej. Po wykonaniu tak rozumianej filtracji percepcyjnej można wyliczyć próg
maskowania. Wyliczając percepcyjną odległość sygnału oryginalnego i odebranego, a więc w
- 29 -
pewnym sensie przewidując wynik oceny MOS badań subiektywnych, uwzględnia się
zakłócenia przekraczające próg maskowania. Schemat obliczeń MOS pokazano na rys.4.3-5.
Rys. 4.3-5. Obliczenie MOS z uwzględnieniem modelu percepcji obrazu
W końcu lat 90-tych zawiązała się grupa badawcza VQEG (Video Quality Experts Group),
stawiająca sobie za cel opracowanie i przedstawienie ITU-T do normalizacji algorytmu
obiektywnej oceny jakości sygnału wideo VQM (Video Quality Metric). Rozpisano konkurs, w
którym wzięło udział szereg zainteresowanych ośrodków badawczych. W wyniku
wszechstronnych badań porównawczych zaproponowanych algorytmów, po dwóch edycjach
konkursu, ostatecznie wyselekcjonowano 4 algorytmy, opracowane przez takie instytucje, jak:
NASA (National Aeronautics and Space Administration) z USA, Yonsei University z Korei,
Centro de Pesquisa e Desenvolvimento z Brazylii oraz National Telecommunications and
Information Administration / Institute for Telecommunication Sciences z USA. Najbardziej
praktycznym z nich wydaje się być dalej opisany model DVQ z NASA.
Model DVQ (Digital Video Quality) oceny jakości obrazu, zaproponowany przez NASA
(National Aeronautics and Space Administration) łączy w sobie wiele aspektów czułości wzroku
ludzkiego w prosty algorytm przetwarzania obrazów. W modelu tym (rys. 4.3-6) danymi
wejściowymi metryki jest para sekwencji obrazów 58, 59]: testowa (T) i referencyjna (R).
Pierwszy krok składa się ze zmiennego próbkowania, transformacji kolorów, w celu
ograniczenia przetwarzania do interesujących nas regionów i wyrażenia sekwencji w przestrzeni
kolorów percepcyjnych. Sekwencje te są następnie dzielone na bloki (BLK) i poddawane
dyskretnej transformacji cosinusowej (DCT), której wyniki są następnie transformowane do
postaci kontrastu lokalnego (LC). Następnym krokiem jest filtracja czasowa (TF), która jest
implementacją czasowej części kontrastowej funkcji czułości. Każdy współczynnik DCT jest
dzielony przez wartość progu widzialności, co stanowi implementację przestrzennej części
kontrastowej funkcji czułości (CSF). W następnym kroku obie sekwencje są odejmowane od
siebie, a sekwencja różnic jest poddawana operacji maskowania kontrastu (CM), która zależy
również od sekwencji odniesienia. Końcowym etapem jest wyliczenie współczynnika
wzrokowej jakości (VQ) na podstawie zamaskowanych sekwencji różnic przedstawionych w
wymiarze czasowo-przestrzennym oraz – wymiarze chromatycznym (POOL).
Rys. 4.3-6. Schemat blokowy procesu tworzenia metryki DVQ wg [59]
Prostota modelu DVQ umożliwia jego uruchomienie w czasie rzeczywistym i wymaga
przy tym jedynie skromnych zasobów obliczeniowych. Jednym z najbardziej złożonych i
czasochłonnych elementów proponowanej metody jest operacja filtracji przestrzennej.
- 30 -
Implementacja filtracji przestrzennej wykonana jest w postaci wielokrotnych przestrzennych
filtrów pasmowych, które są charakterystyczne dla wzroku ludzkiego. Krok ten został
przyspieszony poprzez użycie dyskretnej transformacji DTC w celu dekompozycji kanałów
przestrzennych. Model ten ma współczynnik korelacji z metodą oceny subiektywnej rzędu 0.720.83 i jest przeznaczony dla wyświetlaczy o zmiennej rozdzielczości oraz różnych odległości
oglądania. Model ten może być zatem używany nie tylko w telewizji cyfrowej HDTV, ale
również w szerokim zakresie cyfrowych aplikacji wideo, takich jak: wideo monitory, transmisje
internetowe, wideo-telefonia.
Nieco inne podejście do problemu oceny jakości sekwencji wideo zaproponowano w
modelu NTIA/ITS firmy National Telecommunications and Information Administration /
Institute for Telecommunication Sciences. Model ten opiera się bowiem na obliczaniu gradientu
różnicy pomiędzy wejściowymi i wyjściowymi obrazami, w celu otrzymania obiektywnej miary
jakości wideo [59]. Gradienty te reprezentują chwilowe zmiany w wartościach pikseli w czasie o
przestrzeni. Model wykorzystuje trzy typy gradientów przedstawione na rys. 4.3-7. Są to
informacje o zmianie położenia w poziomie (SIn), informacje o zmianie położenia w pionie (SIv)
oraz informacje o zmianie wartości w czasie (TI).
Rys. 4.3-7. Typy gradientów dla sekwencji obrazów w modelu NTIA/ITS
Z wejściowych i wyjściowych sekwencji obrazów ekstrahowane są skalarne cechy, na
których podstawie tworzone są statystyki sumaryczne, które mogą być porównywane ze sobą.
Parametry oparte na skalarnych cechach (np. pojedyncza ilość informacji w ramce wideo) są
dobrze skorelowane z subiektywną jakością. Dlatego też liczba informacji odniesienia niezbędna
do przeprowadzenia wiarygodnych pomiarów jakości jest dużo mniejsza, niż w przypadku
użycia kompletnej ramki wideo. Przynosi to znaczące korzyści, szczególnie w takich
zastosowaniach jak: utrzymanie i monitorowanie sieci, detekcja błędów, automatyczna kontrola
jakości oraz dynamiczna optymalizacja zasobów sieciowych. Zgromadzone wartości
wyjściowych cech skalarnych nie wymagają dużych zasobów pamięci, więc mogą być
skutecznie archiwizowane dla przyszłego użycia jako dane odniesienia. Wobec tego czasowe
zmiany w cyfrowym systemie wideo mogą być wykrywane przez proste porównanie danych
archiwalnych z aktualnymi wartościami cech.
- 31 -
4.4
Parametryczne metody oceny
Parametryczne metody oceny jakości mowy pozwalają na oszacowanie jakości usługi na
podstawie pewnych wybranych parametrów połączenia telekomunikacyjnego. Należy do nich
dalej opisany tzw. E-model [40, 56], zdefiniowany w zaleceniu G.107 ITU-T i stosowany dla
połączeń telefonicznych. W modelu tym tworzony jest matematyczny model uwzględniający
wszystkie elementy, wchodzące w skład testowanej sieci lub systemu. Na jego podstawie
obliczany jest parametr R, będący łączną miarą jakości mowy. Parametr ten może być obliczony z
następującej zależności:
R = Ro − I s − I d − I e + A
4.4-1
gdzie: Ro – reprezentuje stosunek mocy sygnału do mocy szumu, Is – reprezentuje zniekształcenia
pojawiające się równocześnie z sygnałem mowy (szumy kwantyzacji PCM, sygnały wybierania
tonowego), Id – reprezentuje zniekształcenia wynikające z opóźnień wnoszonych w procesie
przetwarzania i transmisji, A – jest składnikiem korekcyjnym zależnym od specyfiki dostępu do
łącza, Ie – reprezentuje zniekształcenia transmisyjne wnoszone przez urządzenia (kodery, systemy
DSI itp) i jako taki może być wyrażony jako suma parametrów K poszczególnych N koderów
wchodzących w skład łącza:
I e = ∑n =1 K n
N
4.4-2
W tabeli 4.4-1 podano wstępnie ustalone wartości parametru K dla najpopularniejszych typów
koderów, zaś w tabeli 4.4-2 – wartości składnika korekcyjnego A w zależności od typu systemu.
Tabela 4.4-1. Wartość parametru K dla różnych typów koderów
Typ kodera
PCM
ADPCM (G.726-7)
LD-CELP (G.728)
ACELP (G.729)
VSELP (IS 54 USA)
GSM (RPE RTP)
GSM (ETS 300 581)
Przepływność [kbit/s]
64
40
16
8
8
13
6,5
K
0
2
20
15
20
20
25
Tabela 4.4-2. Wartości parametru A przyjmowane w E-modelu dla różnych systemów łączności
System łączności
Tradycyjna telefonia przewodowa
DECT
GSM
Telefonia satelitarna
A
0
5
10
20
Dla szeregu wartości parametru R określana jest jakość mowy metodą subiektywną.
Otrzymana w ten sposób krzywa odwzorowania (rys. 4.4-1) jest wykorzystywana do określenia,
w następnych testach, jakości mowy wyłącznie na podstawie parametru łącznego R, który może
być obliczony na podstawie danych o systemach i sieciach. A zatem bez dokonywania pomiarów
można określić jakość sygnału mowy, ponieważ związek pomiędzy parametrem R a subiektywną
miarą jakość MOS jest już wyznaczony.
- 32 -
Rys. 4.4-1. Zależność MOS od parametru R
W wielu ośrodkach naukowo-badawczych kontynuowane są prace mające na celu lepsze
dopasowanie E-modelu do nowych sposobów świadczenia usług telefonicznych, przede
wszystkim VoIP [7]. Prowadzone są również badania mające na celu powiązanie współczynnika
R definiowanego z użyciem parametrów QoS jakości świadczenia usługi na poziomie sieci
pakietowej IP (opóźnienie pakietów, zmienność opóźnienia pakietów, stopień utraty pakietów,
stopień przekłamań pakietów) z miarami oceny subiektywnej w skali MOS, odnoszonymi do
jakości świadczenia usługi na poziomie aplikacji typowo multimedialnych, takich jak:
wideokonferencja i wideotelefonia. Między innymi prace takie są prowadzone w ramach
Projektu Badawczego Zamawianego (PBZ-MNiSW-02-II/2007), w zadaniu pt. „Usługi i sieci
teleinformatyczne następnej generacji – aspekty techniczne, aplikacyjne i rynkowe” kierowanym
przez Prof. dr hab. inż. Wojciecha Burakowskiego i realizowanym wspólnie z zespołami z
Politechniki Warszawskiej, Politechniki Gdańskiej, Akademii Górniczo-Hutniczej, Wojskowego
Instytutu Łączności, Naukowej Akademickiej Sieci Komputerowej oraz Instytutu Łączności.
Sieć laboratoryjna IP QoS budowana w tym projekcie przez zespół z IŁ-PIB będzie służyć
między innymi do empirycznego wyznaczenia krzywej zależności (podobnej do tej z rys. 4.4-1)
wiążącej poziomy MOS z tzw. rozszerzonym współczynnikiem R o parametry QoS warstwy
pakietowej dla usług multimedialnych wybranych kategorii, takich jak: wideotelefonia
internetowa, wideokonferencja internetowa, internetowe gry sieciowe, itd. Mając wyznaczone
krzywe MOS w funkcji zmodyfikowanego parametru R, ocena jakości świadczenia usługi
multimedialnej sprowadza się do pomiaru parametrów QoS dla sieci pakietowej IP (opóźnienie
pakietów, zmienność opóźnienia pakietów, stopień utraty pakietów, stopień przekłamań
pakietów) i wyznaczenia wartości MOS z tej krzywej. Sposób pomiaru tych parametrów z
użyciem analizatora sieci IP firmy Agilent, zakupionego ze środków inwestycyjnych IŁ-PIB,
omówiono w Załączniku nr 1 do tej pracy.
- 33 -
5
PODSUMOWANIE
Dla oceny jakości aplikacji multimedialnych wykorzystywanych przez urzędy jednostek
samorządowych działających w środowisku sieci IP QoS, niezbędna jest ocena jakości mowy,
sygnałów fonicznych i wizyjnych. Ze względu na dostępność norm i sprawdzonych rozwiązań
można się tu oprzeć na omówionych w pracy metodach oceny obiektywne, które jako gotowe
narzędzia są oferowane przez wiele firm. Niestety są to bardzo drogie narzędzia. O wiele
prostsze i praktyczniejsze w zastosowaniu wydają się być metody parametryczne, oparte na
zmodyfikowanym E-modelu, w sposób omówiony w punkcie 4.4. W kolejnym etapie pracy
można by podjąć próbę skonstruowania i empirycznego zweryfikowania zmodyfikowanego
współczynnika R, zawierającego parametry połączenia IP (przepływność, opóźnienie pakietów,
jitter opóźnienia, stopa utraty pakietów), a następnie – próbę wyznaczenia krzywej MOS funkcji
R dla każdej z przedmiotowych aplikacji multimedialnych. Takie rozwiązanie wydaje się być
interesujące również i z tego względu, że do tego celu mogła by być wykorzystana sieć
laboratoryjna IP QoS, wykonana ze środków Projektu Badawczego Zamawianego (PBZMNiSW-02-II/2007).
- 34 -
LITERATURA
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
[24]
[25]
[26]
[27]
[28]
Ahuja S. i inni: Multimedia collaboration. AT&T Technical Journal, September/October 1995
Aldermeshian H., i inni: The video communication decade. AT&T Technical Journal,
January/February 1993
ANSI T1.801.01-1996 “Digital transport for video teleconferencing/ videotelephony signals –
Video test scenes for subjective and objective performance assessment” – American National
Standards Institute, 1996
Brachmański S, Łabno P.: Wpływ zagubień pakietów na zrozumiałość mowy w sieciach IP, KST
2002
Crouch E. i inni: ISDN personal video. AT&T Technical Journal, January/February 1993
Crouch P. i inni: Screen-based multimedia telephony. AT&T Technical Journal,
September/October 1995
Ding L., Goubran R.A.: Speech quality prediction in VoIP using the extended E-model. Global
Telecommunications Conference, 2003, Vol. 7, pp. 3974- 3978
Dziga J.: Zagadnienia sygnałowe w transmisji ADSL. Materiały z konferencji pt Cyfrowe łącza
abonenckie ADSL/VDSL; Akademia Górniczo-Hutnicza w Krakowie - Katedra Telekomunikacji,
Wyd. FPT, lipiec 1998.
Early S. H. i inni: The VideoPhone 2500-Video Telephony on Public Switched Telephone Network.
AT&T Technical Journal, January/February 1993
ETSI Technical Specification TS 102 080 V 1.3.1 (1998-11) : Transmission and Multiplexing
(TM); Integrated Services Digital Network (ISDN) basic rate access; Digital transmission system
on metalic local lines, 1998
ETSI ETR 250; Speech communication quality from mouth to ear for 3,1 kHz handset telephony across
networks, July 1996
ETSI EG 201 377-1: Speech Processing, Transmission and Quality Aspects (STQ); Specification and
measurement of speech transmission quality. April 1999
ETSI TS 102 024-5 v4.1.1. Quality of Service (QoS) Measurement Methodologies. 2003
ETR 152 (02/1995): High bit rate digital subscriber line transmission system (HDSL) on metallic
local lines.
Fenton F., Sipes J.: Architectural and Technological Trends in Access: An Overview. Bell Labs
Technical Journal, Vol. 1, No 1, Summer 1996.
Filipiak J., i inni: Sieci dostępowe dla usług szerokopasmowych. Tom I. Wyd. FTP, Kraków 1997.
Gut-Mostowy H.: Telekomunikacyjne usługi multimedialne - aspekty ogólne. Przegląd
Telekomunikacyjny i Wiadomości Telekomunikacyjne nr 1, 1999.
Gut-Mostowy H.: Techniki transmisyjne w multimedialnych, abonenckich sieciach dostępowych.
Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne nr 9, 1998
ITU-R “Methodology for the subjective assessment of the quality of television pictures",
International Telecommunications Union BT.500-7, 1995
ITU-T Recommendation F.300 (03/1993): Videotex service
ITU-T Recommendation F.701 (11/1988): Teleconference services
ITU-T Recommendation F.702 (03/1997): Multimedia conference services
ITU-T Recommendation F.711 (08/1993): Audiographic conference teleservice for ISDN
ITU-T Recommendation F.720 (08/1992): Videotelephony services general
ITU-T Recommendation F.721 (08/1992): Videotelephony teleservice for ISDN
ITU-T Draft Recommendation F.722 (1995): Broadband videotelephony services
ITU-T Recommendation F.723 (07/1996): Videotelephony services in the Public Switched
Telephone Network (PSTN)
ITU-T Recommendation H.252.0 (11/2000): Series H: Audiovisual and Multimedia Systems.
Infrastructure of audiovisual services - Transmission multiplexing and synchronization
- 35 -
[29] ITU-T Recommendation H.320 (05/1999): Narrowband Visual Telephone Systems and Terminal
Equipment
[30] ITU-T Recommendation H.323 (05/1999): Series H: Audiovisual and Multimedia Systems.
Infrastructure of audiovisual services - Systems and terminal equipment for audiovisual services
[31] ITU-T Recommendation T.120 (07/1996): Data protocols for multimedia conferencing
[32] [P.800] ITU-T Recommendation P.800: Method for subjective determination of transmission
quality, 1996
[33] ITU-T P.810: Modulated Noise Reference Unit (MNRU). February 1996
[34] ITU-T P.830: Subjective Performance Assessment of Telephone-Band and Digital Codecs. February
1996
[35] ITU-T P.910: Subjective video quality assessment for multimedia applications, 1996
[36] ITU-T P.911: Subjective audiovisual quality assessment for multimedia applications
[37] ITU-T P.861: Objective Quality Measurement of Telephone-Band Speech Codecs. February 1998
[38] ITU-R Recommendation BS 1387: Method for Objective Measurements of Perceived Audio
Quality (PEAQ), 1998
[39] ITU-T Recommendation P.862: Perceptual evaluation of speech quality (PESQ), an objective
method for end-to-end speech quality assessment of narrowband telephone networks and speech
codecs
[40] ITU-T Recommendation . G.107. The E-Model, A Computational Model For Use in Transmission
Planning. 2003
[41] ITU-T Recommendation J.140, Subjective picture quality assessment for digital cable television
[42] ITU-T Recommendation J.143, User requirements in digital cable television
[43] ITU-T Recommendation J.144, Objective perceptual video quality measurement techniques for
digital cable television in the presence of a full reference, March 2004
[44] ITU-T Recommendation P.563, Single-ended method for objective speech quality assessment in
narrow-band telephony applications, May 2004
[45] Jankowski P.: Protokół IP wersja 6 Telekomunikacja i techniki informacyjne, 1-2/2002
[46] Lech J. IPv6 - nowe możliwości. Adres Internetowy: http://kni.ae.krakow.pl/html/ipv6.html, 2000
[47] Lawrence V. B., i inni: Broadband Access to the Home on Copper. Bell Labs Technical Journal,
Vol. 1, No 1, Summer 1996.
[48] Kula S., Dymarski P. i inni : Multimedialne systemy telekomunikacyjne w sieciach pakietowych.
KST 1999
[49] Kula S.: Subiektywne i obiektywne metody badania jakości mowy przesyłanej w sieciach
telekomunikacyjnych. Pomiary w telekomunikacji, nr 20, Warszawa 2001
[50] Norma ETS 328: Transmission and Multiplexing (TM); Asymetric Digital Subscriber Line (ADSL);
Requirements and performance.
[51] Olshansky R.: Broadband Digital Subscriber Line - A full-service network for the Cooper plant.
Telephony, June 12 1995
[52] Pach A. R., i inni: Sieci dostępowe dla usług szerokopasmowych. Tom II. Wyd. FTP, Kraków 1997
[53] Papir Z, i inni: Sieci dostępowe dla usług szerokopasmowych. Tom III. Wyd. FTP, Kraków 1997
[54] RFC 1889: RTP: A Transport Protocol for Real-Time Applications. January 1996
[55] Sterling W. i inni: Multimedia databases and servers. AT&T Technical Journal,
September/October 1995
[56] Trzaskowska J.: Ocena jakości sygnału mowy w oparciu o Model E w zastosowaniu do krajowej sieci
telefonicznej. Rozprawa doktorska. Instytut Łączności. 2000
[57] Winkler S. A perceptual distortion metric for digital color video, Human Vision and Electronic
Imaging IV, Bellingham 1999
[58] Wolf S, Pinson M.: In-service performance metrics for MPEG-2 video systems. In Proc. Made to
Measure 98 – Measurement Techniques of the Digital Age technical Seminar, International
- 36 -
Academy of Broadcasting (IAB), ITU and Technical University of Brunschweig, Montreux,
Switzerland, November 1998
[59] Wolf S, Pinson M.: Video Quality Measutment Techniques, NTIA Raport
02-392, Czerwiec 2002
- 37 -
ZAŁĄCZNIK 1: Specyfikacja pomiarów podstawowych parametrów QoS dla
sieci pakietowych oraz jakości usług VoIP i IP TV
- 38 -
Pomiar czasu odpowiedzi (Round Trip Delay)
Celem badania jest pomiar czasu dopowiedzi w sieci opartej na protokole IP na odcinku
sieci WAN między dwoma punktami końcowymi. Test umożliwia pomiar czasu odpowiedzi
(parametru Round Trip Delay RFC 2544). Realizowane jest to poprzez transmisję specjalnie
oznaczonych ramek, które są „odbijane” przez urządzenie zlokalizowane zdalnie.
Rys. Z1-1. Konfiguracja testowa dla pomiaru czasu odpowiedzi (Round-trip delay)
Możliwa jest do zastosowania konfiguracja przedstawiona na rys. Z1-1, z pojedynczym
urządzeniem pomiarowym, z wykorzystaniem urządzenia po stronie zdalnej zapewniającym
odesłanie pakietu kontrolnego do nadajnika (pomiar czasu odpowiedzi).
Urządzeniami pomiarowymi zarówno po stronie generacji jak również stronie zdalnej są
Framescope pro (zapewniające dokładność pomiaru min. rzędu 1ms) podłączone do różnych
lokalizacji sieci WAN połączonych za pomocą VPN.
Ogólna metodyka wykonywania badań:
1. Należy skonfigurować interfejsy sieciowe, urządzenie po stronie odbiorczej ustawić w
tryb pracy Loopback
2. Należy ustalić wielkość pakietów testowych (w bajtach), dokonać wyboru protokołu (o
ile jest to możliwe należy zastosować protokół wykorzystywany przez aplikacje
użytkowe – np. UDP, który jest stosowany przez aplikacje VoIP) wykorzystywanego
przez ruch testowy oraz określić adres (adresy IP lub adresy MAC) generującego oraz
zdalnego urządzenia wyposażonego w interfejs sieciowy, które ma za zadanie odsyłać
otrzymane pakiety testowe do nadajnika w przypadku pomiaru czasu odpowiedzi,
3. Należy ustalić parametry związane z jakością testu: ilość testowych pakietów dla jednej,
czas przerwy pomiędzy testami, czas trwania całego testu (np. 20 pakietów dla
pojedynczego testu. Testy wykonywane co 30 min w przeciągu 8 godzin największego
obciążenia sieci)
4. Na podstawie zarejestrowanych danych wykonywane są obliczenia wielkości
chwilowych, średnich, inne parametry związane ze statystyką pomiaru.
Przeprowadzenie testu
1. Określenie czasu połączenia, odstępów czasowych pomiędzy połączeniami, ilości
przeprowadzonych połączeń (np. czas połączenia – 5 minut, połączenia wywoływane co
30 min, ilość wszystkich połączeń 50)
2. Zapisywanie wyników parametrów dla każdej sesji,
3. Analiza polegająca na obliczaniu wartości średnich jako wartości ostatecznych
otrzymanych wyników.
Kryterium oceny:
zgodność z wartością zakontraktowaną w umowie SLA.
- 39 -
Współczynnik utraty pakietów
Celem badania jest pomiar współczynnika utraty pakietów w sieci opartej na protokole IP
na odcinku sieci WAN między dwoma punktami dostępu do usług.
Przygotowanie do badań:
Przygotowanie konfiguracji badaniowej złożonej z dwóch urządzeń pomiarowych wraz z
wyłączeniem ruchu użytkowego na łączu WAN.
Opis badania: konfiguracja badaniowa wymaga zapewnienia dwóch urządzeń
pomiarowych, przy czym każde z nich dołączone jest do jednego punktu dostępowego. Jedno z
urządzeń pełni rolę generatora ruchu, drugie pełni funkcję odbiornika. Pomiar polega na
porównaniu liczby pakietów wysłanych przez generator oraz pakietów odebranych po stronie
odbiornika. w określonym okresie pomiarowym. W trakcie pomiaru łącza WAN podlega
„wysyceniu” ruchem testowym do gwarantowanej przepustowości i obserwacji liczby
utraconych pakietów. W typowym teście, w każdym kolejnym kroku pomiarowym ilość
generowanych danych jest redukowana o 10%, aż do momentu braku efektu utraty pakietów.
Możliwe jest zastosowanie trybu pomiaru współczynnika utraty pakietów w trybach downstrem,
upstream oraz dwukierunkowym.
Pomiar współczynnika utraty pakietów wymaga wyłączenia łącza do sieci WAN z bieżącej
obsługi, tzn. dopuszczenie do wymiany na łączu WAN jedynie ruchu testowego i związanego z
procesami utrzymaniowymi łącza (np. protokoły routingu).
Urządzeniami pomiarowymi zarówno po stronie generacji jak również stronie zdalnej są
Framescope Pro, podłączone do różnych lokalizacji sieci WAN połączonych za pomocą VPN.
Ogólna procedura wykonywania badań:
1. Należy skonfigurować interfejsy sieciowe urządzeń, dla trybu dwukierunkowego
urządzenie po stronie odbiorczej ustawić w tryb pracy Loopback
2. Należy ustalić wielkość pakietu dla ruchu testowego, dokonać wyboru protokołu (o ile
jest to możliwe należy zastosować protokół wykorzystywany przez aplikacje użytkowe –
np. UDP, który jest stosowany przez aplikacje VoIP) wykorzystywanego przez ruch
testowy oraz określić adresy (adresy IP lub adresy MAC) nadajnika i odbiornika
3. Jeśli pomiar dotyczy określonej klasy usługowej, należy zapewnić, aby ruch testowy
spełniał warunki dla tej klasy.
4. Wykonać inne ustawienia niezbędne dla danego urządzenia lub , w tym zapobiegające
kompresji zawartości pakietów testowych.
Przeprowadzenie testu
1. Test realizowany jest poprzez obserwację wyników przy malejącym o 10 %
gwarantowanego pasma IP wolumenie ruchu (w granicach 100%-10%) lub osiągnięciu
zjawiska braku utraty pakietów
2. Zapamiętywanie współczynnika utraty pakietów dla wszystkich wolumenów ruchu.
3. Przeprowadzenie analizy statystycznej wyników dla każdego wolumenu
Kryterium oceny:
zgodność z wartością zakontraktowaną w umowie SLA.
- 40 -
Zmienność opóźnienia pakietów – jitter
Celem badania jest pomiar wariancji opóźnienia oraz wariancji czasu odpowiedzi w sieci
opartej na protokole IP na odcinku sieci WAN między dwoma punktami końcowymi.
Opis badania: Analizator FrameScope Pro nie umożliwia pomiaru jittera, można jednak go
wyliczyć na podstawie badać pomiaru czasu odpowiedzi. Konfiguracja badaniowa jest
identyczna z zastosowaną do pomiaru czasu odpowiedzi. Na podstawie pomiaru min. 3
kolejnych pakietów ruchu testowego możliwe jest wyznaczenie wariancji czasu odpowiedzi.
Większa liczba pakietów testowych implikuje większą dokładność. Pomimo braku
jednoznacznych rekomendacji, za minimalną liczbę pakietów należy przyjąć liczbę 10.
Kryterium oceny:
zgodność z wartością zakontraktowaną w umowie SLA. Wariancja
opóźnienia jest wyznaczana w oparciu o metodę opisaną w dokumencie RFC 3393
- 41 -
Pomiar VoIP
Celem pomiaru jest określenie parametrów subiektywnych oraz obiektywnych parametrów
dla usługi VoIP. Parametrami tymi są:
• Średnia utrata pakietów
• Czas odpowiedzi (Round Trip Delay)
• Jitter
• R-Faktor
• MOS
Tryby pomiaru
1. Pomiar będzie realizowany za pomocą urządzeń – analizatorów VoIP (Framescope Pro)
służących jako urządzenia końcowe VoIP Rys. Z1-2.
2. Możliwa jest praca w trybie bezpośrednim (bez pośrednictwa serwera proxy) także w
trybie pośrednim (z pośredniczeniem serwera proxy) .
Rys. Z1-2. Tryb pomiaru urządzeniami końcowymi VoIP
Rys. Z1-3. Tryb pomiaru urządzeniami końcowymi VoIP w konfiguracji z serwerem proxy
Przygotowanie do badań
Połączenie urządzeń do sieci, w których odległe lokalizacje np. urzędy połączone są za
pomocą VPN. Urządzenia mają zaimplementowane protokoły służące do synchronizacji
Możliwe zastosowanie opcji połączenie urządzeń do modemów DSL
- 42 -
Konfiguracja urządzeń
1. Ustalenie wielkości pakietów transmitowanych pakietów , protokółu transportowego w
opcji Traffic VoIP generator .
2. Ustalenie w menu VoIP (dla obu urządzeń końcowych) protokołu sygnalizacyjnego. W
urządzeniu Framescope dostępne są : SIP, Megaco i H.323, zakresu numerów portów dla
protokołu sygnalizacyjnego oraz protokołu RTP.
3. Ustalenie w menu VoIP (dla obu urządzeń końcowych) kodeka, numeru strony
wywołującej połączenie oraz numeru żądanego, czasu trwania sesji.
4. Ustawienie adresu IP urządzenia, na które kierowane jest połączenie w polu SIP
Server.(w przypadku trybu z serwerem proxy ustawianie adresu IP serwera proxy).
Przeprowadzenie testu
1. Określenie czasu połączenia, odstępów czasowych pomiędzy połączeniami, ilości
przeprowadzonych połączeń (np. czas połączenia – 5 minut, połączenia wywoływane co
30 min, ilość wszystkich połączeń 50)
2. Zapisywanie wyników parametrów dla każdej sesji,
3. Analiza polegająca na obliczaniu wartości średnich jako wartości ostatecznych
otrzymanych wyników.
Kryterium oceny:
zgodność z wartością zakontraktowaną w umowie SLA.
- 43 -
Pomiar IP TV
Celem pomiaru jest określenie parametrów subiektywnych oraz obiektywnych parametrów
dla usługi VoIP. Parametrami tymi są:
• Ilość błędów w tablicach PAT/PTM/PCR
• Media Delivery Index DF określa maksymalne opóźnienia dla strumienia pakietów
• Media Delivery Index: LR – średnia ilość traconych informacji dla strumienia pakietów
• ZAP time parametr określający czas zmiany kanału przez użytkownika – możliwy do
pomiaru o ile serwer IPTV umożliwia taką funkcję
• Parametry związane z protokołem RTP (jitter, współczynnik utraty pakietów)
Rys. Z1-4. Pomiar IPTV
Tryb pomiaru
Pomiar realizowany jest poprzez podłączenie na jednym końcu sieci analizatora
Framescope Pro, zaś na drugim końcu serwera video. Obliczanie parametrów będzie
dokonywane na podstawie odtwarzania pliku umieszczonego na serwerze video. Analizator
umożliwia ustawienie wartości progowych dla każdego z parametrów. Wynik końcowy testu
zawiera informację o parametrach w odniesieniu do wartości progowych.
Konfiguracja urządzeń
Analizator Framescope Pro należy przypisać adres IP serwera video. Należy
skonfigurować serwer oraz analizator tak, aby posiadały jednolity port protokółu RTP. Dla tak
skonfigurowanego urządzenia należy ustalić wartości progowe każdego analizowanego
parametru.
Przeprowadzenie testu
Pojedynczy test składa się odtworzenia przez serwer pliku strumieniowego umieszczonego
na serwerze o określonej wielkości (np. 10 MB) zakodowanego w formacie MPEG.
Kryterium oceny:
zgodność z wartością zakontraktowaną w umowie SLA.
- 44 -