Opracowanie - Instytut Łączności
Transkrypt
Opracowanie - Instytut Łączności
Zakład Sieci (Z-2) WYBRANE ASPEKTY ELEKTRONICZNEJ ŁĄCZNOŚCI MULTIMEDIALNEJ STOSOWANEJ W NOWOCZESNYCH JEDNOSTKACH SAMORZADOWEJ ADMINISTRACJI PUBLICZNEJ Zadanie nr 3 Metody pomiarowe do oceny parametrów QoS platformy łączności elektronicznej używanej do udostępniania usług multimedialnych na potrzeby nowoczesnych jednostek administracji samorządowej Praca nr 02 30 001 8 Warszawa - Miedzeszyn Grudzień 2008 r. - 1 - Zakład Sieci (Z-2) Zadanie nr 3 Metody pomiarowe do oceny parametrów QoS platformy łączności elektronicznej używanej do udostępniania usług multimedialnych na potrzeby nowoczesnych jednostek administracji samorządowej Praca nr 02 30 001 8 Kierownik projektu: Opracował zespół w składzie: mgr inż. Dariusz Gacoń mgr inż. Gut Henryk – kierownik zadania inż. Waldemar Latoszek inż. Sylwester Nowak mgr inż. Jacek Saniewski mgr inż. Włodzimierz Zalewski Warszawa - Miedzeszyn Grudzień 2008 r. - 2 - SPIS TREŚCI 1 WPROWADZENIE................................................................................................................... 4 1.1 Wstęp....................................................................................................................................... 4 1.2 Przedmiot i cel pracy ............................................................................................................. 5 2 USŁUGI MULTIMEDIALNE STOSOWANE W NOWOCZESNYCH URZĘDACH JEDNOSTEK SAMORZĄDOWYCH – WYMAGANIA NA JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO ........................................................................................................... 6 2.1 Uwagi ogólne........................................................................................................................... 6 2.2 Wideotelefonia ........................................................................................................................ 7 2.2.1 Charakterystyka funkcjonalna usługi.............................................................................................7 2.2.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................10 2.3 Wideokonferencja ................................................................................................................ 11 2.3.1 Charakterystyka funkcjonalna usługi...........................................................................................11 2.3.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................12 2.4 Wideotekst – usługi transakcyjne....................................................................................... 13 2.4.1 Charakterystyka funkcjonalna usługi...........................................................................................13 2.4.2 Wymagania na QoS dla warstwy aplikacyjnej usługi..................................................................13 3 ANALIZA WPŁYWU PARAMETRÓW QoS PLATFORMY ŁĄCZNOŚCI ELEKTRONICZNEJ NA JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO .................... 14 3.1 Model odniesienia komunikacji multimedialnej nowoczesnego urzędu jednostki samorządowej ....................................................................................................................... 14 3.2 Analiza wpływu parametrów QoS warstwy dostępowej na jakość przekazu aplikacji multimedialnych................................................................................................... 15 3.3 Analiza wpływu parametrów QoS warstwy szkieletowej na jakość przekazu aplikacji multimedialnych................................................................................................... 20 4 PRZEGLĄD I CHARAKTERYSTYKA OGÓLNA METOD OCENY JAKOŚCI PRZEKAZU MULTIMEDIALNEGO .................................................................................. 24 4.1 Uwagi ogólne......................................................................................................................... 24 4.2 Metody oceny subiektywnej ................................................................................................ 25 4.3 Metody oceny obiektywnej .................................................................................................. 27 4.4 Parametryczne metody oceny ............................................................................................. 32 5 PODSUMOWANIE................................................................................................................. 34 LITERATURA ............................................................................................................................ 35 ZAŁĄCZNIK 1: Specyfikacja pomiarów podstawowych parametrów QoS dla sieci pakietowych oraz jakości usług VoIP i IP TV ................................................................... 38 - 3 - 1 WPROWADZENIE 1.1 Wstęp Przemiany społeczno-gospodarcze, które dokonują się obecnie w krajach wysoko rozwiniętych i w Polsce, mogą być postrzegane jako proces transformacji społeczeństwa przemysłowego w społeczeństwo informacyjne XXI-wieku. Przemianom tym towarzyszy intensywny rozwój zarówno technik informatycznych (komputery, oprogramowanie), jak i telekomunikacyjnych. Te ostatnie migrują w kierunku inteligentnych sieci telekomunikacyjnych, umożliwiających świadczenie tzw. usług „około telefonicznych” oraz – usług przekazywania wiadomości za pomocą co najmniej dwóch środków przekazu, takich jak mowa, ruchomy obraz, grafika itp., zwanych często mediami. Potrzeba wprowadzenia takiej kompleksowej wymiany informacji występuje zarówno w systemach informacji naukowej, medycznej, jak i w systemach edukacyjnych, bankowych, czy też w systemach komunikacji elektronicznej, używanych coraz częściej przez jednostki samorządowe administracji publicznej. Tę nową technikę komunikacji tworzą z jednej strony potrzeby bardziej ekspresyjnego, czyli multimedialnego komunikowania się ludzi, zaś z drugiej strony – wzrost możliwości operacyjnych sprzętu komputerowego i coraz to większa przepływność współczesnych systemów telekomunikacyjnych. Drugim wyraźnie wyeksponowanym trendem w rozwoju współczesnej telekomunikacji jest rozwój struktur sieciowych w kierunku jednolitej, konwergentnej architektury sieciowej opartej na szybkiej transmisji pakietowej z rodziną protokołów TCP/IP. Obecnie protokoły te są stosowane nie tylko w komputerowych sieciach rozległych, takich jak sieć Internet, ale także w sieciach lokalnych i coraz częściej w sieciach telekomunikacyjnych. Telekomunikacja XXIwieku to zatem wielo-medialna wymiana wiadomości cyfrowych, przesyłanych w jednolitej strukturze pakietów niezależnie od tego, czy pakiety te zawierają zakodowane sygnały audio i/lub wideo, czy też sygnały transmisji danych. - 4 - 1.2 Przedmiot i cel pracy Wyżej nakreślona wizja konwergentnej sieci telekomunikacyjnej z jednolitym protokołem komunikacyjnym, takim jak protokół TCP/IP sieci Internet, jest niewątpliwie rozwiązaniem kuszącym. Jednakże urealnienie tej wizji w skali globalnej, przy obecnym stanie technologicznym, nie jest przedsięwzięciem technicznie prostym, i jako takie wymaga rozwiązania wielu trudnych problemów. Szereg z nich koncentruje się wokół problematyki gwarantowania odpowiedniego poziomu jakości usług transportowych dla przekazów multimedialnych z zastosowaniem tego typu sieci. Wprowadzenie elektronicznych form kontaktu urzędu z obywatelem, a także – komunikacji elektronicznej pomiędzy komórkami organizacyjnymi wewnątrz danego urzędu, czy też między urzędami różnych szczebli, wynikające z inicjatywy eEurope 1 , wymaga budowy odpowiedniej infrastruktury teleinformatycznej w urzędach jako takich oraz wdrożenia szerokiego zakresu usług sieciowych. Z uwagi na ważność i poufność przekazywanych danych oraz multimedialny charakter tych przekazów, realizacja tych usług powinna być oparta na rozwiązaniach organizacyjnych i sieciowych gwarantujących jakość oferowanych usług QoS (od ang. Quality of Sernice). Problematyka ta, odniesiona do systemów komunikacji multimedialnej nowoczesnych urzędów jednostek samorządowych opartych na pakietowej łączności elektronicznej, jest przedmiotem niniejszej pracy. W szczególności praca ta zawiera: ⎫ opis funkcjonalny usług multimedialnych, takich jak: wideotelefonia, wideokonferencja i wideotekst, które są lub mogą być stosowane w nowoczesnych urzędach jednostek samorządowych oraz specyfikację parametrów QoS (na poziomie aplikacji) dla tych usług (rozdz. 2); ⎫ specyfikację platformy łączności elektronicznej systemów łączności multimedialnej wyżej wymienionych urzędów oraz analizę wpływu parametrów transmisyjnych tej platformy na jakość aplikacji multimedialnych stosowanych w tych urzędach (rozdz. 3); ⎫ przegląd i charakterystykę ogólną wybranych metod do oceny przekazu multimedialnego z grupy metod oceny subiektywnej, obiektywnej i parametrycznej (rozdz. 4) oraz ⎫ specyfikacje pomiarów podstawowych parametrów QoS dla sieci pakietowych oraz pomiarów jakości usług VoIP i IP TV, z użyciem analizatora sieci IP firmy Agilent typu N2620A, zakupionego ze środków inwestycyjnych IŁ-PIB z 2008 roku. 1 Zapisy zawarte w Inicjatywie eEurope zobowiązują organy administracji publicznej wszystkich i państw członkowskich Unii Europejskiej, a zatem i Polski, do świadczenia usług na rzecz obywateli i przedsiębiorców w oparciu o łączność elektroniczną i komunikację multimedialną. - 5 - 2 USŁUGI MULTIMEDIALNE STOSOWANE W NOWOCZESNYCH URZĘDACH JEDNOSTEK SAMORZĄDOWYCH – WYMAGANIA NA JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO 2.1 Uwagi ogólne Najogólniej rzecz biorąc, usługi multimedialne to taka kategoria łączności, która umożliwia zdalne przekazywanie wiadomości pomiędzy odbiorcami za pomocą co najmniej dwóch środków przekazu, takich jak: mowa, ruchomy obraz, tekst, grafika, itp., zwanych często mediami. Zwykle usługi te są utożsamiane z tzw. serwerami usług, które reprezentują sobą pewne zestawy urządzeń, realizujących funkcje przechowywania i udostępniania materiału multimedialnego związanego z danymi usługami. Serwery określonych usług multimedialnych są zależne od tych usług i są przez nie całkowicie definiowane. Z tego względu w dalszej części pracy nie będą omawiane techniczne rozwiązania serwerów, lecz jedynie usługi, które je funkcjonalnie definiują. Usługi multimedialne, realizując w ramach sesji wiele połączeń telekomunikacyjnych, mogą łączyć ze sobą wielu uczestników, a także dodawać i/lub usuwać źródła informacji, czy też dołączać dodatkowych uczestników sesji lub ich eliminować. Usługi te są powszechnie kojarzone z takimi pojęciami, jak: biblioteka wideo, programy edukacyjne, tele-zakupy, usługi bankowe, wideotelefonia, wideokonferencja, poczta elektroniczna, gry komputerowe, wideo na żądanie, serwis informacyjny i reklamowy itd. Powołana przez Międzynarodową Unię Telekomunikacyjną specjalna Komisja Studiów SG16 (Multimedia Services and Systems) wszystkie te aplikacje sklasyfikowała w pięć, standaryzowanych kategorii usług multimedialnych, takich jak: ⎫ wideotelefonia, ⎫ wideotekst, ⎫ interaktywna prezentacja audiowizualna, ⎫ wideokonferencja oraz ⎫ telekonferencja audiograficzna. Jak wcześniej wspomniano, inicjatywa eEurope zobowiązuje organy władzy publicznej do świadczenia usług na rzecz obywateli i przedsiębiorców w oparciu o łączność elektroniczną i komunikację multimedialną. Wprowadzenie elektronicznych form kontaktu urzędu z obywatelem, a także – komunikacji elektronicznej pomiędzy komórkami organizacyjnymi wewnątrz danego urzędu, czy też między urzędami różnych szczebli, rzecz jasna nie będzie obejmować wszystkich z wyżej wymienionych kategorii usług multimedialnych. Uwzględniając specyfikę tych kontaktów z jednej strony i korzyści ze stosowania elektronicznych form kontaktu ze strony drugiej, można zaryzykować stwierdzenie, że kontakty te będą realizowane z wykorzystaniem jedynie trzech kategorii usług multimedialnych, takich jak: wideotelefonia (PSTN lub IP), wideokonferencja (PSTN lub IP) oraz niektóre aplikacje wideotekstowe (e-mail, elektroniczna skrzynka podawcza, EDI, strony informacyjne WWW), realizowane głównie na bazie sieci Internet. Z tego względu tylko te kategorie usług multimedialnych są omawiane w dalszej części rozdziału. W odniesieniu do każdej z nich podaje się krótką charakterystykę funkcjonalną usługi oraz specyfikuje się wymagania odnośnie tych parametrów QoS jakości świadczenia usługi na poziomie aplikacji, które są istotne dla tych aplikacji. - 6 - 2.2 Wideotelefonia 2.2.1 Charakterystyka funkcjonalna usługi Wideotelefonia jest rozumiana jako [17, 24] usługa telekonwersacji audiowizualnej, która umożliwia przeprowadzanie na bieżąco dwukierunkowej, symetrycznej transmisji głosu i ruchomych kolorowych obrazów pomiędzy dwoma dowolnymi abonentami, za pomocą istniejących sieci telekomunikacyjnych. Usługa ta może być dostępna za pośrednictwem urządzeń terminalowych wolno stojących, tzw. wideotelefonów lub odpowiednio wyposażonych komputerów osobistych typu IBM PC. Za datę wprowadzenia wideotelefonii uważa się powszechnie rok 1964, kiedy to amerykańska firma AT&T po raz pierwszy zaprezentowała urządzenie umożliwiające równoczesny przekaz głosu i wolnozmiennych obrazów osób rozmawiających z użyciem publicznej komutowanej sieci telefonicznej. W początkowym okresie rozwoju, wideotelefonia ze względu na wysokie koszty zarówno urządzeń terminalowych, jak eksploatacji była dedykowana głównie dla abonentów biznesowych i z tego względu rozwijała się bardzo wolno. Na przełomie lat 1990/1991 na rynku pojawiły się wideotelefony nowej generacji, umożliwiające przesyłanie głosu i ruchomego obrazu z szybkością odświeżania ok.20 ramek/sek.. Przykładem takich urządzeń jest wideotelefon T-View 100 firmy Alcatel. Wyglądem zewnętrznym przypomina on typowy telefon (rys. 2.2-1), uzupełniony ekranem ciekłokrystalicznym i wbudowaną w niego mini-kamerą telewizyjną. Na ekranie wyświetlany jest obraz ruchomy, przedstawiający na ogół rozmówcę z drugiego końca łącza, zaś kamera filmuje twarz osoby korzystającej z wideotelefonu. W ten sposób abonenci połączenia wideofonicznego słyszą i widzą się nawzajem. Rys. 2.2-1. Wideotelefon stacjonarny T-View 100 firmy Alcatel Od 1999 roku usługa wideotelefonii jest także oferowana w sieciach UMTS telefonii komórkowej trzeciej generacji 2 . Tak jak wideotelefon stacjonarny, wideokomórka ma wbudowaną kamerę cyfrową i kolorowy ekran ciekłokrystaliczny, i jest wyposażona w odpowiednie kodeki gwarantujące identyczną jakość dźwięku jak przy połączeniach 2 Telefon komórkowy o takich możliwościach zaprezentowała między innymi firma Panasonic na wystawie CeBIT 2000 w Hanowerze - 7 - „kablowych”. Wideokomórka ma także wbudowany interfejs PC Card, który jest używany do komunikacji z komputerem PC z prędkością 76,8 kbit/s. Inną, burzliwie rozwijającą się formą wideotelefonii jest komunikacja multimedialna z użyciem sieci IP, realizowana pomiędzy komputerami osobistymi wyposażonymi w kamery telewizyjne i odpowiednie oprogramowanie. W celu zapewnienia jednolitego standardu dla implementacji tej usługi w sieciach IP, w ramach prac normalizacyjnych ITU-T opracowano zalecenie H.323 [30], specyfikujące architekturę (rys. 2.2-2), która umożliwia realizację połączeń wideo-telefonicznych w sieciach pakietowych, pomiędzy urządzeniami pochodzącymi od różnych producentów. Urządzenia wej/wyj audio Kodek audio G.711, G.722 G.723, G.728, G.729 Kodek wideo H.261, H.263 Warsttwa H.225.0 Urządzenia we/wy wideo Aplikacje danych użytkownika Kontrola systemu Interfejs użytkownika do kontroli i zarządzania Interfejs do sieci RTP Zarządzanie H.245 Sygnalizacja Q.931 Kontrola RAS Rys. 2.2-2. Struktura terminalu H.323 Typowe terminale wideo-telefoniczne na ogół generują ciągły strumień danych utworzony z dwóch wzajemnie zsynchronizowanych strumieni medialnych, z których jeden przenosi sygnały audio, zaś drugi – sygnały wideo. Sygnały audio są poddawane procesowi kompresji, który może być realizowany zgodnie z jednym z niżej wymienionych zaleceń: ⎫ G.711 ITU-T (kodowanie podstawowego sygnału telefonicznego, z pasmem od 300 do 3400 Hz, sygnałem cyfrowym o przepływności 64 kbit/s); ⎫ G.722 ITU-T (kodowanie sygnału audio z pasmem użytkowym 50 – 7000 Hz strumieniem cyfrowym o przepływności 64 kbit/s); ⎫ G.723 ITU-T (kodowanie podstawowego sygnału telefonicznego sygnałem cyfrowym o przepływności: 40 kbit/s, 32 kbit/s lub 24 kbit/s); ⎫ G.723.1 ITU-T (kodowanie sygnału audio dostosowane do potrzeb standardu H.324 dla sieci z transmisją modemową, wykorzystujące algorytm ACELP, który zmniejsza wymaganą przepływność binarną sygnału cyfrowego do 5,3 kbit/s lub do 6,4 kbit/s); ⎫ G.728 ITU-T (kodowanie sygnału telefonicznego z pasmem użytkowym od 300 do 3400 Hz sygnałem cyfrowym o przepływności binarnej 16 kbit/s, przy wynikowym opóźnieniu kompresji mniejszym od 2 ms i jakości sygnału odtworzonego porównywalnej z bardzo dobrej jakości sygnałem telefonicznym); - 8 - ⎫ G.729 ITU-T (kodowanie podstawowego sygnału telefonicznego z użyciem algorytmu CS ACELP (Conjugate Structure - Algebraic CELP), zapewniającego dalsze zmniejszenie wymaganej przepływności binarnej do 8 kbit/s). Kompresja sygnałów wideo może być z kolei realizowana z użyciem metody kompresji zgodnej z zaleceniem: ⎫ H.261 ITU-T, specyfikującym zasady kompresji sygnału wizyjnego według algorytmu CIF (Common Intermediate Format) oraz QCIF (Quarter CIF); ⎫ H.263 ITU-T, definiującym metodę kompresji sygnału wideo według algorytmu SQCIF. W terminalach H.323 dane wychodzące z kodeka wideo są organizowane w makro bloki (MB) przenoszące grupę 256 pikseli (dane wideo) oraz dodatkowe informacje sterujące, które łącznie z informacjami przenoszonymi przez nagłówek grupy bloków (GOB) umożliwiają dekodowanie obrazu po stronie odbiorczej. Całkowita liczba ramek z kodeka audio jest pakowana do pakietu RTP (zgodnie z zaleceniem H.225.0), ograniczonego długością samych ramek oraz całkowitą liczbą bitów przypadającą na jeden pakiet. Dokument RFC 1980, opisujący wykorzystanie protokołu RTP do transmisji głosu, sugeruje wysyłanie pakietu z próbkami, co 20 ms. Tak uzyskane strumienie audio i wideo są następnie przetwarzane za pomocą oddzielnych sesji protokołu RTP (Real Time Protocol), zapewniającego transmisję w czasie rzeczywistym sygnałów z atrybutami czasu rzeczywistego. Funkcje transmisyjne dla protokołu RTP realizuje protokół UDP, który jest odpowiedzialny za zwielokrotnienie i kontrolę poprawności transmisji (CRC) utworzonych strumieni medialnych. Do jego podstawowych zadań należy zapewnianie poprawnej kolejności przesyłanych informacji, zabezpieczenie przed powtórzeniami, bez gwarancji wiarygodności transmisji. Pracę protokołu RTP wspiera również protokół RTCP (Real-time Transport Control Protocol), dostarczający mechanizmów dla synchronizacji przenoszonych ramek audio i wideo dla sesji czasu rzeczywistego. Protokół RTCP przetwarzając znaczniki czasowe, umieszczone w nagłówkach pakietów RTP, zapewnia zachowanie sekwencji przesyłanych pakietów (z danymi wideo i audio), a także kontroluje opóźnienia pomiędzy kolejnymi pakietami. Oprócz tego przenosi także identyfikator warstwy transportowej źródła RTP, który w odbiorniku jest wykorzystywany do synchronizacji sygnałów audio i wideo. Pomimo ulepszenia transportu pakietów w czasie rzeczywistym przez sieć IP, protokół RTP nie ma mechanizmów rezerwujących zasoby sieci, zatem nie gwarantuje wymaganej jakości usługi. Sytuację tę zmienia protokół RSVP, który może rezerwować zasoby dla strumienia RTP. Protokół rezerwacji zasobów RSVP jest protokołem sygnalizacji zdefiniowanym przez IETF, przenoszącym żądania QoS przez sieć. RSVP wypełnia lukę pomiędzy aplikacją, systemem operacyjnym i mechanizmami QoS specyficznymi dla nośnika sieciowego. Protokół RSVP wysyła komunikaty w formacie, który jest od tego nośnika niezależny, dzięki czemu możliwa jest obsługa QoS w całej ścieżce transmisyjnej w sieciach, które łączą różne rodzaje niskopoziomowych urządzeń sieciowych. Datagram przygotowany przez protokół RTP jest z kolei opatrzony nagłówkiem warstwy UDP, a następnie enkapsulowany w pakiety protokołu IP. Protokół IP, który jest odpowiedzialny za przesyłanie datagramów pomiędzy użytkownikami sieci, jest protokołem bezpołączeniowym. Oznacza to, że w trakcie transmisji nie sprawdza się poprawności datagramów przesyłanych przez sieć. Nie ma zatem gwarancji ich dostarczenia, ponieważ mogą one zostać po drodze zagubione przekłamane lub uszkodzone. Jeżeli w trakcie transmisji został wykryty błąd, to pakiet jest niszczony przez stację, która ten błąd wykryła. W takim przypadku nie ma żadnych powtórzeń transmisji i kontroli przepływu danych. Funkcje korekcji i wykrywania błędów transmisji muszą być wykonane przez protokoły innych warstw. - 9 - 2.2.2 Wymagania na QoS dla warstwy aplikacyjnej usługi Wymaganiem minimum" dla usługi wideotelefonii jest, aby w normalnych warunkach " pracy, przekazywana informacja wideo była wystarczająca dla odzwierciedlenia na ekranie ruchu ciągłego u osoby biorącej udział w telekonwersacji. Na podstawie kryterium jakości świadczenia usługi (Quality of Service) wyróżnia się następujące kategorie wideotelefonii, a mianowicie: ⎫ wąskopasmową PSTN [27] dla publicznej komutowanej sieci telefonicznej, ⎫ wąskopasmową UMTS dla sieci komórkowej 3-generacji, ⎫ wąskopasmowa ISDN [25] dla sieci N-ISDN, ⎫ wąskopasmowa IP dla sieci pakietowej oraz ⎫ szerokopasmową [26] dla sieci B-ISDN / ATM. Jakość wideotelefonii małej szybkości, ze względu na wąskie pasmo przekazu oraz inne ograniczenia techniczne, jest z natury rzeczy ograniczona i z tego względu usługa ta raczej nie jest odpowiednia dla wielu praktycznych zastosowań profesjonalnych. W przypadku tej usługi mniejszą przepustowość sieci wykorzystuje się tak efektywnie, jak to tylko jest możliwe realizując metody elastycznego wykorzystania kanału do transmisji sygnałów: fonii, obrazu ruchomego i nieruchomego, a także sygnałów danych. Tabela 2.2-1. Przepływności wymagane w wideotelefonii Wymagana przepływność [kbit/s] Rodzaj wideotelefonii Wąskopasmowa PSTN 33 ÷ 56 Wąskopasmowa UMTS 64 ÷ 144 Wąskopasmowa ISDN 64 ÷ 144 Wąskopasmowa IP 256 ÷ 512 Szerokopasmowa >2048 Tabela 2.2-2. Dopuszczalne opóźnienia wymagane w wideotelefonii Rodzaj danych Sygnały audio Dopuszczalne opóźnienie [ms] Sygnały wideo 300 Dopuszczalne względne opóźnienie [ms] - 10 - 150 10 2.3 Wideokonferencja 2.3.1 Charakterystyka funkcjonalna usługi Usługa wideokonferencji jest rozumiana [1, 2, 22] jako taka usługa audiowizualna, która umożliwia przeprowadzanie w czasie rzeczywistym (tzn. na bieżąco) telekonferencji, w której pomiędzy uczestnikami spotkania", usytuowanymi w różnych miejscach globu ziemskiego, są " wymieniane sygnały foniczne razem ze stowarzyszonymi, kolorowymi obrazami ruchomymi, przedstawiającymi na ogół uczestników tego spotkania. Oprócz funkcji głównej (przekazywanie fonii i stowarzyszonych obrazów ruchomych), usługa ta udostępnia także przekazywanie danych innego rodzaju, takich jak: obrazy nieruchome wysokiej rozdzielczości, pliki tekstowe, dokumenty itd. Usługa daje również możliwość jednoczesnej prezentacji wszystkim uczestnikom konferencji wcześniej zarejestrowanych sekwencji audio-wideo, a także zapamiętanych dokumentów tekstowych i obrazów graficznych z możliwością ich adnotacji i uaktualniania. Model funkcjonalny usługi wideokonferencji jest pokazany na rys. 2.3-1. Według tego modelu uczestnicy wideokonferencji, wyposażeni w odpowiednie terminale multimedialne (TMM) o strukturze funkcjonalnej pokazanej na rys. 2.2-2, mają dostęp do serwera wideokonferencji (SWK) przez tzw. zespół sterowania wielopunktem (MCU − Multipoint Control Unit). Ten ostatni jest elementem funkcjonalnym sieci telekomunikacyjnej i jest dostępny w taki sam sposób, jak każdy abonent sieci. Steruje on wymianą informacji multimedialnych pomiędzy uczestnikami konferencji, a także zapewnia dostęp do zasobów serwera wideokonferencji. TMM TMM TMM Sieć telekomunikacyjna MCU SK SWK AOK BD ZOMM POMM Rys. 2.3-1. Model funkcjonalny wideokonferencji i architektura serwera. Oznaczenia wyjaśniono w tekście W serwerze wideokonferencji, oprócz sterownika komunikacyjnego (SK) i aplikacji obsługi konferencji (AOK), wyróżnia się trzy główne bloki funkcjonalne: pamięć obiektów multimedialnych (POMM), zarządcę obiektów multimedialnych (ZOMM) oraz bazę danych (BD). Pamięć POMM przechowuje obiekty multimedialne wideokonferencji, takie jak: zapisy wideo uczestników konferencji, transkrypcje sygnałów fonicznych, wspólne dokumenty (obszary) robocze prezentowane w czasie konferencji, odtwarzane sekwencje wideo, a także pojedyncze klatki" zapisów wideo, wykorzystywane do przyszłych specyficznych prezentacji. " Zarządca obiektów multimedialnych, tak jak typowy serwer informatyczny, ma wbudowanych wiele funkcji do manipulacji obiektami multimedialnymi przechowywanymi w POMM. Najważniejszymi z nich są funkcje: transkrypcji, generacji wskaźnika mówcy i wskaźnika słowa kluczowego, konwersji kodów, lokalizacji wskaźnika-kursora. W bazie danych są - 11 - przechowywane dane alfanumeryczne, wytwarzane przez wyżej wymienione funkcje ZOMM, a także inne dane niezbędne do eksploatacji i zarządzania wideokonferencją. 2.3.2 Wymagania na QoS dla warstwy aplikacyjnej usługi Wymaganiem minimum" dla warstwy aplikacyjnej wideokonferencji jest, aby w " normalnych warunkach pracy przekazywana informacja wideo była wystarczająca dla właściwego odzwierciedlenia w obrazach (wyświetlanych zarówno w oknie głównym, jak i w oknach podrzędnych ekranu) ruchu ciągłego dwóch lub więcej osób biorących udział w spotkaniu. W związku z tym, najniższą możliwą jakością obrazu, dopuszczalną w wideokonferencji, jest rozdzielczość obrazu wynosząca 128x96 punktów (tabela 2.3-1), a najwyższą – rozdzielczość 408x1152 punkty. Dźwięk jest przesyłany w paśmie telefonicznym, przy przepływnościach od 16 do 46kbit/s, lub z podwyższoną jakością z pasmem 7 kHz, przy transmisji 48/56 kbit/s. Wymaga się także, aby sekwencje wideo były zsynchronizowane z głosem uczestników oraz innymi przesyłanymi informacjami (tabela 2.3-2). Tabela 2.3-1. Przepływności wymagane w wideokonferencji Sygnały wideo Rodzaj konferencji Wąskopasmowa ISDN Szerokopasmowa ISDN, ATM, LAN Sygnału audio Kompresja Rozdzielczość [punkty] H.263, H.261 144x176 288x352 128x96 do 1408x1152 Pakietowa o gwarantowanej przepływności 128x96 do 1408x1152 Pakietowa bez gwarantowanej przepływności 128x96 do 408x1152 Analogowa sieć telefoniczna 128x96 do 352x288 Kompresja Pasmo [kHz] 3,1 7,0 3,1 7,0 G.711 G.722, G.728 G.277 G.722 G.728 G.277 G.722 G.728 G.277, G.722, G.728, G.723, G.729 G.723 Sygnały audio Dopuszczalne opóźnienie [ms] 3,1 7,0 56 ÷ 2048 3,1 Dopuszczalne względne opóźnienie [ms] - 12 - 150 10 64 ÷ 2048 64 ÷ 2048 Sygnały wideo 300 64 ÷ 128 3,1 7,0 Tabela 2.3-2. Dopuszczalne opóźnienia wymagane w wideokonferencji Rodzaj danych Wymagana przepływność [kbit/s] 56 2.4 Wideotekst – usługi transakcyjne 2.4.1 Charakterystyka funkcjonalna usługi Usługa wideotekstu (VT) jest definiowana jako teleusługa [20], która użytkownikom terminali wideotekstowych umożliwia komunikowanie się z bazami danych oraz innymi aplikacjami komputerowymi za pomocą odpowiednich standaryzowanych procedur dostępowych, wykorzystując publiczne sieci telekomunikacyjne. Przekazywane wiadomości mają tu na ogół postać informacji alfanumerycznych i/lub graficznych (obrazy nieruchome), które dodatkowo mogą być uzupełniane sygnałami fonicznymi. Dostęp do bazy danych jest realizowany pod bezpośrednią lub pośrednią kontrolą użytkownika. Usługa wideotekstu z definicji udostępnia oprogramowanie, które dostawcom informacji daje możliwość tworzenia, utrzymania i zarządzania bazami danych, a także możliwość zarządzania tzw. zamkniętą grupą użytkowników. Praktyczne aplikacje usługi są proste w obsłudze zarówno dla zwykłego użytkownika, jak i dla specjalisty. Przekazywane wiadomości są prezentowane na ekranach odpowiednio zmodyfikowanych odbiorników telewizyjnych lub innych terminali ekranowych, takich jak np. komputery osobiste. Istnieje wiele praktycznych aplikacji usługi wideotekstowej. Jednakże zastosowaniami najbardziej popularnymi z punktu widzenia nowoczesnych urzędów jednostek samorządowych wydają się być: ⎫ strony WWW, ⎫ poczta elektroniczna, ⎫ elektroniczna wymiana dokumentów (EDI) oraz ⎫ elektroniczna skrzynka podawcza. Wszystkie wyżej wymienione aplikacje funkcjonują z użyciem publicznej, komutowane sieci telefoniczne i/lub sieci transmisji danych, co czyni je usługami ogólnodostępnymi (każdy posiadacz popularnego PC wyposażonego w modem może być abonentem usługi wideotekstowej). 2.4.2 Wymagania na QoS dla warstwy aplikacyjnej usługi W usługach wideotekstowych, na poziomie warstwy aplikacyjnej, zawsze jest wytwarzany jeden strumień informacyjny, w którym na ogół są przenoszone dane tekstowe razem z uzupełniającymi te dane plikami dyskowymi, zawierającymi różnego rodzaju dokumenty, kody programów, zakodowane obrazy nieruchome, czy też odtwarzalne (w terminalach odbiorczych) sekwencje audio i/lub wideo. Ponieważ z definicji usługi wideotekstowe stosują bezpołączeniowy przekaz wiadomości, więc nie są tu specyfikowane jakiekolwiek formalne wymagania odnośnie szybkości i opóźnień tego przekazu. Wymaga się jedynie, aby wiadomości te były przekazywane z możliwie niewielką wynikową stopą błędów, zależną od konkretnej aplikacji (tabela 2.4-1). Tabela 2.4-1. Wynikowa stopa błędów BER wymagana na poziomie warstwy aplikacyjnej typowych usług wideotekstowych Rodzaj usługi wideotekstowej Poczta elektroniczna (e-mail) Strony sieci WWW Elektroniczna wymiana dokumentów (EDI) Elektroniczna skrzynka podawcza - 13 - BER 10-5 10-5 10-7 10-7 3 ANALIZA WPŁYWU PARAMETRÓW QoS PLATFORMY ŁĄCZNOŚCI ELEKTRONICZNEJ NA JAKOŚĆ PRZEKAZU MULTIMEDIALNEGO 3.1 Model odniesienia komunikacji multimedialnej nowoczesnego urzędu jednostki samorządowej Zgodnie z planem informatyzacji państwa na lata 2007-2013 urzędy jednostek administracji samorządowej powinny umożliwić obywatelom zdalny dostęp do elektronicznych dokumentów urzędu i upowszechniać zarówno elektroniczną formę kontaktów obywateli z urzędem, jak i elektroniczny sposób załatwiania spraw, z możliwością śledzenia biegu tych spraw w urzędzie. W tym celu każdy urząd powinien posiadać: elektroniczną skrzynkę podawczą, system elektronicznego obiegu dokumentów wewnątrz urzędu, elektroniczny system archiwizacji dokumentów oraz bazę formularzy obowiązujących w urzędzie (w formie elektronicznej), dostępną dla petentów. Jednym słowem urzędy te powinny powszechnie korzystać z aplikacji wideotekstowych zarówno w relacji urząd-obywatel, jak i urzędnikurzędnik tego samego lub oddzielnych urzędów. Z uwagi na oszczędność czasu i pieniędzy, wymiana informacji pomiędzy pracownikami tego samego lub oddzielnych urzędów powinna być dokonywana z użyciem multimedialnych form przekazu informacji, takich jak: wideokonferencja, telefonia lub wideotelefonia internetowa. Elektroniczna forma wymiany informacji zarówno wewnątrz urzędu, jak i pomiędzy urzędami wymaga utworzenia optymalnego systemu łączności elektronicznej, gwarantującego przepływ informacji multimedialnych na odpowiednio wysokim poziomie jakości QoE. W ogólnym przypadku, w systemie tym wyróżnia się dwie warstwy (rys. 3.1-1), takie jak: ⎫ warstwa łączności miejscowej, tworzona na bazie lokalnej sieci komputerowej (LAN) urzędu i wykorzystywana do multimedialnego przekazu informacji wewnątrz urzędu oraz ⎫ warstwa łączności zewnętrznej, tworzona w oparciu o platformę szerokopasmowej sieci dostępowej i platformę sieci szkieletowej opartej zwykle na sieci pakietowej IP lub ATM z gwarantowaną jakością przekazu QoS. Urząd "B" Urząd "A" LAN LAN FireWall Serwer urzędu "A" Serwer urzędu "B" FireWall Platforma dostępowa SIP MCU Platforma dostępowa Platforma sieci IP QoS Rys. 3.1-1. Model odniesienia komunikacji multimedialnej nowoczesnego urzędu; gdzie: MCU –serwer usługi wideokonferencji internetowej, SIP – serwer usługi wideotelefonii internetowej - 14 - Warstwa łączności zewnętrznej jest wykorzystywana do komunikacji urzędu z otoczeniem (obywatele, firmy, inne urzędy) z użyciem wyżej wymienionych usług multimedialnych i to ona stanowi „wąskie gardło” tej komunikacji, gwarantując lub nie wynegocjowane parametry jakości QoE świadczenia tych usług. Szerzej problematyka ta jest omawiana w kolejnych punktach tego rozdziału. 3.2 Analiza wpływu parametrów QoS warstwy dostępowej na jakość przekazu aplikacji multimedialnych Współczesne sieci telekomunikacyjne są rozwijane w kierunku architektur z coraz to mniejszą liczbą węzłów usługowych, zdolnych do świadczenia coraz to szerszej gamy usług telekomunikacyjnych i obsługi coraz to większej liczby abonentów. Konsekwencją takiego stanu rzeczy jest powiększanie się obszarów dostępowych sieci, które w coraz to większym stopniu są tworzone w oparciu o sieci cyfrowe z architekturą pasywnej lub aktywnej światłowodowej techniki dostępowej. Jednakże ostatni kilometr z tych obszarów sieci, ze względów ekonomicznych, nadal jest tworzony w oparciu o istniejące media transmisyjne, takie jak: kable telekomunikacyjne, linie energetyczne niskiego napięcia, kable koncentryczne w sieciach CATV. W tym obszarze sieci, cyfrowy kanał dostępowy do serwerów usług multimedialnych może być tworzony z użyciem czy to modemów transmisji danych pasma telefonicznego, czy też bardziej wyrafinowanych technik dostępowych, takich jak techniki cyfrowej linii abonenckiej xDSL [15, 16, 18, 47, 51]. Techniki te różnią się między sobą zarówno gwarantowanym zasięgiem transmisji, jak i udostępnianymi możliwościami transportowymi. Ponieważ możliwości transportowe tych technik są zdecydowanie mniejsze od przepływności binarnych łączy światłowodowych, więc faktycznie to one stanowią wąskie gardło telekomunikacji multimedialnej, i jako takie są dalej szczegółowo omawiane. Techniki cyfrowego łącza abonenckiego (xDSL) działają w obszarze abonenckiej sieci dostępowej i jako medium transmisyjne wykorzystują telekomunikacyjne kable miejscowe, z żyłami miedzianymi lub bimetalowymi, o izolacji z polietylenu jednolitego lub piankowego, lub typu foam-skin. W tym obszarze sieci dostępowej, najważniejszym medium transmisyjnym pozostaje nadal symetryczna para przewodów miedzianych, a szerokość pasma podstawowego 0,3 ÷ 3,4 kHz nie wynika z własności transmisyjnych linii abonenckiej, lecz z przepustowości filtrów instalowanych w punktach styku linii z siecią transportową. Bez tych filtrów kable miedziane mogą bowiem przenosić pasmo do około 1 MHz, a jedynym ograniczeniem dla szybkości transmisji jest długość kabla i jakość jego wykonania. Możliwość tę wykorzystują dalej opisane techniki: ⎫ HDSL (High data rate Digital Subscriber Line) – symetrycznego cyfrowego łącza abonenckiego ; ⎫ ADSL (Asymmetric Digital Subscriber Line) – asymetrycznego cyfrowego łącza abonenckiego oraz ⎫ VDSL (Very high data rate Digital Subscriber Line) – cyfrowego łącza abonenckiego o bardzo dużej szybkości transmisji. Technika HDSL [18, 53] umożliwia dwukierunkowe przesyłanie strumieni E1 (PCM 2,048 Mbit/s) lub T1 (PCM 1,544 Mbit/s) na jednej, dwóch lub trzech parach przewodów miedzianych. Jednoparowe łącze HDSL jest często wyróżniane jako technika transmisyjna SDSL (Single-pair Digital Subscriber Line). Charakteryzuje się ona mniejszym zasięgiem transmisji (tabela 3.2-1) niż HDSL kilku-parowy, lecz jej podstawową zaletą jest to, że wykorzystuje tylko jedną parę przewodów miedzianych, którą zawsze dysponuje abonent. W modemach symetrycznego cyfrowego łącza abonenckiego, sygnał liniowy jest tworzony w oparciu o modulację 2B1Q lub – CAP (Carrrierless Amplitude Phase Modulation); przy czym modulacja 2B1Q jest stosowana w łączach HDSL z transmisją: jedno-, dwu- lub trzy- parową, zaś modulacja CAP-64 i CAP-128 −odpowiednio w łączach HDSL dwu- i jedno- parowych. - 15 - Tabela 3.2-1. Przeciętny zasięg transmisji systemów HDSL w kablach miedzianych, z izolacją polietylenową Średnica żyły [mm] 0,4 0,5 0,8 Przeciętny zasięg transmisji [km] HDSL 1-parowy Kod 2B1Q Kod CAP-128 3,1 3,3 4,8 5,0 9,2 9,4 HDSL 2-parowy Kod 2B1Q Kod CAP-64 3,7 4,0 5,4 5,7 10,7 11,0 Technika ADSL [18, 50, 53] została opracowana w laboratoriach Bellcore w USA pod koniec lat 80. Technika ta wywodzi się od wcześniej omówionej techniki HDSL, a jej podstawową cechą jest to, że prędkość transmisji od sieci do abonenta jest większa niż prędkość w kierunku przeciwnym. Obecnie są stosowane dwa rodzaje technik transmisyjnych ADSL, tzn. szerokopasmowa technika ADSL oraz technika ADSL G.Lite o zmniejszonej przepływności transportowej (tabela 3.3-2). W łączach cyfrowych ADSL obydwu rodzajów, ze względu na stosowany sposób modulacji wieloczęstotliwościowej DMT (Discrete Multi-Tone), podkanały używane do przesyłania sygnałów cyfrowych są lokalizowane w paśmie częstotliwości powyżej 25 kHz. Dolny zakres częstotliwości (0,3 ÷ 3,4 kHz) nie jest ani wykorzystywany, ani zakłócany przez transmisję cyfrową i jako taki może być wykorzystywany do przesyłania sygnałów podstawowej usługi telefonicznej (POTS). Tabela 3.2-2. Przepływność transportowa i przeciętny zasięg transmisji systemów ADSL w kablach miedzianych o średnicy 0,5 [mm], z izolacją polietylenową Przepływność transportowa [kbit/s] ADSL klasyczny ADSL G.Lite Od sieci Do sieci Od sieci Do sieci 2048 16 64 ÷ 1536 32 ÷ 512 4096 160 6144 384 8192 640 Zasięg transmisji [km] ADSL ADSL klasyczny G.Lite 4,8 5÷6 4,0 3,7 2,7 Technika VDSL [18, 47, 52] jest pewnym uzupełnieniem techniki ADSL, i jako taka umożliwia uzyskanie większych prędkości transmisji skrętką przewodów miedzianych, ale na mniejszych odległościach (tabela 3.2-3). Podobnie jak ADSL jest techniką asymetryczna, tzn. do abonenta przenosi znacznie większy strumień danych niż od abonenta do sieci. Ze względu na stosowaną metodę modulacji DWMT, opartą na tzw. transformacie falkowej (wavelet transform), kanały cyfrowego łącza VDSL zajmują pasmo powyżej 300 kHz. W ten sposób pasmo podstawowej usługi telefonicznej (POTS) jest tu poszerzone o pasmo kanałów 2B+D podstawowej usługi ISDN. Tabela 3.2-3. Zalecane prędkości i średni zasięg dla transmisji łącza VDSL w parze przewodów miedzianych o średnicy 0,5 mm Strumień do abonenta [Mbit/s] 12,96 25,82 51,84 Strumień od abonenta [Mbit/s] 1.6 ÷ 2.3 19,2 51,84 Zasięg transmisji [km] 1,5 1,0 0,3 Wyżej omówione techniki cyfrowego łącza abonenckiego xDSL mają różne zasięgi i odmienne możliwości transportowe. W strukturze współczesnych sieci dostępowych techniki te są najchętniej stosowane jako uzupełnienie (na odcinku kilometra lub kilku kilometrów) pasywnej lub aktywnej sieci światłowodowej, chociaż dwie z nich (HDSL i ADSL) mogą i - 16 - często są używane jako autonomiczne, szerokopasmowe systemy dostępowe. Biorą pod uwagę ich możliwości transportowe i gwarantowaną wiarygodność transmisji, z jednej strony, i wymagania na przepływność aplikacji multimedialnych wykorzystywanych przez urzędy jednostek samorządowych, ze strony drugiej, nietrudno zauważyć, że jedynie techniki HDSL i VDSL (jednakże na odległość nie większą niż 300-metrów) mogą pełnić funkcję warstwy dostępowej dla komunikacji multimedialnej tych urzędów (tabela 3.2-4). Tabela 3.2-4. Możliwości wykorzystania technik transmisyjnych xDSL jako warstwy dostępowej w systemach komunikacji multimedialnej nowoczesnych urzędów jednostek samorządowych Rodzaj usługi multimedialnej Wideotelefonia wysokiej jakości Wideokonferencja Usługi wideotekstowe Warstwa transportowa usługi Łącze SDSL 5,0 [km] Tak Tak Tak Łącze HDSL; 5,7 [km] Tak Tak Tak Długość łącze ADSL [km]: 2,7 Nie Nie Tak 3,7 Nie Nie Tak 4,0 Nie Nie Tak 4,8 Nie Nie Tak Długość łącza VDSL [km]: 0,3 Tak Tak Tak 1,0 Nie Nie Tak 1,5 Nie Nie Tak Techniki xDSL działają w obszarze abonenckim sieci telefonicznej, wykorzystują istniejącą infrastrukturę kabli miedzianych z tego obszaru i jako takie są narażone na oddziaływanie różnych czynników zewnętrznych, które mogą prowadzić do degradacji przepływności binarnej łącza i/lub wiarygodności transmisji znacznie poniżej gwarantowanego poziomu QoS, ustalonego w czasie sprzedaży usługi przez operatora. W większości przypadków degradacja ta jest następstwem nieprawidłowej eksploatacji sieci przez personel techniczny operatora, polegającej na: ⎫ pozostawianiu odgałęzień w liniach abonenckich, ⎫ rozbiciu par i utracie symetrii doziemnej linii oraz ⎫ niewłaściwym wypełnianiu telekomunikacyjnego kabla miejscowego usługami cyfrowymi. Odgałęzienia w linii abonenckiej na ogół powstają wtedy, kiedy abonent rezygnuje z usługi i jego linia jest rozłączana w dwóch miejscach, tzn. na krosownicy centralowej oraz w szafie krosowniczej położonej najbliższej abonenta odłączanego. Gdy zachodzi potrzeba dołączenia nowego abonenta, to do tego celu zwykle jest wykorzystywana odłączona uprzednio para kabla magistralnego. W takim przypadku do pary kabla magistralnego dołączone zostają dwie linie abonenckie, z których jedna (łącząca kabel magistralny z szafką krosowniczą abonenta odłączonego) pozostaje nieobciążona tworząc odgałęzienie linii aktywnej. Tego typu odgałęzień może być nawet kilka w jednej pętli abonenckiej. Występowanie odgałęzień w linii abonenckiej jest niezauważalne dla transmisji sygnałów telefonicznych, natomiast jest wysoce niepożądane w przypadku transmisji xDSL. Szkodliwość odgałęzień przejawia się bowiem: powstawaniem echa własnego i obcego, zmniejszeniem mocy transmitowanego sygnału, a także zanikiem niektórych częstotliwości. Te niepożądane efekty prowadzą do zmniejszenia stosunku S/N mocy sygnału do mocy szumu i w konsekwencji – do spadku wiarygodności transmisji (w przypadku łączy HDSL), a także do zmniejszenia się przepływności wynikowej łącza, co ma miejsce w przypadku transmisji ADSL i VDSL. Rozbicie par kabla, które może występować na krosownicy centralowej i/lub w szafie krosowniczej, czy też w tzw. mufach kablowych, na ogół objawia się utratą symetrii doziemnej linii abonenckiej. W konsekwencji linia taka, sama będąc źródłem zakłóceń, na zasadzie wzajemności, staje się bardziej podatna na absorbowanie zarówno sygnałów generowanych przez usługi cyfrowe przesyłane w sąsiednich liniach tego samego kabla, jak i zakłóceń zewnętrznych, wytwarzanych przez: bliskie i dalekie wyładowania atmosferyczne, różnego rodzaju procesy przemysłowe, radiostacje krótkofalowe, pojazdy mechaniczne itd. Konsekwencją tego może być trwałe zwiększenie poziomu zakłóceń w linii, a przez to utrzymująca się degradacją poziomu QoS, odnoszącego się zarówno do gwarantowanej - 17 - wiarygodności transmisji (systemy HDSL), jak i zapewnianej przepływności transportowej łącza (systemy ADSL i VDSL). Niewłaściwe wypełnianie kabla telekomunikacyjnego usługami cyfrowymi, które polega czy to na zbyt dużym stopniu zapełnienia kabla tymi usługami, czy też na ich prowadzeniu w parach tej samej czwórki kablowej lub w parach czwórek przyległych, skutkuje na ogół znacznym wzrostem poziomu zakłóceń i w konsekwencji degradacją gwarantowanego poziomu QoS usługi. Dzieje się tak z powodu trudności w uzyskaniu i utrzymaniu stanu idealnej symetrii linii abonenckich zawartych w rzeczywistym kablu telekomunikacyjnym. Wskutek występowania sprzężeń elektromagnetycznych między liniami, sygnały elektryczne przesyłane w tych liniach przenikają z jednej pary kablowej do drugiej. Ze względu na nieidealną symetrię par, sygnały przenikające do poszczególnych przewodów tych par nie kompensują się wzajemnie i powodują powstanie zakłócającego napięcia różnicowego między tymi przewodami. Jako istotne rozróżnia się dwa rodzaje przeników (rys. 3.2-1), a mianowicie: przenik zbliżny (NEXT – Near End Crosstalk) i przenik zdalny (FEXT – Far End Crosstalk). Para zakłócająca 1 O N NEXT 2 N O Para zakłócana Para zakłócająca 1 N O FEXT 2 N O Para zakłócana Rys. 3. 2-1. Przenik zbliżny NEXT i zdalny FEXT Przenik zbliżny NEXT jest szczególnie niekorzystny w takich przypadkach, kiedy w kablu z parami nie ekranowanymi znajdą się linie abonenckie wykorzystywane do transmisji sygnałów cyfrowych w obydwu kierunkach transmisji, a pasma sygnałów nadawanych i odbieranych pokrywają się. Wynika z tego, że przeniki zbliżne nie występują, jeżeli w kablu ma miejsce jedynie transmisja jednokierunkowa, tzn. kiedy po jednej stronie kabla są tylko nadajniki, po drugiej – tylko odbiorniki. Jeżeli zakłócenia te powstają od takiego samego systemu transmisyjnego, wówczas pasma obu systemów pokrywają się, a powstałe przeniki SNEXT (Self NEXT) należą do najbardziej szkodliwych. Przenik zdalny FEXT powstaje wtedy, kiedy dwa sygnały lub więcej (o pokrywających się widmach) przesyłane są w tym samym kierunku, lecz w różnych torach abonenckich. Na skutek zjawiska indukcji elektromagnetycznej, do odbiornika na drugim końcu toru transmisyjnego mogą docierać wtedy, oprócz sygnału podstawowego, sygnały mające swe źródło w torach sąsiednich. Jeżeli zakłócenia te powstają od takiego samego systemu transmisyjnego, wówczas pasma obu systemów pokrywają się, i mamy do czynienia z przenikiem SFEXT (Self FEXT), bardziej szkodliwym niż przenik FEXT. Poziom zakłóceń wywołanych zjawiskiem przeniku zbliżnego i zdalnego zależy w dużej mierze od rodzaju kabla (parowy, czy czwórkowy), ułożenia par kablowych, skoku skrętu par, podziału par w kablu na ekranowane grupy, długości linii abonenckiej, ilości i właściwości spektralnych (widma) sygnałów zakłócających, źródeł częstotliwości pracy i szerokości przenoszonego pasma. Przez właściwą lokalizację usług cyfrowych w kablu - 18 - telekomunikacyjnym może on być jednakowoż znacznie zmniejszany, a negatywne oddziaływanie na siebie tych usług w znacznym stopniu zredukowane. Każde z wyżej omówionych niewłaściwych działań eksploatacyjnych operatora prowadzi w konsekwencji albo do wzrostu stopy błędów pierwotnych w eksploatowanym kanale cyfrowym (łącza SDSL i HDSL), albo do degradacji przepływności transportowej kanału, co ma miejsce w systemach ADSL i VDSL, i wynika z właściwości adaptacyjnych tych systemów. W obydwu przypadkach, działania te spowodują trwały spadek wynikowej szybkości transferu danych na poziomie warstwy aplikacyjnej przenoszonych usług multimedialnych. W zależności od stopnia degradacji tej szybkości, ujemne skutki tych działań mogą się objawiać wyczuwalnym pogorszeniem poziomu jakości świadczonej usługi, polegającym na występowaniu „czkawki” w przekazach audio, czy też drżeniem i „smużeniem” wyświetlanych obrazów. Ze względu na niską, dopuszczalną stopę błędów w transmisjach xDSL 3) negatywne skutki tych działań dotyczyć mogą jedynie tych usług, które przekazują strumienie z danymi czasu rzeczywistego, i których łączna wymagana przepływność binarna na poziomie pakietowym usługi jest niewiele mniejsza od przeciętnej przepływności transportowej zastosowanego łącza xDSL. 3) Dopuszczalna, systemowa stopa błędów w łączach cyfrowych xDSL wynosi 10-7. - 19 - 3.3 Analiza wpływu parametrów QoS warstwy szkieletowej na jakość przekazu aplikacji multimedialnych Od wielu lat dążeniem projektantów warstwy szkieletowej sieci telekomunikacyjnych, jak również projektantów sieci komputerowych, jest stworzenie takiej infrastruktury technicznej, która umożliwiłaby efektywne przekazywanie informacji związanej z różnorodnymi klasami aplikacji (usługami) opartymi na przekazie mowy, danych, obrazów ruchomych (wideo) i nieruchomych. Sieć spełniającą te wymagania nazywa się siecią wielo-usługową (multi-service). Zasadniczą trudnością przy opracowaniu właściwej techniki telekomunikacyjnej dla sieci wielo-usługowej jest zagwarantowanie należytej jakości przekazu informacji przez sieć dla każdej z oferowanych klas aplikacji. Ogólnie ujmując, dostępne klasy aplikacji różnią się pomiędzy sobą zarówno typem (profilem) ruchu generowanego do sieci, wymaganą przepływnością bitową, jak i wymaganiami dotyczącymi jakości przekazu. Jest zatem oczywiste, że spełnienie w sieci wielo-usługowej tak przeciwstawnych wymagań dotyczących jakości przekazu informacji, przy użyciu tej samej infrastruktury, wymaga zarówno nowych rozwiązań architektonicznych, jak i technik telekomunikacyjnych. Obecnie w zasadzie istnieją dwa rodzaje sieci: realizująca głównie usługę przekazu mowy i ukierunkowana na przekaz danych. Pierwsza z tych sieci jest oparta na technice komutacji kanałów, druga zaś – na technice komutacji pakietów. Zatem zasadniczym problemem przy realizacji sieci wielo-usługowej jest zapewnienie przekazu mowy w sieci z komutacją pakietów lub zapewnienie przekazu danych w sieci z komutacją kanałów. Do realizacji sieci wielo-usługowej opracowano wiele technik, w tym technikę N-ISDN (Narrowband Integrated Services Digital Network) [10] opartą na komutacji kanałów oraz technikę ATM (Asynchronous Transfer Mode) opartą na komutacji pakietów. Obie te techniki, w swoich założeniach, mają pewne mechanizmy służące zapewnieniu odpowiedniej jakości obsługi dla każdej z klas aplikacji. Faktem jest, iż obecnie najbardziej rozwiniętą siecią mającą pewne cechy sieci wielo-usługowej, jest globalna sieć Internet, oparta na technice komutacji pakietów z zastosowaniem protokołu IP (Internet Protocol). Liczba abonentów sieci Internet jest obecnie porównywalna z liczbą abonentów sieci telefonicznej, zaś ruch przenoszony w tej sieci w niektórych krajach przekroczył ruch telefoniczny i stale wzrasta. Sieć Internet obecnie nie zapewnia wprawdzie wymaganej jakości przekazu, jednak rekompensatą może być atrakcyjność i bogactwo dostępnych w sieci usług (aplikacji) i mały koszt opłat. W ostatnim czasie obserwuje się duże zainteresowanie wprowadzeniem do sieci Internet usługi przekazu mowy VoIP (Voice over IP). Rozpowszechnienie tej usługi może doprowadzi w konsekwencji do „przejęcia” realizacji rozmów telefonicznych przez sieć IP. Biorąc to pod uwagę, sieć Internet należ y obecnie traktować jako poważnego kandydata do przekształcenia się w sieć wielo-usługową, oferującą wszystkie dostępne obecnie aplikacje, w tym również usługi multimedialne wszystkich kategorii oraz podstawową usługę telefoniczną. Obecnie czynnikiem ograniczającym atrakcyjność Internetu jest to, że nie zapewnia ona należytej jakości przekazu informacji. Dlatego też wprowadza się do sieci Internet dodatkowe elementy zapewniające wymaganą jakość obsługi, tj. odpowiednie architektury sieci i skojarzone z nimi mechanizmy QoS (Quality of Service). Obecnie są nimi dalej opisane architektury: IntServ, DiffServ i MPLS Model IntServe był pierwszym modelem opracowanym przez organizację IETF, zajmującą się standaryzacją Internetu. Podstawową własnością tego modelu jest jego zorientowanie na przesyłanie informacji w relacji pomiędzy punktami końcowymi połączenia. Aby każdej transmisji pakietów zagwarantować odpowiednie parametry QoS należy przydzielić odpowiednie zasoby sieciowe dla każdej sesji. Do tego celu wykorzystywany jest protokół sygnalizacyjny RSVP (Resource ReServation Protocol), który jest odpowiedzialny za definiowanie i rezerwację zasobów sieciowych niezbędnych do przesyłania pakietów oraz zestawianie logicznych dróg połączeniowych dla tej transmisji. W modelu tym (rys. 3.3-1) elementem inicjującym rezerwację jest stacja nadająca A, która informuje odbiorcę B o chęci przesłania danych oraz o wymaganej dla tej sesji jakości transmisji. Odbywa się to za pomocą - 20 - wysłania komunikatu PATH. Odbiorca rezerwuje zasoby wzdłuż całej ścieżki od nadawcy do odbiorcy przez wysłanie zwrotnie komunikatu RESERVE. Komunikat ten dociera do wszystkich routerów, znajdujących się na tej drodze. W przypadku dostępności wymaganych zasobów rezerwacja zostaje uaktywniona i stacja nadająca może przesyłać dane. Protokół RSVP oparty jest na koncepcji tzw. „miękkiego stanu” (soft state), co oznacza konieczność okresowego powtarzania rezerwacji. Rezerwacja zasobów wzdłuż ścieżki może zostać anulowana po wysłaniu stosownego komunikatu, lub gdy stany rezerwacyjne nie zostaną odświeżone w zadanym czasie. Parametry rezerwacji dla sesji mogą być zmieniane dynamicznie i są uaktualniane przez komunikaty odświeżające. Należy podkreślić, że RSVP nie jest protokołem doboru trasy, a służy jedynie do rezerwacji zasobów na trasie wybranej przez funkcjonujące w sieci protokoły routingu. Sesja określona jest poprzez adres IP oraz identyfikator portu i typ protokołu transportowego odbiorcy danych, co pozwala na jednoznaczną identyfikację pakietów należących do danej sesji. Dla każdej sesji należy przydzielić odpowiednie zasoby sieciowe i obsługiwać ją zgodnie z parametrami QoS do niej przypisanymi. W ramach tego modelu zdefiniowane zostały dotychczas dwie klasy usług: ⎫ usługa GS (Guaranted Service), gwarantująca szerokość pasma transmisyjnego, ograniczenie maksymalnych opóźnień w relacji nadawca-odbiorca i brak strat pakietów spowodowanych kolejkowaniem pakietów w buforach urządzeń sieciowych 3 oraz ⎫ usługa kontrolowanego obciążenia CL (Controlled Load Service) 4 . komunikat PATH komunikat PATH komunikat PATH IBM RS/6000 nadawca A IBM RS/6000 odbiorca B komunikat RESV komunikat RESV komunikat RESV Rys 3.3-1. Zasada działania protokołu RSVP Elementem wyróżniającym architekturę DiffServ, od wcześniej przedstawionej architektury IntServ, jest zastosowanie tzw. agenta przydzielania pasma (Bandwidth Broker). Agent ten odpowiada za: realizację funkcji AC (Admission Control), zarządzanie zasobami sieci oraz za funkcje związane z konfiguracją routerów brzegowych. Funkcje te są realizowane tylko w węzłach brzegowych sieci. Zakłada się, iż sieć szkieletowa jest odpowiednio przewymiarowana, aby nie stanowić ograniczenia dla przekazu pakietów. Istota architektury DiffServ polega na tym, że routery brzegowe obsługują pojedyncze strumienie pakietów, 3 4 Klasa GS jest przeznaczona dla aplikacji wymagających transmisji w czasie rzeczywistym, wrażliwych na opóźnienia tranzytowe, jak na przykład transmisja danych audio i video. Usługa ta nie zapewnia tak silnych gwarancji dotyczących jakości QoS, jak klasa GS. Jeżeli strumień danych należy do klasy CL, router przydziela do niego takie zasoby, aby możliwa była obsługa z jakością dostępną w sieci obciążonej, ale nie nadmiernie. Wraz ze wzrostem obciążenia, w odróżnieniu od usługi best effort, jakość obsługi dla klasy CL nie powinna się pogarszać w sposób znaczący. - 21 - natomiast w sieci szkieletowej obsługa odbywa się na podstawie strumieni zbiorczych. Dlatego też funkcje profilowania ruchu są realizowane jedynie w węzłach brzegowych sieci. Natomiast, obsługa ruchu zbiorczego (klas ruchu) przez sieć odbywać się zgodnie z przyjętymi modelami przekazu pakietów PHB (Per-Hop-Behaviour), które określają, w jaki sposób ruch w ramach danej klasy ruchu ma być przekazywany między poszczególnymi węzłami sieci. Pakiety, obsługiwane wg tego samego PHB są rozpoznawane w routerach dzięki odpowiedniemu ustawieniu pola DSCP nagłówka pakietu IP. W ramach architektury DiffServ zdefiniowano dwie główne grupy PHB: Expedited Forwarding i Assured Forwarding (AF). Grupa EF PHB została zdefiniowana dla przekazu pakietów wymagających obsługi w reżimie czasu rzeczywistego, natomiast grupa AF PHB odpowiada za przekaz pakietów w ramach wielu klas ruchu elastycznego oraz ruchu bez reżimu czasu rzeczywistego. W przypadku obu grup PHB, zdefiniowane mechanizmy QoS powinny zapewnić jakość przekazu pakietów zgodnie z wymaganiami QoS przyjętymi dla danej klasy ruchu oraz zapewnić różnicowanie jakości między poszczególnymi klasami ruchu. MPLS (Multiprotocol Label Switching) jest techniką selektywnego kierowania pakietów, funkcjonującą na poziomie łącza danych, która umożliwia prostsze i szybsze kierowanie pakietów, niż według tradycyjnych schematów, wykorzystywanych w sieciach IP. W protokole MPLS każdy pakiet wchodzący do sieci jest przydzielany do klasy równoważności przekazywania FEC na podstawie analizy nagłówka. Każdy pakiet otrzymuje etykietę odpowiadającą danej klasie równoważności. Przydzielenie pakietu do klasy FEC odbywa się tylko raz, w chwili wejścia do domeny MPLS. W kolejnych węzłach sieci nie jest konieczne analizowanie nagłówka pakietu, a decyzja o wyborze następnego odcinka drogi podejmowana jest na podstawie etykiety. Etykieta ma znaczenie wyłącznie lokalne. Jest to identyfikator o stałej długości, jednoznacznie określający klasę równoważności przekazywania pakietów pomiędzy dwoma sąsiednimi węzłami, dla określonego kierunku transmisji. Ciąg takich powiązań pomiędzy kolejnymi węzłami w obrębie domeny MPLS tworzy ścieżkę komutowaną etykietowo LSP. Należy podkreślić, że Protokół MPLS w założeniu podstawowym ma służyć uproszczeniu mechanizmów przekazywania pakietów w routerach. Pewne właściwości tego protokołu mogą wspomagać inżynierię ruchu w sieciach, zwłaszcza ze względu na możliwości równoważenia obciążenia w sieci, co ma znaczący wpływ na utrzymanie obsługi pakietów na odpowiednim poziomie jakości. Jednocześnie uproszczenie procesów kierowania, zwłaszcza w sieci szkieletowej, uwalnia dodatkowe możliwości przetwarzania informacji w routerach co również przekłada się na zdolność utrzymania założonej QoS. Protokół MPLS nie jest wyposażony w bezpośrednie mechanizmy sterowania parametrami QoS. Technika ta umożliwia natomiast trasowanie jawne w sieci szkieletowej i określenie z wyprzedzeniem przęsła, przez które pakiet będzie musiał przejść w sieci (explicite routing). Ta właściwość upodabnia ruch w sieci IP do połączeń od końca do końca (end-to-end) czyli nadaje sieci IP właściwości sieci zorientowanej połączeniowo. Ruch pakietów w sieci jest wtedy bardziej przewidywalny, co umożliwia łatwiejsze gwarantowanie jakości usług. Z punktu widzenia jakości usług najlepsze rezultaty daje kompilacja techniki MPLS z technikami IntServ i DiffServ stosowanymi w sieciach IP do zapewnienia odpowiedniej jakości QoS przy przenoszeniu np. ruchu generowanego przez aplikacje multimedialne. Cechą charakterystyczną sieci IP jest to, że jeśli przesyłany w niej pakiet natrafi na przepełniony bufor kolejki wejściowej lub wyjściowej dowolnego węzła tej sieci lub zostanie odebrany z błędem, to pakiet taki nie jest w tym węźle przetwarzany i w konsekwencji jest gubiony. W przypadku transmisji głosu utrata pojedynczych pakietów nie powoduje słyszalnego zniekształcenia sygnałów audio. Podobnie jest w przypadku transmisji strumienia wideo. Utrata pojedynczych pakietów nie powoduje bowiem znacznego pogorszenia jakości odbieranych, wolnozmiennych obrazów rozmówcy. Dyskwalifikacja połączenia wideo ma miejsce dopiero wtedy, kiedy intensywność gubienia pakietów będzie na tyle duża, że szybkość odtwarzania obrazów wideo spadnie poniżej 10 klatek na sekundę [48]. - 22 - Przy transmisji dźwięku podstawowym kryterium oceny jakości sieci jest opóźnienie w transmisji pakietów. Opóźnienie to powinno być stałe i nie powinno być większe od 200 ms. Z przeprowadzonych badań [4] mających na celu określenie dopuszczalnego poziomu opóźnień i utraty pakietów, okazało się, że w przypadku utraty do 5 % przesyłanych pakietów trudno jest zauważyć różnicę w jakości dźwięku. Jest natomiast wyraźna, gdy poziom strat dochodzi do 15 %. Jeśli przekracza tę wielkość, rozmowa staje się trudna do zrozumienia. W przypadku opóźnień ucho ludzkie jest w stanie odczuć je dopiero wtedy, gdy są większe niż 150 ms. Gdy przekraczają 400 ms, bardzo trudno jest prowadzić rozmowę. Reasumując można stwierdzić, że jakość wideotelefonii i wideokonferencji zależeć będzie zarówno od czynników obiektywnych, związanych z obciążeniem ruchowym sieci IP oraz jej strukturą techniczną, jak i czynników subiektywnych, wynikających ze zdolności percepcyjnych osób korzystających z tych usług. Zastosowanie w sieci IP wcześniej omówionych mechanizmów i protokołów czasu rzeczywistego nie wyeliminuje całkowicie ani utraty pakietów w sieci, ani zmienności ich przychodzenia do terminalu odbiorczego, lecz znacząco je ograniczy, jednak nie na tyle, aby jakość świadczenia usługi była na poziomie jakości, która jest gwarantowana w sieciach zorientowanych połączeniowo. - 23 - 4 PRZEGLĄD I CHARAKTERYSTYKA OGÓLNA METOD OCENY JAKOŚCI PRZEKAZU MULTIMEDIALNEGO 4.1 Uwagi ogólne We współczesnych systemach łączności multimedialnej stosowanych jest wiele rozwiązań, w których sygnały audio i wideo podlegają różnego rodzaju przekształceniom i przetworzeniom w celu ich efektywnego przesyłania, gromadzenia, rozpoznawania i syntetyzowania. Stosowanych jest wiele różnych typów koderów, sieci dostępowe i transmisyjne opierają się na nowych rozwiązaniach, a integracja sieci telekomunikacyjnych i informatycznych stała się faktem, również w kontekście realizacji połączeń telefonicznych (VoIP – Voice over IP). Specyfika stosowanych rozwiązań oraz różnorodność systemów i sieci wykorzystywanych do tworzenia połączeń multimedialnych powoduje, że sygnały przesyłane w czasie tych połączeń podlegają wielokrotnemu przetwarzaniu, przekodowywaniu i przeładowywaniu zanim dotrą do odbiorcy. Wszystko to z reguły wpływa negatywnie na jakość tych przekazów i co gorsze w sposób trudny lub niemożliwy do przewidzenia. Jakość mowy SQ (Speech Quality) jest jednym z elementów ogólnej oceny QoS (Quality of Service) jakości usługi telekomunikacyjnej związanej z tworzeniem połączeń telefonicznych. Przy przesyłaniu sygnału wideo, występującego w usługach wideotelefonii i wideokonferencji, miarą zadowolenia klienta z tych usług jest w głównej mierze jakość odbieranego obrazu i skojarzonego z nim dźwięku. Jakość tę mierzy się metodami subiektywnymi, najczęściej w skali MOS (Mean Opinion Score) od 1 do 5, polegającymi na przeprowadzaniu sformalizowanych odsłuchów dźwięku i pokazów ruchomego obrazu, co jest procesem długotrwałym i na ogół kosztownym. Z tego względu dąży się do zastąpienia metod subiektywnych oceny jakości metodami obiektywnymi, polegającymi na obliczeniu parametru MOS na bazie automatycznego porównania sygnału oryginalnego (starannie dobranego, o dobrej jakości) i sygnału docierającego do klienta. Tego typu metody obiektywne, wymagające znajomości oryginału, są nazywane „intruzyjnymi”. Trudniejsze do opracowania i z reguły mniej dokładne są metody „nieintruzyjne”, niewymagające znajomości oryginału. Inną grupę metod oceny jakości stanowią metody parametryczne, pozwalające na oszacowanie jakości usługi na podstawie pewnych wybranych parametrów połączenia telekomunikacyjnego. Należy do nich na przykład tzw. E-model, zdefiniowany w zalecenie G.107 ITU-T i stosowany dla połączeń telefonicznych, czy algorytm P.VTQ, wykorzystywany do oceny jakości usługi VoIP. Wymienione metody są przedmiotem rozważań kolejnych punktów tego rozdziału. - 24 - 4.2 Metody oceny subiektywnej Z uwagi na charakter przekazów multimedialnej (sekwencje audio + sekwencje wideo + dane cyfrowe), subiektywne badanie jakości tych przekazów musi zawierać elementy badania jakości zarówno sygnałów mowy, jak i sygnałów wizyjnych. Metody subiektywnej oceny jakości mowy (sekwencji audio) w istocie rzeczy sprowadzają się do bezpośredniego wykorzystania w eksperymencie osób, których zadaniem jest określenie cech mowy na podstawie wrażeń słuchowych, pozwalających bezpośrednio lub pośrednio oszacować jej jakość [34, 35, 36]. Do najważniejszych subiektywnych metod oceny jakości transmisji mowy zalicza się obecnie te metody, które dają ocenę MOS w pięciostopniowej skali jakości. Są nimi: ⎫ metoda ACR (Absolute Category Rating) oraz ⎫ metoda DCR (Degradation Category Rating). Metoda ACR polega na bezpośrednim określeniu jakości mowy w pięciostopniowej skali ocen. Obecnie metoda ta jest najczęściej stosowana, gdyż pozwala na stosunkowo szybki i tani pomiar. Umożliwia to przeprowadzenie badań dla wielu obiektów z różnymi wartościami parametrów wpływających na jakość transmisji lub kodowania. Metoda ACR jest unormowana zaleceniem ITU-T P.800. W metodzie tej są wykorzystywane listy testowe złożone z prostych i nie związanych z sobą semantycznie zdań. Dobierane są zdania średniej długości, z czasem trwania 2-3 sek. Lista jest podzielona jest na grupy złożone z pięciu zdań. Słuchacze, po wysłuchaniu grupy zdań podają swoja opinię w pięciostopniowej skali jakości odsłuchu, wysiłku słuchowego lub preferowanej głośności. Ocena 5 odpowiada bardzo dobrej jakości, natomiast 1 – niedostatecznej. Ocena średnia (MOS) obliczana jest dla każdego badanego warunku transmisji mowy oraz dla każdej skali ocen, jako wynik uśrednienia po słuchaczach i mówcach. Wadą metody jest brak precyzji w zdefiniowaniu zadania dla grupy odsłuchowej i naturalna niezdolność słuchaczy do stabilnej i powtarzalnej oceny w skali punktowej takiej cechy, jak „jakość transmisji mowy”. Jest tu więc konieczne wykonanie pomiaru dla licznej ekipy słuchaczy (większej od 12), kilku głosów po stronie nadawczej, staranne przeszkolenie i trenowanie słuchaczy. Metoda DCR jest alternatywnym rozwiązaniem dla metody ACR. Pomiar polega tu na porównaniu wzorcowego sygnału mowy o wysokiej jakości z sygnałem przesłanym przez badany kanał telekomunikacyjny. Sygnał wzorcowy prezentowany jest zawsze jako pierwszy. Słuchacze określają stopień pogorszenia jakości sygnału badanego w stosunku do sygnału wzorcowego w pięciostopniowej skali ocen. Pomiar wykonywany jest dla licznej ekipy słuchaczy i kilku mówców (podobnie jak w metodzie ACR). Ocena średnia (DMOS) obliczana jest dla każdego badanego warunku transmisji mowy oraz dla każdej skali ocen, jako wynik uśrednienia po słuchaczach i mówcach. Jedną z częściej używanych w Polsce subiektywnych metod oceny jakości mowy jest badanie wyrazistości. Metoda ta nie daje pełnej informacji o jakości a jedynie uwzględnia aspekt rozumienia wypowiadanych jednostek akustycznych takich jak: logatomy, sylaby, wyrazy czy zdania. Najczęściej badania te dotyczą wyrazistości logatomowej. Logatomy to nic nie znaczące w danym języku wyrazy (jedno-, dwu- lub trzysylabowe). Rozpoznanie logatomu jest zatem wyłącznie wynikiem usłyszenia wszystkich wchodzących w jego skład fonemów, a nie skojarzenia ze znanym wyrazem lub analizy kontekstowej. Badanie wyrazistości logatomowej polega na określeniu procentowym stosunku poprawnie rozpoznanych przez N słuchaczy logatomów z L do całkowitej liczby logatomów odczytanych 5 . Metryka oceny jakości jest wyznaczana wg wzoru: 5 Szczegółowy opis metody podaje polska norma PN-90. - 25 - N L W = ( NL ) −1 ∑∑ Wn ,l 4.2-1 n =1 l =1 gdzie: Wn,l oznacza liczbę poprawnie rozpoznanych logatomów przez n-tego słuchacza z l-tej listy w stosunku do liczby logatomów odczytanych z tej listy. Metody subiektywnej oceny obrazu. W wyniku kompresji i rekonstrukcji, a także wskutek utraty transmitowanych pakietów, obraz ruchomy ulega zniekształceniu i nakładają się na niego zakłócenia. Te niekorzystne zjawiska zależą od rodzaju kodeka, przepływności binarnej (stopnia kompresji), samego obrazu, stopy utraconych pakietów. Najczęściej występują następujące zniekształcenia i zakłócenia: ⎫ efekty blokowe, wynikające z zastosowania kompresji w blokach, np. 8x8 pikseli – obserwator zauważa granice bloków; ⎫ „przytrzymanie” obrazu, wskutek podstawienia ostatniej poprawnie zdekodowanej ramki za szereg niepoprawnie zdekodowanych ramek (występuje przy dużych zakłóceniach w kanale transmisyjnym); ⎫ chwilowy zanik obrazu lub jego części, często połączony z pojawieniem się na ekranie kolorowej tekstury (występuje przy bardzo dużych zakłóceniach); ⎫ nieciągłość ruchu, związana z nazbyt wielką kompresją obrazu; ⎫ zniekształcenia konturów (nieostrość, załamania, poruszanie się, a także wystąpienie „fałszywych konturów”) powstałe jako wynik kompresji; ⎫ błędy w odtworzeniu kolorów (zmiana odcieni, nasycenie) oraz ⎫ błędy kwantyzacji (szum typu „sól i pieprz” lub „śnieżenie”). Wymienione czynniki charakteryzują się różną dokuczliwością dla odbiorcy. Ich wpływ na percepcję obrazu można stwierdzić przeprowadzając subiektywne badania jakości. Ich metodyka [41] nie odbiega od odpowiednich badań dla mowy: stosuje się skalę MOS (najczęściej od 1 do 5, choć proponuje się również skale 1-10 i 0-100). Normy określają tylko warunki przeprowadzenia formalnych badań jakości z udziałem grupy odbiorców przekazu. Metody subiektywne służą do kalibracji metod obiektywnych, obliczających MOS na podstawie porównania odebranej i nadanej sekwencji wideo (metody intruzyjne), na podstawie badania jakości połączenia (metody parametryczne) i na podstawie badania odebranej sekwencji (met. nieintruzyjne). Metody oceny subiektywnej są podstawowym narzędziem służącym do kalibracji pozostałych metod oceny jakości transmisji audio-wizyjnych. Są one jednocześnie najbardziej kłopotliwe w stosowaniu, gdyż wymagają zorganizowania sformalizowanych odsłuchów i/lub prezentacji pokazów wideo. - 26 - 4.3 Metody oceny obiektywnej Metody oceny jakości mowy. Cechą charakterystyczną obiektywnych metod oceny jakości mowy jest wyznaczanie odległości (według przyjętej miary) pomiędzy wybranym lub wybranymi parametrami sygnału mowy oryginalnej i sygnału przetworzonego (przesłanego), a następnie na podstawie krzywej odwzorowania, określenie oceny w mierze subiektywnej. Obecnie znanych jest wiele obiektywnych metod oceny jakości mowy. Jednakże do najważniejszych zalicza się te metody, które najlepiej estymującą wyniki badań subiektywnych, niezależnie od języka, mówcy i kodera audio. Są nimi: ⎫ metoda PSQM (Perceptual Speech Quality Measure), opisana w zaleceniu ITU-T P.861; ⎫ metoda PESQ (Perceptual Evaluation of Speech Quality) oraz ⎫ metoda 3SQM. Metoda PSQM. Istota tej metody [37] sprowadza się do określenia odległości pomiędzy rzeczywistym sygnałem mowy, a sygnałem otrzymanym w wyniku jej przetworzenia (głównie kodowania). Przy czym, zanim porównanie zostanie dokonane obydwa sygnały podlegają transformacji z postaci fizycznej na postać psychofizyczną, odzwierciedlającą przetwarzanie akustycznego sygnału mowy przez ucho człowieka. Na transformację sygnału z postaci fizycznej na psychofizyczną składa się: ⎫ odwzorowanie czasowo-częstotliwościowe, polegające na wyznaczeniu N-punktowej dyskretnej transformaty Fouriera z próbek sygnału akustycznego, wydzielonego oknem czasowym Hanninga o czasie trwania 32 msek i na jej podstawie obliczeniu krótkookresowej mocy sygnału; ⎫ przeskalowanie częstotliwości, polegające na filtracji sygnału za pomocą tzw. filtrów barkowych 6 , co wraz z maskowaniem przez szum 7 odzwierciedla właściwości percepcyjne ucha; ⎫ przeskalowanie poziomu natężenia w decybelach na poziom głośności wyrażany w fonach, a następnie jego wyrażenie w skali sonowej 8 . Uproszczony schemat algorytm metody PSQM przedstawiono na rys.4.3-1. W modelu tym reprezentacje wewnętrzne obu sygnałów są porównywane, a obliczona odległość między nimi (tzw. wskaźnik PSQM) jest bezpośrednio związana z jakością testowanej mowy. Ostatnim krokiem w metodzie PSQM jest odwzorowanie skali obiektywnej na subiektywną. Rys. 4.3-1: Uproszczony schemat algorytmu badania jakości mowy metodą PSQM wg [49] 6 7 8 W filtrach barkowych różnica częstotliwości środkowych i szerokości pasm dwóch sąsiednich filtrów zwiększa się z częstotliwością Do sygnału dodawany jest szum Hoth’a modelujący zakłócanie sygnału szumami otoczenia. Operacja ta ma na celu uwzględnienie faktu, że subiektywne odczucie głośności nie zależy liniowo od poziomu natężenia sygnału (przejście ze skali decybelowej na fonową) oraz że subiektywne wrażenie zwiększenia głośności zmienia się nieliniowo wraz ze zmianą głośności (przejście ze skali fonowej na sonową). - 27 - Metoda PESQ. Wadą wyżej opisanej metody PSQM jest brak korelacji otrzymywanych wyników z subiektywnymi ocenami w przypadku telefonii internetowej. Przyczyną występowania takich rozbieżności są zaburzenia w dziedzinie czasu, występujące podczas transmisji sygnału mowy w sieciach pakietowych. Rozwiązaniem okazał się mariaż modułu synchronizacji czasowej (zaczerpniętego z metody PAMS) ze standardem PSQM. Nowo opracowaną metodę pomiaru znacznie udoskonalono i nazwano PESQ (Perceptual Evaluation of Speech Quality) 9 . Idea pomiaru PESQ opiera się podobnie jak w przypadku PSQM, na tzw. reprezentacji wewnętrznej będącej teoretyczną postacią sygnału mowy w umyśle człowieka [39]. Sygnałem wzorcowym (oryginalnym) jest nagrany sygnał mowy naturalnej - najlepiej po jednym zdaniu dla głosu męskiego i żeńskiego. Tak przygotowany sygnał oryginalny przesyłany jest badanym kanałem telekomunikacyjnym tworząc na wyjściu systemu sygnał „zdegradowany”. Oba sygnały stanowią dalej podstawę oceny. W pierwszym etapie oceniane jest opóźnienie między próbkami i ewentualnie wprowadzana jest odpowiednia korekcja. Następnie oba sygnały zostają poddane szeregowi transformacji modelujących poszczególne etapy przetwarzania dźwięku w ludzkim układzie słuchowym, włączając w to przede wszystkim: specyficzną analizę w dziedzinie częstotliwości i nieliniowość przetwarzania natężenia dźwięku. Ewentualne przesunięcia próbek w czasie są uwzględniane w dalszych etapach obróbki sygnału. Na końcu zaimplementowano tzw. model kognitywny, którego zadaniem jest wydanie ostatecznej oceny na podstawie porównania reprezentacji wewnętrznych obu sygnałów. Metoda 3SQM jest metodą nieintruzyjną [44], w której nie jest wymagana znajomości sygnału oryginalnego. Jakość mowy jest oceniana na podstawie analizy typowych zniekształceń i zakłóceń: widm odbiegających od typowych widm mowy, obecności szumu, nieciągłości sygnału w czasie. Badania wykazują, że odbiorca koncentruje się na najbardziej dokuczliwym zniekształceniu i głównie to zniekształcenie wpływa na jego ocenę. Uwzględniono to w schemacie działań algorytmu (rys.4.3-2). Badania przeprowadzone m.in. przez firmę Opticom wykazują dużą korelację wyników MOS wyznaczonych według metod 3SQM i PESQ. Rys. 4.3-2. Przetwarzanie mowy w metodzie 3SQM Metody oceny jakości obrazu. W procesie oceny jakości obrazu istotne znaczenie mają cechy zmysłu wzroku, takie jak: czułość wzroku, maskowanie obiektów tłem, wrażliwość na barwy (np. oko jest bardziej czułe na barwę zieloną, niż na czerwoną i niebieską), bezwładność (w dziedzinie czasu), rozdzielczość przestrzenna (kątowa). Zmysł wzroku szczególnie jest uwrażliwiony na kontrast, uwypuklając granice pomiędzy polami o niewiele różniącej się luminancji. Z drugiej strony, niejednorodne tło jest w stanie całkowicie zamaskować obiekt, staje się on niezauważalny. Z tego powodu algorytmy szacowania jakości obrazu ruchomego 9 W 2001 roku ITU-T zaaprobowało metodę PESQ jako nowy standard P.862, który zastąpił wcześniej stosowaną metodę PSQM. - 28 - muszą się opierać na modelu percepcji HVS (Human Visual System). W modelu tym [3] uwzględnia się zjawiska przestrzenne i zachodzące w czasie. Modelując zjawiska „czasowe”, uwzględnia się dwa rodzaje bezwładności oka: krótko- i długookresową. Wymaga to przepuszczenia sekwencji wideo przez dwa filtry, o transmitancjach pokazanych na rys.4.3-3. Rys. 4.3-3. Filtry modelujące bezwładność oka wg [57] W modelowaniu HVS najważniejszym problemem jest uwzględnienie wrażliwości zmysłu wzroku na kontrast, a także spadku tej wrażliwości w obecności niejednorodnego tła, czyli cecha tzw. maskowania. Maksymalna wrażliwość na kontrast (minimalny próg detekcji) występuje w procesie obserwowania obiektów o rozmiarach ok. ¼ stopnia kątowego. Dla mniejszych rozmiarów wrażliwość na kontrast CSF (Contrast Sensitivity Function), zdefiniowana jako odwrotność progu detekcji, zmniejsza się powoli, lecz dla rozmiarów większych wrażliwość ta zmniejsza się bardzo szybko (rys.4.3-4). W obecności kontrastowego tła CSF spada, tym bardziej, im bardziej kontrastowość tła przekracza kontrastowość obserwowanego obiektu. Modelowanie zjawiska maskowania polega na znalezieniu zależności CSF od tła. Zwykle przyjmuje się, że w obecności tła niekontrastowego próg detekcji wynosi 1. Jeśli kontrastowość tła osiąga wielkość porównywalną z wielkością kontrastu obiektu względem tła, wówczas próg detekcji obiektu podnosi się. Oznacza to, że wrażliwość oka maleje i zaznaczają się maskujące właściwości tła. Rys. 4.3-4. Wrażliwość na kontrast w funkcji rozdzielczości przestrzennej wg [58] Ponieważ na zjawisko maskowania ma wpływ rozmiar obiektu, więc wymagana jest filtracja obrazu z wykorzystaniem dwóch filtrów „przestrzennych”. Pierwszy z nich przepuszcza duże pola, zaś drugi – drobne szczegóły obrazu. Filtry te uwzględniają również orientację obiektów w płaszczyźnie obrazu. Jest to potrzebne, gdyż przykładowo tło złożone z poziomych pasów dobrze zamaskuje obiekt o orientacji poziomej, a w ogóle nie zamaskuje obiektu o orientacji pionowej. Po wykonaniu tak rozumianej filtracji percepcyjnej można wyliczyć próg maskowania. Wyliczając percepcyjną odległość sygnału oryginalnego i odebranego, a więc w - 29 - pewnym sensie przewidując wynik oceny MOS badań subiektywnych, uwzględnia się zakłócenia przekraczające próg maskowania. Schemat obliczeń MOS pokazano na rys.4.3-5. Rys. 4.3-5. Obliczenie MOS z uwzględnieniem modelu percepcji obrazu W końcu lat 90-tych zawiązała się grupa badawcza VQEG (Video Quality Experts Group), stawiająca sobie za cel opracowanie i przedstawienie ITU-T do normalizacji algorytmu obiektywnej oceny jakości sygnału wideo VQM (Video Quality Metric). Rozpisano konkurs, w którym wzięło udział szereg zainteresowanych ośrodków badawczych. W wyniku wszechstronnych badań porównawczych zaproponowanych algorytmów, po dwóch edycjach konkursu, ostatecznie wyselekcjonowano 4 algorytmy, opracowane przez takie instytucje, jak: NASA (National Aeronautics and Space Administration) z USA, Yonsei University z Korei, Centro de Pesquisa e Desenvolvimento z Brazylii oraz National Telecommunications and Information Administration / Institute for Telecommunication Sciences z USA. Najbardziej praktycznym z nich wydaje się być dalej opisany model DVQ z NASA. Model DVQ (Digital Video Quality) oceny jakości obrazu, zaproponowany przez NASA (National Aeronautics and Space Administration) łączy w sobie wiele aspektów czułości wzroku ludzkiego w prosty algorytm przetwarzania obrazów. W modelu tym (rys. 4.3-6) danymi wejściowymi metryki jest para sekwencji obrazów 58, 59]: testowa (T) i referencyjna (R). Pierwszy krok składa się ze zmiennego próbkowania, transformacji kolorów, w celu ograniczenia przetwarzania do interesujących nas regionów i wyrażenia sekwencji w przestrzeni kolorów percepcyjnych. Sekwencje te są następnie dzielone na bloki (BLK) i poddawane dyskretnej transformacji cosinusowej (DCT), której wyniki są następnie transformowane do postaci kontrastu lokalnego (LC). Następnym krokiem jest filtracja czasowa (TF), która jest implementacją czasowej części kontrastowej funkcji czułości. Każdy współczynnik DCT jest dzielony przez wartość progu widzialności, co stanowi implementację przestrzennej części kontrastowej funkcji czułości (CSF). W następnym kroku obie sekwencje są odejmowane od siebie, a sekwencja różnic jest poddawana operacji maskowania kontrastu (CM), która zależy również od sekwencji odniesienia. Końcowym etapem jest wyliczenie współczynnika wzrokowej jakości (VQ) na podstawie zamaskowanych sekwencji różnic przedstawionych w wymiarze czasowo-przestrzennym oraz – wymiarze chromatycznym (POOL). Rys. 4.3-6. Schemat blokowy procesu tworzenia metryki DVQ wg [59] Prostota modelu DVQ umożliwia jego uruchomienie w czasie rzeczywistym i wymaga przy tym jedynie skromnych zasobów obliczeniowych. Jednym z najbardziej złożonych i czasochłonnych elementów proponowanej metody jest operacja filtracji przestrzennej. - 30 - Implementacja filtracji przestrzennej wykonana jest w postaci wielokrotnych przestrzennych filtrów pasmowych, które są charakterystyczne dla wzroku ludzkiego. Krok ten został przyspieszony poprzez użycie dyskretnej transformacji DTC w celu dekompozycji kanałów przestrzennych. Model ten ma współczynnik korelacji z metodą oceny subiektywnej rzędu 0.720.83 i jest przeznaczony dla wyświetlaczy o zmiennej rozdzielczości oraz różnych odległości oglądania. Model ten może być zatem używany nie tylko w telewizji cyfrowej HDTV, ale również w szerokim zakresie cyfrowych aplikacji wideo, takich jak: wideo monitory, transmisje internetowe, wideo-telefonia. Nieco inne podejście do problemu oceny jakości sekwencji wideo zaproponowano w modelu NTIA/ITS firmy National Telecommunications and Information Administration / Institute for Telecommunication Sciences. Model ten opiera się bowiem na obliczaniu gradientu różnicy pomiędzy wejściowymi i wyjściowymi obrazami, w celu otrzymania obiektywnej miary jakości wideo [59]. Gradienty te reprezentują chwilowe zmiany w wartościach pikseli w czasie o przestrzeni. Model wykorzystuje trzy typy gradientów przedstawione na rys. 4.3-7. Są to informacje o zmianie położenia w poziomie (SIn), informacje o zmianie położenia w pionie (SIv) oraz informacje o zmianie wartości w czasie (TI). Rys. 4.3-7. Typy gradientów dla sekwencji obrazów w modelu NTIA/ITS Z wejściowych i wyjściowych sekwencji obrazów ekstrahowane są skalarne cechy, na których podstawie tworzone są statystyki sumaryczne, które mogą być porównywane ze sobą. Parametry oparte na skalarnych cechach (np. pojedyncza ilość informacji w ramce wideo) są dobrze skorelowane z subiektywną jakością. Dlatego też liczba informacji odniesienia niezbędna do przeprowadzenia wiarygodnych pomiarów jakości jest dużo mniejsza, niż w przypadku użycia kompletnej ramki wideo. Przynosi to znaczące korzyści, szczególnie w takich zastosowaniach jak: utrzymanie i monitorowanie sieci, detekcja błędów, automatyczna kontrola jakości oraz dynamiczna optymalizacja zasobów sieciowych. Zgromadzone wartości wyjściowych cech skalarnych nie wymagają dużych zasobów pamięci, więc mogą być skutecznie archiwizowane dla przyszłego użycia jako dane odniesienia. Wobec tego czasowe zmiany w cyfrowym systemie wideo mogą być wykrywane przez proste porównanie danych archiwalnych z aktualnymi wartościami cech. - 31 - 4.4 Parametryczne metody oceny Parametryczne metody oceny jakości mowy pozwalają na oszacowanie jakości usługi na podstawie pewnych wybranych parametrów połączenia telekomunikacyjnego. Należy do nich dalej opisany tzw. E-model [40, 56], zdefiniowany w zaleceniu G.107 ITU-T i stosowany dla połączeń telefonicznych. W modelu tym tworzony jest matematyczny model uwzględniający wszystkie elementy, wchodzące w skład testowanej sieci lub systemu. Na jego podstawie obliczany jest parametr R, będący łączną miarą jakości mowy. Parametr ten może być obliczony z następującej zależności: R = Ro − I s − I d − I e + A 4.4-1 gdzie: Ro – reprezentuje stosunek mocy sygnału do mocy szumu, Is – reprezentuje zniekształcenia pojawiające się równocześnie z sygnałem mowy (szumy kwantyzacji PCM, sygnały wybierania tonowego), Id – reprezentuje zniekształcenia wynikające z opóźnień wnoszonych w procesie przetwarzania i transmisji, A – jest składnikiem korekcyjnym zależnym od specyfiki dostępu do łącza, Ie – reprezentuje zniekształcenia transmisyjne wnoszone przez urządzenia (kodery, systemy DSI itp) i jako taki może być wyrażony jako suma parametrów K poszczególnych N koderów wchodzących w skład łącza: I e = ∑n =1 K n N 4.4-2 W tabeli 4.4-1 podano wstępnie ustalone wartości parametru K dla najpopularniejszych typów koderów, zaś w tabeli 4.4-2 – wartości składnika korekcyjnego A w zależności od typu systemu. Tabela 4.4-1. Wartość parametru K dla różnych typów koderów Typ kodera PCM ADPCM (G.726-7) LD-CELP (G.728) ACELP (G.729) VSELP (IS 54 USA) GSM (RPE RTP) GSM (ETS 300 581) Przepływność [kbit/s] 64 40 16 8 8 13 6,5 K 0 2 20 15 20 20 25 Tabela 4.4-2. Wartości parametru A przyjmowane w E-modelu dla różnych systemów łączności System łączności Tradycyjna telefonia przewodowa DECT GSM Telefonia satelitarna A 0 5 10 20 Dla szeregu wartości parametru R określana jest jakość mowy metodą subiektywną. Otrzymana w ten sposób krzywa odwzorowania (rys. 4.4-1) jest wykorzystywana do określenia, w następnych testach, jakości mowy wyłącznie na podstawie parametru łącznego R, który może być obliczony na podstawie danych o systemach i sieciach. A zatem bez dokonywania pomiarów można określić jakość sygnału mowy, ponieważ związek pomiędzy parametrem R a subiektywną miarą jakość MOS jest już wyznaczony. - 32 - Rys. 4.4-1. Zależność MOS od parametru R W wielu ośrodkach naukowo-badawczych kontynuowane są prace mające na celu lepsze dopasowanie E-modelu do nowych sposobów świadczenia usług telefonicznych, przede wszystkim VoIP [7]. Prowadzone są również badania mające na celu powiązanie współczynnika R definiowanego z użyciem parametrów QoS jakości świadczenia usługi na poziomie sieci pakietowej IP (opóźnienie pakietów, zmienność opóźnienia pakietów, stopień utraty pakietów, stopień przekłamań pakietów) z miarami oceny subiektywnej w skali MOS, odnoszonymi do jakości świadczenia usługi na poziomie aplikacji typowo multimedialnych, takich jak: wideokonferencja i wideotelefonia. Między innymi prace takie są prowadzone w ramach Projektu Badawczego Zamawianego (PBZ-MNiSW-02-II/2007), w zadaniu pt. „Usługi i sieci teleinformatyczne następnej generacji – aspekty techniczne, aplikacyjne i rynkowe” kierowanym przez Prof. dr hab. inż. Wojciecha Burakowskiego i realizowanym wspólnie z zespołami z Politechniki Warszawskiej, Politechniki Gdańskiej, Akademii Górniczo-Hutniczej, Wojskowego Instytutu Łączności, Naukowej Akademickiej Sieci Komputerowej oraz Instytutu Łączności. Sieć laboratoryjna IP QoS budowana w tym projekcie przez zespół z IŁ-PIB będzie służyć między innymi do empirycznego wyznaczenia krzywej zależności (podobnej do tej z rys. 4.4-1) wiążącej poziomy MOS z tzw. rozszerzonym współczynnikiem R o parametry QoS warstwy pakietowej dla usług multimedialnych wybranych kategorii, takich jak: wideotelefonia internetowa, wideokonferencja internetowa, internetowe gry sieciowe, itd. Mając wyznaczone krzywe MOS w funkcji zmodyfikowanego parametru R, ocena jakości świadczenia usługi multimedialnej sprowadza się do pomiaru parametrów QoS dla sieci pakietowej IP (opóźnienie pakietów, zmienność opóźnienia pakietów, stopień utraty pakietów, stopień przekłamań pakietów) i wyznaczenia wartości MOS z tej krzywej. Sposób pomiaru tych parametrów z użyciem analizatora sieci IP firmy Agilent, zakupionego ze środków inwestycyjnych IŁ-PIB, omówiono w Załączniku nr 1 do tej pracy. - 33 - 5 PODSUMOWANIE Dla oceny jakości aplikacji multimedialnych wykorzystywanych przez urzędy jednostek samorządowych działających w środowisku sieci IP QoS, niezbędna jest ocena jakości mowy, sygnałów fonicznych i wizyjnych. Ze względu na dostępność norm i sprawdzonych rozwiązań można się tu oprzeć na omówionych w pracy metodach oceny obiektywne, które jako gotowe narzędzia są oferowane przez wiele firm. Niestety są to bardzo drogie narzędzia. O wiele prostsze i praktyczniejsze w zastosowaniu wydają się być metody parametryczne, oparte na zmodyfikowanym E-modelu, w sposób omówiony w punkcie 4.4. W kolejnym etapie pracy można by podjąć próbę skonstruowania i empirycznego zweryfikowania zmodyfikowanego współczynnika R, zawierającego parametry połączenia IP (przepływność, opóźnienie pakietów, jitter opóźnienia, stopa utraty pakietów), a następnie – próbę wyznaczenia krzywej MOS funkcji R dla każdej z przedmiotowych aplikacji multimedialnych. Takie rozwiązanie wydaje się być interesujące również i z tego względu, że do tego celu mogła by być wykorzystana sieć laboratoryjna IP QoS, wykonana ze środków Projektu Badawczego Zamawianego (PBZMNiSW-02-II/2007). - 34 - LITERATURA [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] Ahuja S. i inni: Multimedia collaboration. AT&T Technical Journal, September/October 1995 Aldermeshian H., i inni: The video communication decade. AT&T Technical Journal, January/February 1993 ANSI T1.801.01-1996 “Digital transport for video teleconferencing/ videotelephony signals – Video test scenes for subjective and objective performance assessment” – American National Standards Institute, 1996 Brachmański S, Łabno P.: Wpływ zagubień pakietów na zrozumiałość mowy w sieciach IP, KST 2002 Crouch E. i inni: ISDN personal video. AT&T Technical Journal, January/February 1993 Crouch P. i inni: Screen-based multimedia telephony. AT&T Technical Journal, September/October 1995 Ding L., Goubran R.A.: Speech quality prediction in VoIP using the extended E-model. Global Telecommunications Conference, 2003, Vol. 7, pp. 3974- 3978 Dziga J.: Zagadnienia sygnałowe w transmisji ADSL. Materiały z konferencji pt Cyfrowe łącza abonenckie ADSL/VDSL; Akademia Górniczo-Hutnicza w Krakowie - Katedra Telekomunikacji, Wyd. FPT, lipiec 1998. Early S. H. i inni: The VideoPhone 2500-Video Telephony on Public Switched Telephone Network. AT&T Technical Journal, January/February 1993 ETSI Technical Specification TS 102 080 V 1.3.1 (1998-11) : Transmission and Multiplexing (TM); Integrated Services Digital Network (ISDN) basic rate access; Digital transmission system on metalic local lines, 1998 ETSI ETR 250; Speech communication quality from mouth to ear for 3,1 kHz handset telephony across networks, July 1996 ETSI EG 201 377-1: Speech Processing, Transmission and Quality Aspects (STQ); Specification and measurement of speech transmission quality. April 1999 ETSI TS 102 024-5 v4.1.1. Quality of Service (QoS) Measurement Methodologies. 2003 ETR 152 (02/1995): High bit rate digital subscriber line transmission system (HDSL) on metallic local lines. Fenton F., Sipes J.: Architectural and Technological Trends in Access: An Overview. Bell Labs Technical Journal, Vol. 1, No 1, Summer 1996. Filipiak J., i inni: Sieci dostępowe dla usług szerokopasmowych. Tom I. Wyd. FTP, Kraków 1997. Gut-Mostowy H.: Telekomunikacyjne usługi multimedialne - aspekty ogólne. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne nr 1, 1999. Gut-Mostowy H.: Techniki transmisyjne w multimedialnych, abonenckich sieciach dostępowych. Przegląd Telekomunikacyjny i Wiadomości Telekomunikacyjne nr 9, 1998 ITU-R “Methodology for the subjective assessment of the quality of television pictures", International Telecommunications Union BT.500-7, 1995 ITU-T Recommendation F.300 (03/1993): Videotex service ITU-T Recommendation F.701 (11/1988): Teleconference services ITU-T Recommendation F.702 (03/1997): Multimedia conference services ITU-T Recommendation F.711 (08/1993): Audiographic conference teleservice for ISDN ITU-T Recommendation F.720 (08/1992): Videotelephony services general ITU-T Recommendation F.721 (08/1992): Videotelephony teleservice for ISDN ITU-T Draft Recommendation F.722 (1995): Broadband videotelephony services ITU-T Recommendation F.723 (07/1996): Videotelephony services in the Public Switched Telephone Network (PSTN) ITU-T Recommendation H.252.0 (11/2000): Series H: Audiovisual and Multimedia Systems. Infrastructure of audiovisual services - Transmission multiplexing and synchronization - 35 - [29] ITU-T Recommendation H.320 (05/1999): Narrowband Visual Telephone Systems and Terminal Equipment [30] ITU-T Recommendation H.323 (05/1999): Series H: Audiovisual and Multimedia Systems. Infrastructure of audiovisual services - Systems and terminal equipment for audiovisual services [31] ITU-T Recommendation T.120 (07/1996): Data protocols for multimedia conferencing [32] [P.800] ITU-T Recommendation P.800: Method for subjective determination of transmission quality, 1996 [33] ITU-T P.810: Modulated Noise Reference Unit (MNRU). February 1996 [34] ITU-T P.830: Subjective Performance Assessment of Telephone-Band and Digital Codecs. February 1996 [35] ITU-T P.910: Subjective video quality assessment for multimedia applications, 1996 [36] ITU-T P.911: Subjective audiovisual quality assessment for multimedia applications [37] ITU-T P.861: Objective Quality Measurement of Telephone-Band Speech Codecs. February 1998 [38] ITU-R Recommendation BS 1387: Method for Objective Measurements of Perceived Audio Quality (PEAQ), 1998 [39] ITU-T Recommendation P.862: Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrowband telephone networks and speech codecs [40] ITU-T Recommendation . G.107. The E-Model, A Computational Model For Use in Transmission Planning. 2003 [41] ITU-T Recommendation J.140, Subjective picture quality assessment for digital cable television [42] ITU-T Recommendation J.143, User requirements in digital cable television [43] ITU-T Recommendation J.144, Objective perceptual video quality measurement techniques for digital cable television in the presence of a full reference, March 2004 [44] ITU-T Recommendation P.563, Single-ended method for objective speech quality assessment in narrow-band telephony applications, May 2004 [45] Jankowski P.: Protokół IP wersja 6 Telekomunikacja i techniki informacyjne, 1-2/2002 [46] Lech J. IPv6 - nowe możliwości. Adres Internetowy: http://kni.ae.krakow.pl/html/ipv6.html, 2000 [47] Lawrence V. B., i inni: Broadband Access to the Home on Copper. Bell Labs Technical Journal, Vol. 1, No 1, Summer 1996. [48] Kula S., Dymarski P. i inni : Multimedialne systemy telekomunikacyjne w sieciach pakietowych. KST 1999 [49] Kula S.: Subiektywne i obiektywne metody badania jakości mowy przesyłanej w sieciach telekomunikacyjnych. Pomiary w telekomunikacji, nr 20, Warszawa 2001 [50] Norma ETS 328: Transmission and Multiplexing (TM); Asymetric Digital Subscriber Line (ADSL); Requirements and performance. [51] Olshansky R.: Broadband Digital Subscriber Line - A full-service network for the Cooper plant. Telephony, June 12 1995 [52] Pach A. R., i inni: Sieci dostępowe dla usług szerokopasmowych. Tom II. Wyd. FTP, Kraków 1997 [53] Papir Z, i inni: Sieci dostępowe dla usług szerokopasmowych. Tom III. Wyd. FTP, Kraków 1997 [54] RFC 1889: RTP: A Transport Protocol for Real-Time Applications. January 1996 [55] Sterling W. i inni: Multimedia databases and servers. AT&T Technical Journal, September/October 1995 [56] Trzaskowska J.: Ocena jakości sygnału mowy w oparciu o Model E w zastosowaniu do krajowej sieci telefonicznej. Rozprawa doktorska. Instytut Łączności. 2000 [57] Winkler S. A perceptual distortion metric for digital color video, Human Vision and Electronic Imaging IV, Bellingham 1999 [58] Wolf S, Pinson M.: In-service performance metrics for MPEG-2 video systems. In Proc. Made to Measure 98 – Measurement Techniques of the Digital Age technical Seminar, International - 36 - Academy of Broadcasting (IAB), ITU and Technical University of Brunschweig, Montreux, Switzerland, November 1998 [59] Wolf S, Pinson M.: Video Quality Measutment Techniques, NTIA Raport 02-392, Czerwiec 2002 - 37 - ZAŁĄCZNIK 1: Specyfikacja pomiarów podstawowych parametrów QoS dla sieci pakietowych oraz jakości usług VoIP i IP TV - 38 - Pomiar czasu odpowiedzi (Round Trip Delay) Celem badania jest pomiar czasu dopowiedzi w sieci opartej na protokole IP na odcinku sieci WAN między dwoma punktami końcowymi. Test umożliwia pomiar czasu odpowiedzi (parametru Round Trip Delay RFC 2544). Realizowane jest to poprzez transmisję specjalnie oznaczonych ramek, które są „odbijane” przez urządzenie zlokalizowane zdalnie. Rys. Z1-1. Konfiguracja testowa dla pomiaru czasu odpowiedzi (Round-trip delay) Możliwa jest do zastosowania konfiguracja przedstawiona na rys. Z1-1, z pojedynczym urządzeniem pomiarowym, z wykorzystaniem urządzenia po stronie zdalnej zapewniającym odesłanie pakietu kontrolnego do nadajnika (pomiar czasu odpowiedzi). Urządzeniami pomiarowymi zarówno po stronie generacji jak również stronie zdalnej są Framescope pro (zapewniające dokładność pomiaru min. rzędu 1ms) podłączone do różnych lokalizacji sieci WAN połączonych za pomocą VPN. Ogólna metodyka wykonywania badań: 1. Należy skonfigurować interfejsy sieciowe, urządzenie po stronie odbiorczej ustawić w tryb pracy Loopback 2. Należy ustalić wielkość pakietów testowych (w bajtach), dokonać wyboru protokołu (o ile jest to możliwe należy zastosować protokół wykorzystywany przez aplikacje użytkowe – np. UDP, który jest stosowany przez aplikacje VoIP) wykorzystywanego przez ruch testowy oraz określić adres (adresy IP lub adresy MAC) generującego oraz zdalnego urządzenia wyposażonego w interfejs sieciowy, które ma za zadanie odsyłać otrzymane pakiety testowe do nadajnika w przypadku pomiaru czasu odpowiedzi, 3. Należy ustalić parametry związane z jakością testu: ilość testowych pakietów dla jednej, czas przerwy pomiędzy testami, czas trwania całego testu (np. 20 pakietów dla pojedynczego testu. Testy wykonywane co 30 min w przeciągu 8 godzin największego obciążenia sieci) 4. Na podstawie zarejestrowanych danych wykonywane są obliczenia wielkości chwilowych, średnich, inne parametry związane ze statystyką pomiaru. Przeprowadzenie testu 1. Określenie czasu połączenia, odstępów czasowych pomiędzy połączeniami, ilości przeprowadzonych połączeń (np. czas połączenia – 5 minut, połączenia wywoływane co 30 min, ilość wszystkich połączeń 50) 2. Zapisywanie wyników parametrów dla każdej sesji, 3. Analiza polegająca na obliczaniu wartości średnich jako wartości ostatecznych otrzymanych wyników. Kryterium oceny: zgodność z wartością zakontraktowaną w umowie SLA. - 39 - Współczynnik utraty pakietów Celem badania jest pomiar współczynnika utraty pakietów w sieci opartej na protokole IP na odcinku sieci WAN między dwoma punktami dostępu do usług. Przygotowanie do badań: Przygotowanie konfiguracji badaniowej złożonej z dwóch urządzeń pomiarowych wraz z wyłączeniem ruchu użytkowego na łączu WAN. Opis badania: konfiguracja badaniowa wymaga zapewnienia dwóch urządzeń pomiarowych, przy czym każde z nich dołączone jest do jednego punktu dostępowego. Jedno z urządzeń pełni rolę generatora ruchu, drugie pełni funkcję odbiornika. Pomiar polega na porównaniu liczby pakietów wysłanych przez generator oraz pakietów odebranych po stronie odbiornika. w określonym okresie pomiarowym. W trakcie pomiaru łącza WAN podlega „wysyceniu” ruchem testowym do gwarantowanej przepustowości i obserwacji liczby utraconych pakietów. W typowym teście, w każdym kolejnym kroku pomiarowym ilość generowanych danych jest redukowana o 10%, aż do momentu braku efektu utraty pakietów. Możliwe jest zastosowanie trybu pomiaru współczynnika utraty pakietów w trybach downstrem, upstream oraz dwukierunkowym. Pomiar współczynnika utraty pakietów wymaga wyłączenia łącza do sieci WAN z bieżącej obsługi, tzn. dopuszczenie do wymiany na łączu WAN jedynie ruchu testowego i związanego z procesami utrzymaniowymi łącza (np. protokoły routingu). Urządzeniami pomiarowymi zarówno po stronie generacji jak również stronie zdalnej są Framescope Pro, podłączone do różnych lokalizacji sieci WAN połączonych za pomocą VPN. Ogólna procedura wykonywania badań: 1. Należy skonfigurować interfejsy sieciowe urządzeń, dla trybu dwukierunkowego urządzenie po stronie odbiorczej ustawić w tryb pracy Loopback 2. Należy ustalić wielkość pakietu dla ruchu testowego, dokonać wyboru protokołu (o ile jest to możliwe należy zastosować protokół wykorzystywany przez aplikacje użytkowe – np. UDP, który jest stosowany przez aplikacje VoIP) wykorzystywanego przez ruch testowy oraz określić adresy (adresy IP lub adresy MAC) nadajnika i odbiornika 3. Jeśli pomiar dotyczy określonej klasy usługowej, należy zapewnić, aby ruch testowy spełniał warunki dla tej klasy. 4. Wykonać inne ustawienia niezbędne dla danego urządzenia lub , w tym zapobiegające kompresji zawartości pakietów testowych. Przeprowadzenie testu 1. Test realizowany jest poprzez obserwację wyników przy malejącym o 10 % gwarantowanego pasma IP wolumenie ruchu (w granicach 100%-10%) lub osiągnięciu zjawiska braku utraty pakietów 2. Zapamiętywanie współczynnika utraty pakietów dla wszystkich wolumenów ruchu. 3. Przeprowadzenie analizy statystycznej wyników dla każdego wolumenu Kryterium oceny: zgodność z wartością zakontraktowaną w umowie SLA. - 40 - Zmienność opóźnienia pakietów – jitter Celem badania jest pomiar wariancji opóźnienia oraz wariancji czasu odpowiedzi w sieci opartej na protokole IP na odcinku sieci WAN między dwoma punktami końcowymi. Opis badania: Analizator FrameScope Pro nie umożliwia pomiaru jittera, można jednak go wyliczyć na podstawie badać pomiaru czasu odpowiedzi. Konfiguracja badaniowa jest identyczna z zastosowaną do pomiaru czasu odpowiedzi. Na podstawie pomiaru min. 3 kolejnych pakietów ruchu testowego możliwe jest wyznaczenie wariancji czasu odpowiedzi. Większa liczba pakietów testowych implikuje większą dokładność. Pomimo braku jednoznacznych rekomendacji, za minimalną liczbę pakietów należy przyjąć liczbę 10. Kryterium oceny: zgodność z wartością zakontraktowaną w umowie SLA. Wariancja opóźnienia jest wyznaczana w oparciu o metodę opisaną w dokumencie RFC 3393 - 41 - Pomiar VoIP Celem pomiaru jest określenie parametrów subiektywnych oraz obiektywnych parametrów dla usługi VoIP. Parametrami tymi są: • Średnia utrata pakietów • Czas odpowiedzi (Round Trip Delay) • Jitter • R-Faktor • MOS Tryby pomiaru 1. Pomiar będzie realizowany za pomocą urządzeń – analizatorów VoIP (Framescope Pro) służących jako urządzenia końcowe VoIP Rys. Z1-2. 2. Możliwa jest praca w trybie bezpośrednim (bez pośrednictwa serwera proxy) także w trybie pośrednim (z pośredniczeniem serwera proxy) . Rys. Z1-2. Tryb pomiaru urządzeniami końcowymi VoIP Rys. Z1-3. Tryb pomiaru urządzeniami końcowymi VoIP w konfiguracji z serwerem proxy Przygotowanie do badań Połączenie urządzeń do sieci, w których odległe lokalizacje np. urzędy połączone są za pomocą VPN. Urządzenia mają zaimplementowane protokoły służące do synchronizacji Możliwe zastosowanie opcji połączenie urządzeń do modemów DSL - 42 - Konfiguracja urządzeń 1. Ustalenie wielkości pakietów transmitowanych pakietów , protokółu transportowego w opcji Traffic VoIP generator . 2. Ustalenie w menu VoIP (dla obu urządzeń końcowych) protokołu sygnalizacyjnego. W urządzeniu Framescope dostępne są : SIP, Megaco i H.323, zakresu numerów portów dla protokołu sygnalizacyjnego oraz protokołu RTP. 3. Ustalenie w menu VoIP (dla obu urządzeń końcowych) kodeka, numeru strony wywołującej połączenie oraz numeru żądanego, czasu trwania sesji. 4. Ustawienie adresu IP urządzenia, na które kierowane jest połączenie w polu SIP Server.(w przypadku trybu z serwerem proxy ustawianie adresu IP serwera proxy). Przeprowadzenie testu 1. Określenie czasu połączenia, odstępów czasowych pomiędzy połączeniami, ilości przeprowadzonych połączeń (np. czas połączenia – 5 minut, połączenia wywoływane co 30 min, ilość wszystkich połączeń 50) 2. Zapisywanie wyników parametrów dla każdej sesji, 3. Analiza polegająca na obliczaniu wartości średnich jako wartości ostatecznych otrzymanych wyników. Kryterium oceny: zgodność z wartością zakontraktowaną w umowie SLA. - 43 - Pomiar IP TV Celem pomiaru jest określenie parametrów subiektywnych oraz obiektywnych parametrów dla usługi VoIP. Parametrami tymi są: • Ilość błędów w tablicach PAT/PTM/PCR • Media Delivery Index DF określa maksymalne opóźnienia dla strumienia pakietów • Media Delivery Index: LR – średnia ilość traconych informacji dla strumienia pakietów • ZAP time parametr określający czas zmiany kanału przez użytkownika – możliwy do pomiaru o ile serwer IPTV umożliwia taką funkcję • Parametry związane z protokołem RTP (jitter, współczynnik utraty pakietów) Rys. Z1-4. Pomiar IPTV Tryb pomiaru Pomiar realizowany jest poprzez podłączenie na jednym końcu sieci analizatora Framescope Pro, zaś na drugim końcu serwera video. Obliczanie parametrów będzie dokonywane na podstawie odtwarzania pliku umieszczonego na serwerze video. Analizator umożliwia ustawienie wartości progowych dla każdego z parametrów. Wynik końcowy testu zawiera informację o parametrach w odniesieniu do wartości progowych. Konfiguracja urządzeń Analizator Framescope Pro należy przypisać adres IP serwera video. Należy skonfigurować serwer oraz analizator tak, aby posiadały jednolity port protokółu RTP. Dla tak skonfigurowanego urządzenia należy ustalić wartości progowe każdego analizowanego parametru. Przeprowadzenie testu Pojedynczy test składa się odtworzenia przez serwer pliku strumieniowego umieszczonego na serwerze o określonej wielkości (np. 10 MB) zakodowanego w formacie MPEG. Kryterium oceny: zgodność z wartością zakontraktowaną w umowie SLA. - 44 -