MPEG-7 - Politechnika Wrocławska
Transkrypt
MPEG-7 - Politechnika Wrocławska
MPEGMPEG-7 Oficjalna nazwa: 1. Wstę Wstęp Multimedia Content Description Interface - 2001 Język opisu zawartoś zawartości obiektó obiektów multimedialnych MPEGMPEG-1, MPEGMPEG-2, MPEGMPEG- 4 - normował normowały reprezentację reprezentację (zwarty zapis) obiektó obiektów multimedialnych. MPEGMPEG-7 - normuje opisy zawartoś zawartości obiektó obiektów multimedialnych. Obszar zainteresowania normy MPEGMPEG-7 Jacek Jarnicki Politechnika Wrocł Wrocławska 1 Jacek Jarnicki Politechnika Wrocł Wrocławska 2 Opisy materiał materiału multimedialnego mogą mogą być być tworzone „ręcznie” cznie”, na przykł przykład przez podanie pewnych typowych informacji przez twó twórcó rców materiał materiału (tytuł (tytuł utworu, data produkcji, kró krótki opis treś treści), lub automatycznie przez komputer. Wytworzone w ten sposó sposób opisy są są nastę następnie w odpowiedni, okreś określony standardem MPEGMPEG-7 sposó sposób porzą porządkowane i kodowane . Opis materiał przy pomocy materiału multimedialnego standaryzowanych deskryptoró deskryptorów moż może sł służyć dalej ró różnych celó celów np. do tworzenia indeksó indeksów w archiwach materiał materiałów multimedialnych, wyszukiwania materiał materiałów w bazach danych itp. Jacek Jarnicki Politechnika Wrocł Wrocławska 3 Podstawowe elementy opisu przy pomocy standardu MPEGMPEG-7 Jacek Jarnicki Politechnika Wrocł Wrocławska 4 1 Gdzie moż może być być pomocny standard MPEGMPEG-7? Częś ci normy MPEGCzęści MPEG-7 Systems – the tools needed to prepare MPEGMPEG-7 descriptions for efficient transport and storage and the terminal architecture. Description Definition Language - the language for defining the syntax of the MPEGMPEG7 Description Tools and for defining new Description Schemes. Architektura, rynek nieruchomoś nieruchomości, projektowanie wnę wnętrz (szukanie okreś okreś lonych rozwią rozwiązań zań projektowych) TV, radio (inteligentne przeszukiwanie kanał kanałó w) Usł Usługi kulturalne (muzea, galerie sztuki itp.) Biblioteki cyfrowe (katalogi zdjęć zdjęć i filmó filmó w, katalogi muzyki, itp.) Visual – the Description Tools dealing with (only) Visual descriptions. E-Comerce (katalogi onon-line) line) Audio – the Description Tools dealing with (only) Audio descriptions. Edukacja (poszukiwanie materiał materiału multimedialnego) Rozrywka domowa (przeszukiwanie prywatnych archiwó archiwó w multimedialnych, manipulowane ich zawartoś zawartością cią, edycja materiał materiałó w video, poszukiwanie gier, karaoke) karaoke) Multimedia Description Schemes - the Description Tools dealing with generic features and multimedia descriptions. Usł Usługi detektywistyczne (rozpoznawanie osó osób na podstawie wybranych cech) Reference Software - a software implementation of relevant parts of the MPEGMPEG-7 Standard with normative status. Dziennikarstwo (poszukiwanie materiał materiału multimedialnego) Conformance Testing - guidelines and procedures for testing conformance of MPEGMPEG7 implementations MPEGMPEG-7 Extraction and use of descriptions Edycja materiał materiału multimedialnego ( personalizacja treś treści) Jacek Jarnicki Politechnika Wrocł Wrocławska Katalogi firm, Sł Słowniki, Informatory (przeszukiwanie) Jacek Jarnicki Politechnika Wrocł Wrocławska 5 Inne standardy stosowane do opisu materiał materiału multimedialnego EBU P/META – model normalizują normalizujący dane sł służące żące do opisu materiał materiałów multimedialnych, przyję przyjęto tu tzw. model transakcyjny przydatny w procesie obiegu materiał materiałów: Dublin Core – standard definiuje zestaw atrybutó atrybutów służących żących do opisu materiał materiału, dla przykł przykładu: EBU – European Brodcastning Union • Title (tytuł (tytuł) Przyję Przyjęto nastę następują pujące rodzaje transakcji: • Creator (osoba odpowiedzialna za cał całość materiał materiału) • Producer to Distributor (opis tekstowy, lista wystę występują pujących postaci, skrypt, zdję zdjęcia promocyjne) • Subject (temat) • • • • • Description (opis podsumowują podsumowujący treść treść materiał materiału) • Publisher (wydawca) • 6 … • Coverege (kwalifikacja treś treści) Producer to Archive (…) Archive to Producer (…) Dystributor to Archive (…) Archive to Dystributor (…) • Rights (okreś (określenie praw autorskich) Jacek Jarnicki Politechnika Wrocł Wrocławska 7 Jacek Jarnicki Politechnika Wrocł Wrocławska 8 2 2. Dane podlegają podlegające normalizacji w standardzie MPEGMPEG-7, deskryptory Deskryptory wizualne wedł według standardu MPEGMPEG-7 Podstawowe – Grid Layout, ayout, Time series, Multiple view, Spatial 2D coordinates,Temporal interpolation. interpolation. Jakie dane podlegają podlegają normalizacji? Koloru – Color space, Color Quantization, Dominant Colors, Scalable Color, Color, Color Layout, ColorColor-Structure, GoF/GoP Color. Dane dotyczą dotyczące produktu multimedialnego - autor, tytuł tytuł, producent, format w jakim zapisano produkt itp. Dane dotyczą dotyczące treś treści – opisy zawartoś zawartości treś treścowej. cowej. Tekstury – Homogeneous Texture, Edge Histogram, Texture Browsing. Browsing. Dane dotyczą dotyczące semantyki – zdarzenia, obiekty, postacie. Kształ Kształtu – Region Shape, Contour Shape, and Shape 3D. 3D. Dane dotyczą dotyczące sygnał sygnału – kolor, tekstura, ruch, linia melodyczna muzyki itp. Jacek Jarnicki Politechnika Wrocł Wrocławska Ruchu – Camera Motion, Motion, Motion Trajectory, Trajectory, Parametric Motion, Motion, and Motion Activity. Activity. 9 Jacek Jarnicki Politechnika Wrocł Wrocławska 10 3. Przykł Przykłady deskryptoró deskryptorów video i audio Poł Położenia – Region locator, locator, SpatioSpatio-temporal locator. locator. Rozpoznawanie twarzy – FaceRecognition Jak okreś określone są są niektó niektóre wymienione wcześ wcześniej deskryptory? Jakich modeli matematycznych uż używa się się do ich opisywania? Deskryptory audio wedł według standardu MPEGMPEG-7 Deskryptory video Deskryptory podstawowe – Audio Signature Description Scheme Grid Layout - Definiuje sposó sposób podział podziału obrazu na takie same obszary prostoką prostokątne. Każ Każdy obszar bę będzie dalej traktowany niezależ Każ obszarowi bę niezależnie. Każdemu będą przypisywane dalej niezależ niezależnie wyznaczane dla niego deskryptory takie jak: kolor tekstura itp. – Musical Instrument Timbre Description – Melody Description – Sound Recognition and Indexing Description – Spoken Content Description Jacek Jarnicki Politechnika Wrocł Wrocławska Moż Można powiedzieć powiedzieć, że deskryptor Grid Layout okreś określa sposó sposób „pró próbkowania obrazu” obrazu” innymi deskryptorami. 11 Jacek Jarnicki Politechnika Wrocł Wrocławska 12 3 Time Series - Definiuje szereg czasowy pozwalają pozwalający okreś określić lić zmiany innego deskryptora opisują opisującego obiekt w czasie. Dopuszcza się się wystę występowanie dwó dwóch rodzajó rodzajów deskryptora szeregu czasowego. RegularTimeSeries w tym przypadku pró próbkowanie w dziedzinie czasu nastę następuje w ró równych odstę odstępach i IrregularTimeSeries dla odstę odstępów nieró nierównych. Zastosowanie drugiego sposobu pozwala w niektó niektórych przypadkach na poprawienie zwartoś zwartości opisu. Temporal Interpolation Definiuje sposó sposób interpolacji czasowej wykorzystują wykorzystującej wielomiany. Deskryptor ten moż może być użyty do aproksymacji wartoś zmiennej być wartości wielowymiarowej, dla przykł przykładu poł położenia obiektu na obrazie w sekwencji video. Jacek Jarnicki Politechnika Wrocł Wrocławska 13 Deskryptory koloru Color Space - Definiuje bieżą co uż bieżąco używany model barw. Model ten jest dalej waż ważny dla wszystkich deskryptoró deskryptorów dotyczą dotyczących barwy. Aktualnie norma dopuszcza uż użycie nastę następują pujących modeli barw: – R,G,B – Y,Cr,Cb – H,S,V – HMMD (Hue, Min, Max, Difference) Difference) – Liniowej transformacji z modelu R,G,B – Monochromatycznego Jacek Jarnicki Politechnika Wrocł Wrocławska 15 Temporal Interpolation - Na rysunku powyż powyżej pokazano „prawdziwy” prawdziwy” przebieg wspó współrzę rzędnej x jakiegoś jakiegoś obiektu w czasie oraz jego aproksymację aproksymację pię pięcioma odcinkami prostej i dwoma segmentami paraboli. Jacek Jarnicki Politechnika Wrocł Wrocławska 14 Dominant Color(s) - Charakterystyka pozwalają Color(s) pozwalająca na przypisywanie obiektowi (ramce, obszarowi ramki, sekwencji ramek, obszarowi temporalnemu) informacji o dominują dominującym kolorze (kolorach) : Scalable Color - Histogram barw w modelu HSV zakodowany przy pomocy transformaty Haara. Haara. Przypisywany jest podobnie jak poprzedni deskryptor obiektowi. Reprezentacja falkowa histogramu koloró kolorów pozwala na skalowalność skalowalność deskryptora. Color Layout - Informacja o wspó współczynnikach DCT obliczonych dla poszczegó poszczególnych podobszaró podobszarów Wspó Współczynniki wyznacza się się dla modelu barw Y, i odpowiednio koduje. Jacek Jarnicki Politechnika Wrocł Wrocławska obrazu ramki. Cb, Cr 16 4 Color Structure - Informacja o tzw. strukturalnym histogramie koloró kolorów. Charakterystyka wyliczana jest w przestrzeni barw HMMD. Opis ten pozwala rozró rozróżnić nić przypadki, gdy normalne histogramy są są takie, czyli w dwó dwóch obrazach jest taka sama liczba punktó punktów o danych kolorach. Jeś Jeśli punkty są są rozmieszczone inaczej to histogramy strukturalne dla dwó dwóch takich obrazó obrazów bę będą różne. Deskryptory tekstury Texture Browsing – Charakterystyka okreś określają lająca pewne cechy percepcyjne tekstury, jak na przykł przykład regularność regularność czy kierunkowość kierunkowość.. Dla wyliczenia deskryptora stosuje się się metodę metodę polegają polegającą na analizie kierunkó kierunków na obrazach spektralnych tekstury. Podobnie jak w poprzednim przypadku się się transformację transformację Radona i filtry Gabora. Gabora. Edge Histogram – Histogram rozkł rozkładu przestrzennego elementarnych (jest ich pięć pięć)) typó typów krawę krawędzi. Homogenous Texture – Charakterystyka wyraż wyrażają ająca jednorodność jednorodność tekstury obiektu. Przykł Przykładem tekstury jednorodnej moż może być być widok duż dużego parkingu z samolotu. Dla wyliczenia deskryptora stosuje się się transformację transformację Radona i filtry Gabora. Gabora. Jacek Jarnicki Politechnika Wrocł Wrocławska Jacek Jarnicki Politechnika Wrocł Wrocławska 17 Deskryptory kształ kształtu Region Shape – Charakterystyka kształ kształtu obszaru liczona za pomocą pomocą momentó momentów Zernicke . 18 Contour Shape – Charakterystyka kształ kształtu konturu obszaru. Obliczenia charakterystyki przeprowadza się się na podstawie analizy tzw. Curvature Scalerepresentation Scale-Space (skalowalnej przestrzeni krzywizny). Pozwala to na wył wyłowienie percepcyjnych wł właściwoś ciwości kształ kształtu konturu. Deskryptory ruchu Camera Motion Opis parametró parametrów ruchomej kamery. Kształ Kształty „różne” ne” Kształ Kształty „dość dość podobne” podobne” Jacek Jarnicki Politechnika Wrocł Wrocławska 19 Jacek Jarnicki Politechnika Wrocł Wrocławska 20 5 Deskryptory audio Audio Signature Opis statystycznych wł właściwoś ciwości lokalnych widma sygnał sygnału dźwieku. wieku. Musical Instrument Timbre Zestaw deskryptoró deskryptorów charakteryzują charakteryzujących liczbowo brzmienie poszczegó poszczególnych instrumentó instrumentów muzycznych wyraż wyrażonych w kategoriach analizy widmowej. Motion Trajectory Opis ruchu obiektu (trajektoria) interpolowana przy pomocy krzywej zbudowanej z segmentó segmentów wielomianowych pierwszego lub drugiego stopnia. Musical Instrument Timbre Skomplikowany deskryptor opisują opisujący zależ zależnoś ności czasowe i linie melodyczną melodyczną utworu. General Sound Recognition and Indexing Deskryptor pozwalają pozwalający na odró odróżnienie muzyki od szumu, gł głosu m ężczyzny ężczyzny od kobiety itp. Wykorzystano elementy teorii procesó procesów Markowa Jacek Jarnicki Politechnika Wrocł Wrocławska Jacek Jarnicki Politechnika Wrocł Wrocławska 21 22 AAudioSpectrumProjection Przykł Przykład: AudioSpectrumBasis Charakterystyki zredukowane – AudioSpectrum Basis AudioSpectrumBasis i AudioSpectrum Projection AudioSpectrumProjection Spektrogram – AudioSpectrumEnvelope Jacek Jarnicki Politechnika Wrocł Wrocławska 23 Jacek Jarnicki Politechnika Wrocł Wrocławska 24 6 4. Koncepcja poró porównywania obiektó obiektów Obiekt 1 [D1,D2, …,Dn] Poró Porównanie wektoró wektorów deskryptoró deskryptorów Obiekt 2 [D1,D2, …,Dn] Jacek Jarnicki Politechnika Wrocł Wrocławska 25 7