Phonak Insight_generacja Spice
Transkrypt
Phonak Insight_generacja Spice
Phonak Insight Generacja Phonak Spice Nowa generacja klasyfikacji dźwięku i układów kierunkowych Wprowadzenie Czy lepsze jest coś większego czy coś mniejszego? Oczywiście nie istnieje jedna właściwa odpowiedź, ponieważ zależy ona od wymiaru, do którego się odnosimy. Wymiarem, gdzie większe jest oczywiście lepsze, jest moc przetwarzania platformy Phonak - baza technologiczna stanowiąca podstawę generacji aparatów słuchowych obejmująca układ scalony, opcje przetwarzania sygnału, projektowanie mechaniczne i oprogramowanie dopasowujące. Nowa platforma Spice zapewnia dwukrotnie większą moc przetwarzania w porównaniu do platformy CORE. Ta dodatkowa moc daje się zauważyć już w pierwszej grupie wprowadzonych aparatów słuchowych Spice i stanowi platformę startową dla zaawansowanego przetwarzania dźwięku i innowacyjnych aparatów słuchowych. Czy mocy obliczeniowej może być za dużo? Czy zdarzyło Ci się usłyszeć: dziękuję, ale procesor w moim komputerze jest na prawdę wystarczająco szybki, zachowaj te dodatkowe gigaherce dla siebie; mam również mnóstwo pamięci, możesz więc włożyć tę dodatkową kartę pamięci do szuflady. Możesz także zwrócić ten 100-gigabajtowy dysk twardy do sklepu. Nikt nie mówi w ten sposób. Gdy członkowie zespołu ds. rozwoju platformy Spice zaczęli szukać sposobów zwiększenia możliwości dla użytkowników i osób dopasowujących aparaty, inżynierowie Phonak ds. sprzętu szybko odpowiedzieli specyfikacją nowej platformy zapewniającej dwukrotnie większą moc przetwarzania niż platforma CORE. Oparta na tym trwałym fundamencie i wspólnej wizji intensywna współpraca całego zespołu badawczo-rozwojowego firmy Phonak zaowocowała powstaniem nowej przełomowej platformy Spice. Często najlepszym sposobem na docenienie nowego produktu jest porównanie go z istniejącym punktem odniesienia. Na rysunku 1 przedstawiono ewolucję kluczowych wymiarów fizycznych trzech ostatnich platform firmy Phonak. Liczba tranzystorów rośnie z każdą generacją platformy, natomiast struktura wykazuje trend malejący. Im więcej dostępnych tranzystorów, lipiec 2010 1z5 tym większa ilość możliwego do wykonania przetwarzania. Im mniejsza struktura, tym więcej komponentów można pomieścić w układzie scalonym i tym mniejsze zużycie energii przez ten układ dla takiego samego zadania. Rysunek 1: Ewolucja kluczowych wymiarów fizycznych Rysunek 2 przedstawia podobny obraz dla niektórych kluczowych zagadnień przetwarzania. Prawie podwojenie liczby milionów operacji na sekundę przy przejściu z platformy CORE do Spice oznacza, że układ scalony nowej generacji wykonuje dwa razy więcej zadań. Rysunek 2 - Ewolucja kluczowych zagadnień przetwarzania Aparaty słuchowe firmy Phonak naprawdę przodują w pełnym wykorzystaniu możliwości podstawowych komponentów platformy. W tym artykule z cyklu Phonak Insight omówiono niektóre innowacje związane z przetwarzaniem sygnału, które są teraz dostępne na platformie Spice dzięki podwojeniu mocy przetwarzania. Dokładna klasyfikacja otoczenia dźwiękowego Wyobraźmy sobie przez chwilę premierę nowego przedstawienia w sali koncertowej - w szczególności z punktu widzenia trzech różnych osób z obsługi. Najpierw bileter, wskazujący ludziom ich miejsca. Ma najwięcej pracy przez 10 minut przed wywołaniem aktorów przed kurtynę, ale zawsze pojawią się spóźnialscy, którym należy wskazać miejsce przed rozpoczęciem przedstawienia. Ważne jest, aby bileter dobrze zrozumiał spóźnialskich, aby w jak najmniejszym stopniu przeszkadzać publiczności, która już zajęła swoje miejsca. Teraz wyobraźmy sobie drugą osobę -melomankę z biletami okresowymi do tej sali koncertowej. Czerpie ogromną radość z obecności na premierze i delektowania się pierwszym dopiętym na ostatni guzik po tygodniach prób przedstawieniem. Na końcu pomyślmy o trzeciej osobie z obsługi- oświetleniowcu sali koncertowej, który musi dbać o to, aby światło punktowe nieustannie oświetlało głównego wokalistę. Znajduje się on bezpośrednio nad głośnikami i musi zmagać się głośnym dźwiękiem, utrzymując dokładny kierunek światła punktowego. To, co początkowo wydaje się być takim samym otoczeniem dźwiękowym, jest zdecydowanie różne dla każdej z tych osób, a ponadto każda osoba słucha w innym celu. Przetwarzanie wykonywane przez platformę Spice udostępnia zaawansowaną klasyfikację dźwięków i możliwości intuicyjnego uczenia się, aby dokładnie dopasować się do intencji słuchającego użytkownika w jego najbliższym otoczeniu dźwiękowym. Czy dokładność to to samo, co precyzja? Aparaty słuchowe generacji Phonak Spice korzystają z niewyobrażalnych wcześniej możliwości przetwarzania. Jedną z funkcji przetwarzania dźwięków przez platformę Spice, która je wykorzystuje, jest klasyfikacja otoczenia dźwiękowego za pomocą SoundFlow – automatyki dostępnej w każdym aparacie słuchowym firmy Phonak (Nyffeler, 2009)1.Najnowocześniejsze aparaty słuchowe dobrze klasyfikują podstawowe otoczenia dźwiękowe. Jednak poziom szczegółowości czy też precyzji tej klasyfikacji jest subtelniejszą sztuką. SoundFlow generacji Phonak Spice najpierw analizuje 46 różnych cech przychodzącego sygnału, takich jak SNR, poziomy niskich częstotliwości, strukturę widmową, a następnie na ich podstawie przeprowadza klasyfikację. Parametry te są analizowane, łączone i rzutowane na punkt w przestrzennym modelu dźwięku obejmującym cztery strefy lipiec 2010 2z5 otoczenia dźwiękowego - Cisza, Mowa w hałasie, Hałas i Muzyka, jak to pokazano na rys. 3. Jeśli punkt znajduje się w jednej ze sfer otoczenia dźwiękowego, przyjmuje się, że w 100% jest on powiązany z tym otoczeniem dźwiękowym, i ten program podstawowy używany jest dla tego otoczenia. Jeśli punkt nie znajduje się w żadnej z tych sfer, powiązanie z otoczeniem dźwiękowym jest obliczane za pomocą zasady przyciągania. Ta metoda zapewnia naturalne odwzorowanie otoczenia dźwiękowego na przestrzenny model dźwięku, zapewniając dokładniejszą, niezawodną i szybszą klasyfikację dochodzącego dźwięku. Rysunek 3 - Wysokiej klasy, wielowymiarowy system klasyfikacji dźwięku używany w systemie SoundFlow do zapewnienia precyzyjnego działania automatycznego. Jakby dotychczasowe obliczenia nie były wystarczająco złożone, klasyfikator otoczenia SoundFlow bierze teraz pod uwagę przestrzenne różnice w dźwięku. Oznacza to, że klasyfikator uwzględnia stronę, w którą użytkownik zwrócony jest twarzą. W naszej sali koncertowej odgłosy mowy pochodzące od nieliczących się z innymi osób siedzących za melomanką są traktowane, jako hałas w tle i nie powodują przejścia do klasyfikacji Mowa w hałasie. Ta dokładna klasyfikacja jest nieprzerwanie przeprowadzana w czasie rzeczywistym, umożliwiając automatyce SoundFlow błyskawiczne utworzenie optymalnego programu mieszanego na podstawie wielu programów podstawowych. Ponadto przejścia między tymi programami mieszanymi są tak płynne, że są niedostrzegalne dla użytkownika. Aparaty słuchowe są już w pełni rozwinięte Precyzyjna klasyfikacja otoczenia dźwiękowego w czasie rzeczywistym robi wielkie wrażenie, ale aby była naprawdę użyteczna, należy także uwzględnić preferencje użytkownika dotyczące słuchania. Przetwarzanie wykonywane przez platformę Spice uwzględnia wszystkie aspekty ważne dla użytkownika -aparaty słuchowe rozwijają się wraz z użytkownikiem. FlexControl, przełomowa innowacja stworzona dzięki przetwarzaniu Spice oferująca inteligentną interakcję z użytkownikiem, umożliwia regulację pod kątem większej wyrazistości i zwiększonego komfortu - zgodnie z intencjami użytkownika dotyczącymi słuchania. Wróćmy do miejskiej sali koncertowej - bileter słucha po to, aby zrozumieć mowę przy znacznym hałasie w tle, meloman - aby czerpać maksymalną przyjemność z muzyki, a główny oświetleniowiec szuka komfortu, aby w tej powodzi dźwięków skoncentrować się na swojej pracy. Prosta regulacja głośności służy użytkownikowi tylko do wyrażania intencji. System FlexControl dokonuje inteligentnej regulacji zarówno wzmocnienia (konfiguracja ubytku słuchu, żądana odpowiedź częstotliwościowa i poziomy głośności), jak i funkcji SoundCleaning (ustawienia kierunkowe, zarządzanie dźwiękami spowodowanymi przez wiatr, redukcja hałasu w tle i redukcja echa). Wyniki uzyskane podczas testów pokazują, że system FlexControl działa we wszystkich warunkach dźwiękowych znacznie lepiej w porównaniu z konwencjonalną regulacją głośności (Phonak AG, 2010)2. Uczenie się preferencji użytkownika polega na scaleniu precyzyjnej klasyfikacji dźwięków zapewnianej przez SoundFlow i dostosowaniu wielowymiarowych parametrów za pomocą systemu FlexControl. To połączenie interaktywnego sterowania i automatycznej adaptacji udostępnia użytkownikowi nowy niezrównany poziom sterowania aparatem słuchowym. i komfortu. Konieczność szybkiego i odpowiedniego reagowania na różne sytuacje oznacza, że systemy kompresji często stosują dwuścieżkową strategię kompresji, w której jedna ścieżka obsługuje powolnie, a druga szybko działającą kontrolę wzmocnienia. Jednak ścieżka szybkiego działania - z krótkimi stałymi czasowymi -może zamazywać fluktuacje amplitudowe oryginalnego sygnału, a ścieżka powolnego działania może zakłócić reagowanie na nagłe, niekomfortowo głośne dźwięki. W niektórych systemach konkurencyjnych używa się procesu, w którym obie ścieżki kompresji są kontrolowane bezpośrednio przez uśrednienie sygnału wejściowego w czasie. Ponieważ dookreślenia ustawień kompresji używa się średniej, nic nie będzie idealne. Powróćmy jeszcze raz do premiery w sali koncertowej i skupmy się na chwili rozpoczęcia przedstawienia. Światła przygasają, a rozmowy milkną. Kierowane przez oświetleniowca światło punktowe przeszywa ciemności, ukazując orkiestrę oczekującą na znak dyrygenta. Jedno poruszenie batuty i orkiestra eksploduje w idealnej harmonii zalewającej salę koncertową otwierającym akordem. W tym momencie oświetleniowiec jest narażony na nagły wybuch dźwięku. W tym scenariuszu system kontroli z uśrednianiem sygnału wejściowego w czasie najpierw zwiększy wzmocnienie, powodując znaczne przesterowanie przed zastosowaniem w końcu odpowiedniej kompresji, jak to pokazuje szara linia na rysunku 4. Przetwarzanie wykonywane przez platformę Spice umożliwia uniknięcie takich pułapek, które mogą wpłynąć na inne systemy, oddzielając wykrywanie poziomu wejściowego od obliczeń wzmocnienia widmowego. Dzięki obliczaniu tych parametrów setki razy w ciągu sekundy niezależnie w obu ścieżkach, sygnały widmowe są odtwarzane dokładniej i lepiej nadążają za stale zmieniającym się otoczeniem dźwiękowym. Odpowiedni poziom kompresji jest stosowany w sposób ciągły, przez co nie występuje przesterowanie wzmocnienia, jak to pokazuje zielona linia na rysunku 4. Oznacza to, że podczas premiery oświetleniowiec w sposób komfortowy odbiera wybuchy dźwięków na początku przedstawienia i nadal może koncentrować się na swojej pracy. Dwie ścieżki kompresji działające w harmonii Współczesne cyfrowe procesory sygnału stosowane w aparatach słuchowych zarządzają i sterują setkami parametrów. W wielu sytuacjach wpływają na siebie, co czasami daje niepożądane wyniki. Tym, co wyróżnia efektywny procesor sygnału, jest sztuka harmonizowania setek różnych parametrów, aby uniknąć powstawania artefaktów i wewnętrznych sygnałów zakłócających. Nawet w tak dobrze rozwiniętym obszarze przetwarzania sygnału, jakim jest kompresja, dokładność ma kapitalne znaczenie dla zapewnienia użytkownikowi największej wyrazistości lipiec 2010 3z5 Rysunek 4 - Regulacje wzmocnienia w czasie w odpowiedzi na gwałtowne zwiększenie intensywności sygnału. Ponadto ten unikalny adaptacyjny dwuścieżkowy system kompresji jest zintegrowany z automatyką SoundFlow - sterowanie wzmocnieniem zależy zarówno od czasu, jak i sytuacji. Odpowiednio do sytuacji automatycznie wybierane są stałe czasowe zapewniające najlepszą transmisję sygnału z najmniejszą liczbą zakłóceń. W ten sposób wykonywana jest natychmiastowa i płynna automatyczna regulacja: nawet najgwałtowniejsze zmiany w otoczeniu dźwiękowym są efektywnie obsługiwane bez zniekształceń i artefaktów. Kierunkowość pasją firmy Phonak Firma Phonak zawsze przodowała w technologii mikrofonów kierunkowych. Platforma Spice to kolejny olbrzymi skok do przodu w standardach branżowych, dzięki zastosowaniu dwóch pionierskich innowacji w dziedzinie kierunkowości. Kierunkowe tłumienie hałasu staje się przestrzenne Zazwyczaj - niezależnie od trybu, w jakim działa mikrofon algorytm wyciszania szumów jest zawsze stosowany w ten sam sposób w oparciu o chwilowe sygnały. Jednak w trybie kierunkowym źródło, z którego mają pochodzić dźwięki, jest określone, dlatego można zastosować nowe podejście: Ultra Zoom z funkcją SNRBoost jest kolejną rewolucją w technologii adaptacyjnej kierunkowości. SNR-Boost to przestrzenny system tłumienia szumów używany w połączeniu z systemem kierunkowym UltraZoom firmy Phonak. W przeciwieństwie do systemu tłumienia szumów opartego na tymczasowym wyciszaniu, NoiseBlock, skupia się ona na kierunku dochodzącego dźwięku, jak to pokazuje rys. 5. W odróżnieniu od większości systemów tłumienia funkcja ta dokładniej zachowuje dźwięki użyteczne i bardziej selektywnie redukuje szum dochodzący z tyłu. Dzieje się tak nawet wtedy, gdy ten szum zawiera mowę. Oczywiście SNRBoost także działa indywidualnie w różnych pasmach częstotliwości i stosuje redukcję wzmocnienia dostosowaną do warunków bieżącego sygnału dźwiękowego. Oba algorytmy, w połączeniu z funkcją NoiseBlock i dynamicznym aktywowaniem za pomocą SoundFlow, działają zgodnie i są dokładnie regulowane, aby maksymalnie wykorzystać ich indywidualne możliwości. Czy system słuchowy przewyższa parę aparatów słuchowych? Dzięki platformie Spice odpowiedź jest oczywista: tak. Po inteligentnym połączeniu korzyści płynących obuusznej kierunkowości z zaawansowanymi możliwościami bezprzewodowego oraz przekazywania szerokopasmowego sygnału audio w branży aparatów słuchowych powstała nowa, jakość. Jeden mikrofon wszechkierunkowy przechwytuje dźwięk ze wszystkich kierunków, a dodanie drugiego mikrofonu powoduje w pewnym stopniu powstanie kierunkowości. Teoria akustyki mówi, że im więcej dostępnych mikrofonów, tym większy poziom kierunkowości(Brandstein i Ward, 2001)3. Istnieje jednak problem z dodaniem kolejnych mikrofonów do aparatu słuchowego, ponieważ stałby się on większy. Inżynierowie w firmie Phonak stanęli, więc przed dylematem: jak dodać kolejny mikrofon bez powiększania rozmiarów aparatu. Inżynierowie w firmie Phonak są mistrzami myślenia poza schematami. Doprowadziło ich ono do wniosku, że kolejny mikrofon jest już dostępny dla użytkownika aparatów obuusznych - jest to aparat w drugim uchu. Nie tylko istnieją 2 dodatkowe mikrofony, ale relatywnie duża odległość między aparatami znacznie zwiększa kierunkowość dla niskich częstotliwości, jak to pokazano na rysunku 6. Rysunek 5 - Stosowane tradycyjnie mikrofony kierunkowe wzmacniają wszystkie dźwięki w ramach wiązki, zawierającej również niepożądane hałasy. UltraZoomz funkcją SNR-Boost efektywnie redukuje hałas, poprawiając współczynnik SNR dla mowy dochodzącej z przodu. NoiseBlock analizuje zmiany sygnału w funkcji czasu w wielu pasmach częstotliwości, ograniczając wzmocnienie dla różnych pasm przy każdym wykryciu szumu. Natomiast SNRBoost analizuje kierunek nadchodzenia dźwięków i jeśli zostanie wykryty użyteczny sygnał z przodu, redukowane jest wzmocnienie dźwięków dochodzących z tylnej półkuli. lipiec 2010 4z5 Rysunek 6 - Poszerzenie indeksu kierunkowości z funkcją StereoZoom. Ta konfiguracja wielomikrofonowa sama w sobie to jeszcze nie wszystko. Aby mikrofony kontralateralne miały swój wkład w kierunkowość, dla zintegrowanego przetwarzania musi być dostępny pełny sygnał audio z obu urządzeń. Na szczęście firma Phonak przewidziała to, wprowadzając taką możliwość w platformie poprzedniej generacji - CORE. Pozwoliło to zastosować funkcje obuuszne, takie jak ZoomControl i DuoPhone, w produktach CORE. Dzięki mocy przetwarzania platformy Spice funkcja StereoZoom zapewnia lepsze rozumienie mowy i redukuje poziom wysiłku związanego ze słuchaniem, co wykazano w próbach klinicznych (Phonak AG, 2010)4. StereoZoom jest klasycznym przykładem tego, że całość jest lepsza od sumy poszczególnych części. Podsumowanie Platforma Spice Generation firmy Phonak stanowi świadectwo tego, co jest możliwe przy całościowym podejściu do innowacyjności. Jedna z części tej platformy, układ Spice, harmonizuje działa niewielu funkcji przetwarzania sygnału, zapewniając użytkownikom niespotykane doświadczenia słuchowe. Ten artykuł z cyklu Phonak Insight prezentuje zaledwie przedsmak tego, co umożliwia platforma Spice. Literatura 1 Nyffeler M: Software seeks to provide seamless adaptation tochanging soundscapes. Hear J 2009:62(10):43-45 2 Phonak AG: FlexControl – Individualizing automatic performance. Field Study News Sept 2010 3 Brandstein M, and Ward D. 2001. Microphone Arrays – Signal Processing Techniques. Berlin: Springer-Verlag 4 Phonak AG: StereoZoom – Improvements with directional microphones. Field Study News Sept 2010 lipiec 2010 5z5