Phonak Insight_generacja Spice

Transkrypt

Phonak Insight_generacja Spice
Phonak Insight
Generacja Phonak Spice
Nowa generacja klasyfikacji dźwięku i układów kierunkowych
Wprowadzenie
Czy lepsze jest coś większego czy coś mniejszego? Oczywiście
nie istnieje jedna właściwa odpowiedź, ponieważ zależy ona
od wymiaru, do którego się odnosimy. Wymiarem, gdzie
większe jest oczywiście lepsze, jest moc przetwarzania
platformy Phonak - baza technologiczna stanowiąca
podstawę generacji aparatów słuchowych obejmująca układ
scalony, opcje przetwarzania sygnału, projektowanie
mechaniczne i oprogramowanie dopasowujące.
Nowa platforma Spice zapewnia dwukrotnie większą moc
przetwarzania w porównaniu do platformy CORE. Ta
dodatkowa moc daje się zauważyć już w pierwszej grupie
wprowadzonych aparatów słuchowych Spice i stanowi
platformę startową dla zaawansowanego przetwarzania
dźwięku i innowacyjnych aparatów słuchowych.
Czy mocy obliczeniowej może być za dużo?
Czy zdarzyło Ci się usłyszeć: dziękuję, ale procesor w moim
komputerze jest na prawdę wystarczająco szybki, zachowaj te
dodatkowe gigaherce dla siebie; mam również mnóstwo
pamięci, możesz więc włożyć tę dodatkową kartę pamięci do
szuflady. Możesz także zwrócić ten 100-gigabajtowy dysk
twardy do sklepu. Nikt nie mówi w ten sposób. Gdy
członkowie zespołu ds. rozwoju platformy Spice zaczęli szukać
sposobów zwiększenia możliwości dla użytkowników i osób
dopasowujących aparaty, inżynierowie Phonak ds. sprzętu
szybko odpowiedzieli specyfikacją nowej platformy
zapewniającej dwukrotnie większą moc przetwarzania niż
platforma CORE. Oparta na tym trwałym fundamencie
i wspólnej wizji intensywna współpraca całego zespołu
badawczo-rozwojowego
firmy
Phonak
zaowocowała
powstaniem nowej przełomowej platformy Spice. Często
najlepszym sposobem na docenienie nowego produktu jest
porównanie go z istniejącym punktem odniesienia. Na rysunku
1 przedstawiono ewolucję kluczowych wymiarów fizycznych
trzech ostatnich platform firmy Phonak. Liczba tranzystorów
rośnie z każdą generacją platformy, natomiast struktura
wykazuje trend malejący. Im więcej dostępnych tranzystorów,
lipiec 2010
1z5
tym większa ilość możliwego do wykonania przetwarzania. Im
mniejsza struktura, tym więcej komponentów można
pomieścić w układzie scalonym i tym mniejsze zużycie energii
przez ten układ dla takiego samego zadania.
Rysunek 1: Ewolucja kluczowych wymiarów fizycznych
Rysunek 2 przedstawia podobny obraz dla niektórych
kluczowych zagadnień przetwarzania. Prawie podwojenie
liczby milionów operacji na sekundę przy przejściu z platformy
CORE do Spice oznacza, że układ scalony nowej generacji
wykonuje dwa razy więcej zadań.
Rysunek 2 - Ewolucja kluczowych zagadnień przetwarzania
Aparaty słuchowe firmy Phonak naprawdę przodują w pełnym
wykorzystaniu możliwości podstawowych komponentów
platformy. W tym artykule z cyklu Phonak Insight omówiono
niektóre innowacje związane z przetwarzaniem sygnału, które
są teraz dostępne na platformie Spice dzięki podwojeniu mocy
przetwarzania.
Dokładna klasyfikacja otoczenia dźwiękowego
Wyobraźmy sobie przez chwilę premierę nowego
przedstawienia w sali koncertowej - w szczególności z punktu
widzenia trzech różnych osób z obsługi. Najpierw bileter,
wskazujący ludziom ich miejsca. Ma najwięcej pracy przez 10
minut przed wywołaniem aktorów przed kurtynę, ale zawsze
pojawią się spóźnialscy, którym należy wskazać miejsce przed
rozpoczęciem przedstawienia. Ważne jest, aby bileter dobrze
zrozumiał spóźnialskich, aby w jak najmniejszym stopniu
przeszkadzać publiczności, która już zajęła swoje miejsca.
Teraz wyobraźmy sobie drugą osobę -melomankę z biletami
okresowymi do tej sali koncertowej. Czerpie ogromną radość
z obecności na premierze i delektowania się pierwszym
dopiętym na ostatni guzik po tygodniach prób
przedstawieniem. Na końcu pomyślmy o trzeciej osobie
z obsługi- oświetleniowcu sali koncertowej, który musi dbać
o to, aby światło punktowe nieustannie oświetlało głównego
wokalistę. Znajduje się on bezpośrednio nad głośnikami i musi
zmagać się głośnym dźwiękiem, utrzymując dokładny kierunek
światła punktowego. To, co początkowo wydaje się być takim
samym otoczeniem dźwiękowym, jest zdecydowanie różne dla
każdej z tych osób, a ponadto każda osoba słucha w innym
celu. Przetwarzanie wykonywane przez platformę Spice
udostępnia
zaawansowaną
klasyfikację
dźwięków
i możliwości intuicyjnego uczenia się, aby dokładnie
dopasować się do intencji słuchającego użytkownika w jego
najbliższym otoczeniu dźwiękowym.
Czy dokładność to to samo, co precyzja?
Aparaty słuchowe generacji Phonak Spice korzystają
z niewyobrażalnych wcześniej możliwości przetwarzania.
Jedną z funkcji przetwarzania dźwięków przez platformę
Spice, która je wykorzystuje, jest klasyfikacja otoczenia
dźwiękowego za pomocą SoundFlow – automatyki dostępnej
w każdym aparacie słuchowym firmy Phonak (Nyffeler,
2009)1.Najnowocześniejsze aparaty słuchowe dobrze
klasyfikują podstawowe otoczenia dźwiękowe. Jednak poziom
szczegółowości czy też precyzji tej klasyfikacji jest
subtelniejszą sztuką.
SoundFlow generacji Phonak Spice najpierw analizuje 46
różnych cech przychodzącego sygnału, takich jak SNR,
poziomy niskich częstotliwości, strukturę widmową,
a następnie na ich podstawie przeprowadza klasyfikację.
Parametry te są analizowane, łączone i rzutowane na punkt
w przestrzennym modelu dźwięku obejmującym cztery strefy
lipiec 2010
2z5
otoczenia dźwiękowego - Cisza, Mowa w hałasie, Hałas
i Muzyka, jak to pokazano na rys. 3.
Jeśli punkt znajduje się w jednej ze sfer otoczenia
dźwiękowego, przyjmuje się, że w 100% jest on powiązany
z tym otoczeniem dźwiękowym, i ten program podstawowy
używany jest dla tego otoczenia. Jeśli punkt nie znajduje się w
żadnej z tych sfer, powiązanie z otoczeniem dźwiękowym jest
obliczane za pomocą zasady przyciągania. Ta metoda
zapewnia naturalne odwzorowanie otoczenia dźwiękowego
na przestrzenny model dźwięku, zapewniając dokładniejszą,
niezawodną i szybszą klasyfikację dochodzącego dźwięku.
Rysunek 3 - Wysokiej klasy, wielowymiarowy system klasyfikacji dźwięku
używany w systemie SoundFlow do zapewnienia precyzyjnego działania
automatycznego.
Jakby dotychczasowe obliczenia nie były wystarczająco
złożone, klasyfikator otoczenia SoundFlow bierze teraz pod
uwagę przestrzenne różnice w dźwięku. Oznacza to, że
klasyfikator uwzględnia stronę, w którą użytkownik zwrócony
jest twarzą. W naszej sali koncertowej odgłosy mowy
pochodzące od nieliczących się z innymi osób siedzących za
melomanką są traktowane, jako hałas w tle i nie powodują
przejścia do klasyfikacji Mowa w hałasie.
Ta dokładna klasyfikacja jest nieprzerwanie przeprowadzana
w czasie rzeczywistym, umożliwiając automatyce SoundFlow
błyskawiczne utworzenie optymalnego programu mieszanego
na podstawie wielu programów podstawowych. Ponadto
przejścia między tymi programami mieszanymi są tak płynne,
że są niedostrzegalne dla użytkownika.
Aparaty słuchowe są już w pełni rozwinięte
Precyzyjna klasyfikacja otoczenia dźwiękowego w czasie
rzeczywistym robi wielkie wrażenie, ale aby była naprawdę
użyteczna, należy także uwzględnić preferencje użytkownika
dotyczące słuchania. Przetwarzanie wykonywane przez
platformę Spice uwzględnia wszystkie aspekty ważne dla
użytkownika -aparaty słuchowe rozwijają się wraz
z użytkownikiem.
FlexControl, przełomowa innowacja stworzona dzięki
przetwarzaniu Spice oferująca inteligentną interakcję
z użytkownikiem, umożliwia regulację pod kątem większej
wyrazistości i zwiększonego komfortu - zgodnie z intencjami
użytkownika dotyczącymi słuchania. Wróćmy do miejskiej sali
koncertowej - bileter słucha po to, aby zrozumieć mowę przy
znacznym hałasie w tle, meloman - aby czerpać maksymalną
przyjemność z muzyki, a główny oświetleniowiec szuka
komfortu, aby w tej powodzi dźwięków skoncentrować się na
swojej pracy.
Prosta regulacja głośności służy użytkownikowi tylko do
wyrażania intencji. System FlexControl dokonuje inteligentnej
regulacji zarówno wzmocnienia (konfiguracja ubytku słuchu,
żądana odpowiedź częstotliwościowa i poziomy głośności), jak
i funkcji SoundCleaning (ustawienia kierunkowe, zarządzanie
dźwiękami spowodowanymi przez wiatr, redukcja hałasu w tle
i redukcja echa). Wyniki uzyskane podczas testów pokazują,
że system FlexControl działa we wszystkich warunkach
dźwiękowych znacznie lepiej w porównaniu z konwencjonalną
regulacją głośności (Phonak AG, 2010)2.
Uczenie się preferencji użytkownika polega na scaleniu
precyzyjnej klasyfikacji dźwięków zapewnianej przez
SoundFlow i dostosowaniu wielowymiarowych parametrów za
pomocą systemu FlexControl. To połączenie interaktywnego
sterowania
i
automatycznej
adaptacji
udostępnia
użytkownikowi nowy niezrównany poziom sterowania
aparatem słuchowym.
i komfortu. Konieczność szybkiego i odpowiedniego
reagowania na różne sytuacje oznacza, że systemy kompresji
często stosują dwuścieżkową strategię kompresji, w której
jedna ścieżka obsługuje powolnie, a druga szybko działającą
kontrolę wzmocnienia. Jednak ścieżka szybkiego działania
- z krótkimi stałymi czasowymi -może zamazywać fluktuacje
amplitudowe oryginalnego sygnału, a ścieżka powolnego
działania może zakłócić reagowanie na nagłe, niekomfortowo
głośne dźwięki.
W niektórych systemach konkurencyjnych używa się procesu,
w którym obie ścieżki kompresji są kontrolowane
bezpośrednio przez uśrednienie sygnału wejściowego
w czasie. Ponieważ dookreślenia ustawień kompresji używa
się średniej, nic nie będzie idealne. Powróćmy jeszcze raz do
premiery w sali koncertowej i skupmy się na chwili
rozpoczęcia przedstawienia. Światła przygasają, a rozmowy
milkną. Kierowane przez oświetleniowca światło punktowe
przeszywa ciemności, ukazując orkiestrę oczekującą na znak
dyrygenta. Jedno poruszenie batuty i orkiestra eksploduje
w idealnej harmonii zalewającej salę koncertową
otwierającym akordem. W tym momencie oświetleniowiec jest
narażony na nagły wybuch dźwięku. W tym scenariuszu
system kontroli z uśrednianiem sygnału wejściowego w czasie
najpierw zwiększy wzmocnienie, powodując znaczne
przesterowanie przed zastosowaniem w końcu odpowiedniej
kompresji, jak to pokazuje szara linia na rysunku 4.
Przetwarzanie wykonywane przez platformę Spice umożliwia
uniknięcie takich pułapek, które mogą wpłynąć na inne
systemy, oddzielając wykrywanie poziomu wejściowego od
obliczeń wzmocnienia widmowego. Dzięki obliczaniu tych
parametrów setki razy w ciągu sekundy niezależnie w obu
ścieżkach, sygnały widmowe są odtwarzane dokładniej i lepiej
nadążają za stale zmieniającym się otoczeniem dźwiękowym.
Odpowiedni poziom kompresji jest stosowany w sposób ciągły,
przez co nie występuje przesterowanie wzmocnienia, jak to
pokazuje zielona linia na rysunku 4. Oznacza to, że podczas
premiery oświetleniowiec w sposób komfortowy odbiera
wybuchy dźwięków na początku przedstawienia i nadal może
koncentrować się na swojej pracy.
Dwie ścieżki kompresji działające w harmonii
Współczesne cyfrowe procesory sygnału stosowane
w aparatach słuchowych zarządzają i sterują setkami
parametrów. W wielu sytuacjach wpływają na siebie, co
czasami daje niepożądane wyniki. Tym, co wyróżnia efektywny
procesor sygnału, jest sztuka harmonizowania setek różnych
parametrów, aby uniknąć powstawania artefaktów
i wewnętrznych sygnałów zakłócających. Nawet w tak dobrze
rozwiniętym obszarze przetwarzania sygnału, jakim jest
kompresja, dokładność ma kapitalne znaczenie dla
zapewnienia
użytkownikowi
największej
wyrazistości
lipiec 2010
3z5
Rysunek 4 - Regulacje wzmocnienia w czasie w odpowiedzi na gwałtowne
zwiększenie intensywności sygnału.
Ponadto ten unikalny adaptacyjny dwuścieżkowy system
kompresji jest zintegrowany z automatyką SoundFlow -
sterowanie wzmocnieniem zależy zarówno od czasu, jak
i sytuacji. Odpowiednio do sytuacji automatycznie wybierane
są stałe czasowe zapewniające najlepszą transmisję sygnału
z najmniejszą liczbą zakłóceń. W ten sposób wykonywana jest
natychmiastowa i płynna automatyczna regulacja: nawet
najgwałtowniejsze zmiany w otoczeniu dźwiękowym są
efektywnie obsługiwane bez zniekształceń i artefaktów.
Kierunkowość pasją firmy Phonak
Firma Phonak zawsze przodowała w technologii mikrofonów
kierunkowych. Platforma Spice to kolejny olbrzymi skok do
przodu w standardach branżowych, dzięki zastosowaniu
dwóch pionierskich innowacji w dziedzinie kierunkowości.
Kierunkowe tłumienie hałasu staje się przestrzenne
Zazwyczaj - niezależnie od trybu, w jakim działa mikrofon algorytm wyciszania szumów jest zawsze stosowany w ten
sam sposób w oparciu o chwilowe sygnały. Jednak w trybie
kierunkowym źródło, z którego mają pochodzić dźwięki, jest
określone, dlatego można zastosować nowe podejście: Ultra
Zoom z funkcją SNRBoost jest kolejną rewolucją
w technologii adaptacyjnej kierunkowości.
SNR-Boost to przestrzenny system tłumienia szumów
używany w połączeniu z systemem kierunkowym UltraZoom
firmy Phonak. W przeciwieństwie do systemu tłumienia
szumów opartego na tymczasowym wyciszaniu, NoiseBlock,
skupia się ona na kierunku dochodzącego dźwięku, jak to
pokazuje rys. 5.
W odróżnieniu od większości systemów tłumienia funkcja ta
dokładniej zachowuje dźwięki użyteczne i bardziej
selektywnie redukuje szum dochodzący z tyłu. Dzieje się tak
nawet wtedy, gdy ten szum zawiera mowę. Oczywiście SNRBoost także działa indywidualnie w różnych pasmach
częstotliwości i stosuje redukcję wzmocnienia dostosowaną
do warunków bieżącego sygnału dźwiękowego. Oba
algorytmy, w połączeniu z funkcją NoiseBlock i dynamicznym
aktywowaniem za pomocą SoundFlow, działają zgodnie i są
dokładnie regulowane, aby maksymalnie wykorzystać ich
indywidualne możliwości.
Czy system słuchowy przewyższa parę aparatów
słuchowych?
Dzięki platformie Spice odpowiedź jest oczywista: tak. Po
inteligentnym połączeniu korzyści płynących obuusznej
kierunkowości
z
zaawansowanymi
możliwościami
bezprzewodowego oraz przekazywania szerokopasmowego
sygnału audio w branży aparatów słuchowych powstała nowa,
jakość.
Jeden mikrofon wszechkierunkowy przechwytuje dźwięk ze
wszystkich kierunków, a dodanie drugiego mikrofonu
powoduje w pewnym stopniu powstanie kierunkowości. Teoria
akustyki mówi, że im więcej dostępnych mikrofonów, tym
większy poziom kierunkowości(Brandstein i Ward, 2001)3.
Istnieje jednak problem z dodaniem kolejnych mikrofonów do
aparatu słuchowego, ponieważ stałby się on większy.
Inżynierowie w firmie Phonak stanęli, więc przed dylematem:
jak dodać kolejny mikrofon bez powiększania rozmiarów
aparatu. Inżynierowie w firmie Phonak są mistrzami myślenia
poza schematami. Doprowadziło ich ono do wniosku, że
kolejny mikrofon jest już dostępny dla użytkownika aparatów
obuusznych - jest to aparat w drugim uchu. Nie tylko istnieją
2 dodatkowe mikrofony, ale relatywnie duża odległość między
aparatami znacznie zwiększa kierunkowość dla niskich
częstotliwości, jak to pokazano na rysunku 6.
Rysunek 5 - Stosowane tradycyjnie mikrofony kierunkowe wzmacniają
wszystkie dźwięki w ramach wiązki, zawierającej również niepożądane hałasy.
UltraZoomz funkcją SNR-Boost efektywnie redukuje hałas, poprawiając
współczynnik SNR dla mowy dochodzącej z przodu.
NoiseBlock analizuje zmiany sygnału w funkcji czasu w wielu
pasmach częstotliwości, ograniczając wzmocnienie dla
różnych pasm przy każdym wykryciu szumu. Natomiast
SNRBoost analizuje kierunek nadchodzenia dźwięków i jeśli
zostanie wykryty użyteczny sygnał z przodu, redukowane jest
wzmocnienie dźwięków dochodzących z tylnej półkuli.
lipiec 2010
4z5
Rysunek 6 - Poszerzenie indeksu kierunkowości z funkcją StereoZoom.
Ta konfiguracja wielomikrofonowa sama w sobie to jeszcze
nie wszystko. Aby mikrofony kontralateralne miały swój wkład
w kierunkowość, dla zintegrowanego przetwarzania musi być
dostępny pełny sygnał audio z obu urządzeń. Na szczęście
firma Phonak przewidziała to, wprowadzając taką możliwość
w platformie poprzedniej generacji - CORE. Pozwoliło to
zastosować funkcje obuuszne, takie jak ZoomControl
i DuoPhone, w produktach CORE. Dzięki mocy przetwarzania
platformy Spice funkcja StereoZoom zapewnia lepsze
rozumienie mowy i redukuje poziom wysiłku związanego ze
słuchaniem, co wykazano w próbach klinicznych (Phonak AG,
2010)4. StereoZoom jest klasycznym przykładem tego, że
całość jest lepsza od sumy poszczególnych części.
Podsumowanie
Platforma Spice Generation firmy Phonak stanowi świadectwo
tego, co jest możliwe przy całościowym podejściu do
innowacyjności. Jedna z części tej platformy, układ Spice,
harmonizuje działa niewielu funkcji przetwarzania sygnału,
zapewniając użytkownikom niespotykane doświadczenia
słuchowe. Ten artykuł z cyklu Phonak Insight prezentuje
zaledwie przedsmak tego, co umożliwia platforma Spice.
Literatura
1 Nyffeler M: Software seeks to provide seamless adaptation
tochanging soundscapes. Hear J 2009:62(10):43-45 2 Phonak
AG: FlexControl – Individualizing automatic performance.
Field Study News Sept 2010 3 Brandstein M, and Ward D.
2001. Microphone Arrays – Signal Processing Techniques.
Berlin: Springer-Verlag 4 Phonak AG: StereoZoom –
Improvements with directional microphones. Field Study News
Sept 2010
lipiec 2010
5z5