9.2.9.1(2). Inleiding
Doel van dit hoofdstuk is inzicht te geven in de aannames die een rol spelen bij de keuze voor ‘snelle’ compressie in hoortoestellen en te beschrijven welke verbeteringen deze techniek oplevert voor slechthorenden. We bespreken dit onderwerp door een vergelijking te maken tussen enkele eigenschappen van enerzijds ‘langzame’ en anderzijds ‘snelle’ compressie. Het voorliggende hoofdstuk is vooral bedoeld om bij te dragen aan een beter begrip van deze technieken.
Algemene benamingen voor compressie in hoortoestellen zijn ‘dynamic range compression’ en ‘amplitude compressie’. Het zijn bewerkingen waarbij het dynamisch bereik van een signaal wordt verkleind. Een voorbeeld hiervan is het inpassen van het spraaksignaal in het beperkte dynamisch bereik van het gehoor van een slechthorende. Dit kan bereikt worden door in het hoortoestel de zachte passages ‘normaal’ te versterken, maar de harde (luide) gedeelten (veel) minder. In Fig.4 en Fig.5 van Hfdst. 9.2.8 is deze bewerking schematisch weergegeven.
In een systeem met compressie treden de veranderingen in de versterking, onder invloed van de veranderingen in de grootte van het inputsignaal, niet momentaan op, maar gelden bepaalde regeltijden. In de compressie zoals toegepast in hoortoestellen wordt onderscheid gemaakt tussen vergrotingen en verkleiningen van het ingangssigaal. Er geldt een attacktijd aan het begin van een toename van de input en een releasetijd wanneer de amplitude van het ingangssignaal afneemt. Het amplitudeverloop van deze twee tijden is geïllustreerd in Fig.7 van Hfdst. 9.2.8.
Attacktijd en releasetijd hebben, bij toepassing in hoortoestellen, een verschillende invloed op de klank van het geluid. Een relatief kleine attacktijd zorgt ervoor dat het geluid niet langdurig te hard is en zorgt er ook voor dat het systeem kan reageren op korte impulsgeluiden. Een grote attacktijd is onwenselijk, omdat er dan een te trage reactie op harde geluiden optreedt. Een grote releasetijd daarentegen maakt het compressiesysteem rustig en dat is wat veel mensen fijn vinden.
Het ligt dus voor de hand voor langzame en snelle compressie te vergelijken aan de hand van verschillen in de releasetijd. De attacktijd moet altijd kort zijn en dat is in de praktijk ook altijd het geval. Voor de vergelijking kiezen we de volgende release- en attacktijden:
Release tijd (RT) | Attack tijd (AT) | |
Langzame compressie | 1500 ms | 3 ms |
Snelle compressie | 15 ms | 3 ms |
Tabel I. Keuze van release – en attacktijden. De tijden zijn ontleend aan waarden die in de praktijk gebruikt worden en die naar verwachting – in het kader van dit hoofdstuk – verschillen tussen snelle en langzame compressie voldoende duidelijke kunnen maken.
We bespreken het onderwerp aan de hand van vier vragen/punten:
- Welke overwegingen spelen een rol bij toepassing van enerzijds langzame en anderzijds snelle compressie?
- Hoe is het verschil tussen langzame compressie en snelle compressie zichtbaar (als illustratie) in de temporele en spectrale structuur van het spraaksignaal?
- Welke (snelle) fluctuaties in het spraaksignaal zijn voor de compensatie van recruitment van belang?
- Wat zijn uiteindelijk de effecten van toepassing van enerzijds langzame en anderzijds snelle compressie in hoortoestellen op het spraakverstaan door slechthorenden?
9.2.9.2(2). Overwegingen bij de toepassing van compressie in hoortoestellen
De belangrijkste doelstelling bij de toepassing van compressie in hoortoestellen is het spraaksignaal in te passen in het beperkte dynamisch bereik van het gehoor, teneinde te bereiken dat deze spraak op een comfortabel luidheidsniveau gehoord wordt. Een compressieschakeling kan bijv. voorkomen dat plotseling optredende harde geluiden als onaangenaam hard worden waargenomen. Bij deze bewerking is het niet noodzakelijk dat de afzonderlijke spraakklanken herkenbaar zijn. Ook hoeft deze bewerking niet noodzakelijkerwijs snelwerkend te zijn. Comfort is hier hoofddoel. Wanneer dit doel bereikt wordt zonder compressie (lineaire versterking of partiële inpassing van het signaal in het beperkte dynamisch bereik van het gehoor) is deze situatie te prefereren.
De herkenning van afzonderlijke syllaben en fonemen staat juist wel centraal in de toepassing van snelle compressie (‘syllabische’ of ‘fonemische’ compressie – zie voor de attack- en releasetijden Tabel I in de vorige paragraaf). Bij een binnenoorslechthorendheid is de comprimerende versterking in de buitenste haarcellen verloren gegaan. Dit heeft tot gevolg dat voor een signaal waarvan de geluidssterkte toeneemt, de luidheid voor slechthorenden veel snellere toeneemt dan voor normaalhorenden. Dit is de definitie van recruitment. Fig.1 geeft dit gestileerd weer. De aanpassing van de luidheid door het binnenoor is een momentaan (zeer snel) proces.
Bij fluctuerende geluiden zoals spraak zijn, als gevolg van recruitment, de normale variaties in luidheid verstoord. De zachte gedeelten worden minder luid, terwijl de harde even luid blijven. Dit heeft gevolgen voor het verstaan van die spraak. De afname van het spraakverstaan treedt het eerst en vooral op voor de syllaben en fonemen, omdat die gecodeerd worden in de snellere fluctuaties in het spraaksignaal. Met de toepassing van snelle compressie nu, ook wel fonemische of syllabische compressie genoemd, wordt beoogd het amplitudeverloop binnen deze snellere fluctuaties aan te passen zodat de zachte gedeelten (vooral de zachte medeklinkers) luider worden en de harde even luid blijven.
Tabel I geeft een overzicht van de twee situaties en de verwachte effecten. De effecten zijn bij snelle compressie vooral aanwezig bij toepassing van meerdere kanalen. De RT- en AT waarden zijn in het kader van de vergelijking van de twee condities, indicatieve keuzes. De keuze van het aantal kanalen en de CR in de verschillende condities zijn soms – gezien vanuit de toepassing in hoortoestellen – wat onrealistisch, maar hier bedoeld om de effecten duidelijk te maken. Een probleem, om de beoogde effecten experimenteel duidelijk te maken, wordt gevormd door het grote aantal parameters dat een rol speelt.
Type compressie | Langzame compressie (RT = 1500 ms, AT = 3 ms) |
Snelle compressie (RT = 15 ms, AT = 3 ms) |
Naam | ‘Automatic Gain Control’ (AGC) | Syllabische / fonemische compressie |
Effect op het signaal | Behoud temporele contrasten | Vermindering temporele contrasten |
Verondersteld resultaat | Minder vervorming Aanbieding spraak op een comfortabel volumeniveau zonder dat alle afzonderlijke klanken hoorbaar hoeven te zijn Spraakverstaan? |
Meer vervorming Hoorbaarheid vergroten van alle spraakklanken Spraakverstaan? |
Werkelijke resultaten | Zie verder |
Tabel II. Kenmerken van de effecten van langzame en snelle compressie in hoortoestellen.
9.2.9.3(2). Verschil tussen ‘snelle’ en ‘langzame compressie’ in de temporele structuur van het spraaksignaal
Om het effect van compressie op lopende spraak te visualiseren wordt vaak gebruik gemaakt van afbeeldingen van de amplitude van het spraaksignaal als functie van de tijd. Bij een geschikte schaalverdeling van de tijdas ziet men dan de omhullende van het signaal en kan men daarin tot op zekere hoogte onderscheid maken tussen bijv. de hoogfrequente en laagfrequente bestanddelen en anderzijds, tussen de zwakke en sterke gedeelten. Fig.2. geeft, uitgaande van het oorspronkelijke signaal in de afbeelding links boven, in drie afbeeldingen het effect weer van een geleidelijk sneller wordende compressie op een spraaksignaal. Het is duidelijk dat, met de toename van de snelheid van de compressie, de contrasten in de temporele patronen geleidelijk kleiner worden. Dit komt omdat de zwakke gedeelten van het signaal in de opeenvolgende plaatjes geleidelijk meer versterkt worden dan de sterke.
Deze effecten zijn ook zichtbaar in Fig.11 van Hfdst. 9.2.8. De reductie van temporele contrasten is uiteraard ook noodzakelijk om het signaal in te passen in het gereduceerde dynamisch bereik van het gehoor van de slechthorende, maar voor dat doel is snelle compressie niet vereist (althans zolang het rest-dynamisch bereik nog groot genoeg is en er geen grote snel optredende pieken in het ingangssignaal zitten).
De aanpassing van de contrasten in het spraaksignaal bij compressie is op een andere manier geïllustreerd in Fig.3.

Fig.3. Links (3a): Omhullende van het spraaksignaal ‘press’ (onbewerkt). Midden (3b): Omhullende na toepassing van snelle compressie. Rechts (3c): Omhullende na extra versterking van de hogere frequenties in het signaal. Het amplitude contrast tussen de relatief laagfrequente klinker /e/ en de hoogfrequente medeklinker /s/ is, vergeleken met het onbewerkte signaal, zowel bij de snelle compressie als bij de extra versterking van de hoge frequenties verminderd, maar het contrast tussen de laagfrequente klinker /e/ en de laagfrequente medeklinkers /p/ and /r/ wordt bij de extra versterking van de hogere frequenties niet beïnvloed.
De linker afbeelding is het amplitudeverloop van het woord ‘press’. Dat bestaat uit de laagfrequente element /p/ en /r/, een relatief laagfrequente klinker /e/ en een hoogfrequent medeklinker /s/. De snelle compressie (in Fig.3b) heeft als resultaat, net zoals in Fig.2, dat de zwakke elementen /p/ en /r/ meer worden versterkt dan de relatief sterke elementen (in dit geval de klinker). Van de andere kant uit geredeneerd: Fig.3b laat ook zien dat de klinker /e/ (met relatief meer energie) minder wordt versterkt.
Bij snelle compressie (en toepassing van meerdere kanalen) ziet men dat het contrast tussen de lagere en hogere frequenties kleiner wordt. De hogere frequenties worden enigszins bevoordeeld, net zoals bij extra versterking van de hogere frequenties. Dit gebeurt ook in de modelberekeningen aan het eind van dit stuk. We komen er daar op terug.
9.2.9.4(2). (3) – Welke snelle fluctuaties in het spraaksignaal zijn voor de compensatie van recruitment van belang?
Om duidelijk te maken hoe snel het amplitudeverloop van deze snelle fluctuaties is, dus welke eisen er gesteld moeten worden aan de ‘snelheid’ van de compressie, wordt gebruik gemaakt van Fig.4. . Dit is een weergave van het spectrum van de omhullende van lopende spraak gemeten in vijf frequentiebanden van het spraaksignaal. De figuur laat zien dat de fluctuaties (in dit verband meestal ‘modulaties’ genoemd) in de syllaben en fonemen (waar het hier om gaat) zich bevinden in het modulatie-frequentiegebied 5 – 10 Hz. Dit zijn voor een compressieschakeling in een hoortoestel relatief hoge (snelle) waarden.
Snelle compressie nu is bedoeld om in een opeenvolgende reeks frequentiebanden een reductie tot stand te brengen in de modulaties die horen bij de syllaben en fonemen (modulatiefrequenties 5-10 Hz). Zo wordt geprobeerd te compenseren voor het expanderende effect (t.g.v. het ontbreken van compressie in het beschadigde oor) van recruitment op die klanken. De vermindering van de temporele contrasten in het spraaksignaal bij snelle compressie en toepassing van meerdere kanalen kan echter een probleem opleveren omdat slechthorenden die fluctuaties wel nodig hebben om spraak te verstaan. In de 80-er jaren van de vorige eeuw is er over dit onderwerp een uitgebreide discussie geweest geïnstigeerd door Plomp(1983, 1994) . Uiteindelijk is geconcludeerd dat het allemaal wel meevalt, zolang de compressiesnelheid en het aantal kanalen niet te groot zijn . Zie ook Fig.5. Het extra versterken van de hoge frequenties in het spraaksignaal leidt overigens ook tot een vermindering van de temporele contrasten. Hier wordt verwezen naar het proefschrift van Goedegebure (2005).
In de hierna volgende Fig.5. wordt aan de hand van een modelberekening (Rhebergen) het effect van een ‘langzame’ (RT = 1500 ms – linker blok) en een ‘snelle’ compressie (RT = 15 ms – rechter blok) op de het spectrum van de omhullende van lopende spraak uit Fig.4 duidelijk gemaakt. De CR heeft in alle gevallen de waarde 3.
De bovenste figuren in de twee blokken zijn dezelfde en vergelijkbaar met Fig.4. Ze betreffen het onbewerkte spectrum van de omhullende (‘modulation spectrum’) van lopende spraak. De twee figuren daar direct onder laten zien wat het effect op het omhullende-spectrum is wanneer in de vijf aangegeven frequentiebanden compressie wordt toegepast, links langzame compressie en rechts snelle compressie. In het onderste tweetal figuren is de effectieve CR voor de betreffende condities en frequentiebanden weergegeven. Wanneer, zoals in het linker blok, voor bepaalde frequentiebanden compressie geen effect heeft is de effectieve CR gelijk aan 1. Over het geheel genomen is de snelle compressie dus veel effectiever dan de langzame.
De snelle compressie laat, net zoals hiervoor in Fig.3, ook enige frequentieafhankelijkheid zien. De compressie is voor de hogere signaalfrequenties groter dan voor de lagere signaalfrequenties. Het is niet duidelijk waardoor dit effect veroorzaakt wordt. Het is effectief een ‘hoogfrequent’ filter. Het is ook niet in overeenstemming met wat verwacht mag worden. Omdat er bij spraak meer vermogen in de lage geluidfrequenties zit, is vaak de compressie daar het grootst. Daar is dan ook meer verschil tussen snelle en langzame compressie te verwachten.
9.2.9.5(2). (4) – Gevolgen van snelle compressie voor het spraakverstaan door slechthorenden
Welke verbetering is er via de vele vormen van compressie nu bereikt? In dit intermezzo over compressie volgen we het artikel van Moore uit 2008 (‘The Choice of Compression Speed in Hearing Aids: Theoretical and Practical Considerations and the Role of Individual Differences’. Brian C. J. Moore, PhD, FMedSci, FRS. Trends Amplif.2008 Spring; 12(2): 103–112 (10.1177/1084713808317819). Hierin wordt puntsgewijs voor zowel langzame als snelle compressiesystemen aangegeven wat de voor- en nadelen zijn. We vermelden telkens de drie belangrijkste punten uit die vier lijsten. Het zal opvallen dat het spraakverstaan als zodanig niet vermeld wordt. Het gaat hoofdzakelijk om algemene kenmerken en factoren die er invloed op hebben. Het valt buiten het bestek van dit hoofdstuk 9.2.9 op het hiervoor genoemde artikel van Moore commentaar te leveren.
- Het spraaksignaal kan, d.m.v. een geschikte keuze van een CR, aangeboden worden op een niveau van aangename luidheid
- De temporele omhullende van het spraaksignaal verandert nauwelijks
- Er treden geen snelle veranderingen in de spectrale patronen van de geluiden op.
- De beoordeling van de sterkte van geluidsbronnen (waarneming van luidheid) blijft moeilijk; dit heeft consequenties voor de interpretatie van gelijktijdig aanwezige omgevingsgeluiden
- Met de langzame systemen heeft men moeite met het volgen van twee sprekers die op variërende sterktes spreken; daarbij komt dat slechthorenden, in tegenstelling tot normaalhorenden, niet goed gebruik kunnen maken van de pauzes in het spreken van de tweede persoon (‘listening in the dips’)
- Bij overgangen van een situatie met veel achtergrondgeluiden naar een stille ruimte kost het enkele seconden voor deze langzame systemen zich aangepast hebben.
- De luidheidsperceptie is tot op zekere hoogte verbeterd, maar voor modulatiefrequenties groter dan ongeveer 10 Hz treedt niet voldoende reductie van de modulatiediepte op om de recruitment te corrigeren; dit heeft overigens geen consequenties voor de beoordeling van de overall sterkte van de spraak
- Bij toepassing van meerdere kanalen kan snelle compressie – beter dan langzame compressie – compenseren voor frequentieafhankelijke veranderingen in de mate van recruitment
- Snelle compressie kan het ‘listening in the dips’ (zie hiervoor) verbeteren; het verbetert ook het detecteren van zwakke medeklinkers na sterke klinkers.
- Er kunnen oneigenlijke veranderingen optreden in de vorm van de temporele omhullende van het spraaksignaal; deze zijn overigens te reduceren.
- Er kunnen ook oneigenlijke veranderingen optreden in de amplitudes van geluiden waarin de frequenties verlopen zoals formanten met ‘verglijdingen’. Dit gebeurt vooral bij systemen waarin de verschillende kanalen scherp afgebakend zijn en de glijdende formanten een kanaalgrens passeren.
- Contrasten in intensiteit (de diepte van de fluctuaties ) worden kleiner, vooral bij hoge CR’s; zolang echter de modulatie diepte niet meer dan een factor 2 wordt verkleind is er geen probleem.
Samenvattend kunnen we zeggen dat geen van de twee besproken compressiesystemen er ‘uit springt’, ondanks dat er in beide gevallen een plausibele motivering aan ten grondslag ligt. Elk heeft dus zowel voor- als nadelen. Daarbij is het goed ons te realiseren dat de luistersituaties waarin compressie wordt toegepast enorm uiteenlopen.
9.2.9.6(2). Conclusies
- Snelle compressie doet – technisch gezien – tot op zekere hoogte wat het belooft, althans wanneer het aantal kanalen niet te groot is (verbetering van het ‘listening in the dips’ en verbetering van het detecteren van zwakke medeklinkers na sterke klinkers).
- Het grote aantal – niet onafhankelijke – parameters (instelmogelijkheden) maakt het moeilijk de effecten te voorspellen
- De resultaten in de praktijk hangen sterk af van het grote aantal verschillende luistersituaties.
9.2.9.7(2). Links/literatuur
- Plomp R. The Role of Modulation in Hearing. In: HEARING – Physiological Bases and Psychophysics, pp 270-276, Klinke R., Hartmann R. Eds, Springer Verlag, 1983.
- Proefschrift Goedegebuure: Phoneme Compression – Processing of the Speech Signal and Effects on Speech Intelligibility in Hearing-Impaired Listeners (2005 – zeer uitgebreid en grondig; staat op Internet)
- Kates, JM. Understanding compression: Modeling the effects of dynamic-range compression in hearing aids. International Journal of Audiology, 2010;49:395-409.
- Francis K. Kuk, Ph.D. Trends Amplif. 1996 Mar; 1(1): 5–39. Theoretical and Practical Considerations in Compression Hearing Aids. doi:10.1177/108471389600100102 PMCID: PMC4172289
- http://www.indiana.edu/~pacoust/ShenandLentz2010.pdf (Shen and Lentz, 2010
- http://www.hearingreview.com/2012/03/hearing-aids-for-severe-to-profound-losses-business-as-usual/ Kuk et al.
- http://www.hearingreview.com/2008/06/compression-in-hearing-aids-why-fast-multichannel-processing-systems-work-well/ (Villchur)
- http://www.hearingreview.com/2016/01/multi-channel-compression-concepts-early-timeless-results/Multi-channel Compression: Concepts and (Early but Timeless) Results. Published on January 20, 2016 February 2016 Hearing Review. ‘ Less can be more in the application of compression, time constants, and channels’. By Inga Holube, PhD, Volkmar Hamacher, PhD, and Mead C. Killion, PhD
- http://en.wikiaudio.org/Dynamic_range_compression
- http://www.audiologyonline.com/articles/selecting-the-right-compression-18120 (Kuk)
Auteurs
Bas Franck, Rolph Houben, Koen Rhebergen, Vera Prijs en Pieter Lamoré
Revisie
15 augustus 2017