Audiologieboek
Home  |   NVA  |   Print deze pagina  |    |     
 Titel: 9.2.9(2). Waarom 'snelle' compressie?
 Auteur: Bas Franck, Rolph Houden, Koen Rhebergen, Vera Prijs en Pieter Lamoré
 Revisie: juli 2017

Inhoud:

9.2.9.1(2). Inleiding

9.2.9.2(2). (1) - Overwegingen bij de toepassing van compressie in hoortoestellen

9.2.9.3(2). (2) - Verschil tussen 'snelle' en 'langzame compressie' in de temporele structuur van het spraaksignaal

9.2.9.4(2). (3) - Welke snelle fluctuatie in het spraaksignaal zijn voor de compensatie van recruitment van belang?

9.2.9.5(2). (4) - Gevolgen van snelle compressie voor het spraakverstaan door slechthorenden

9.2.9.6(2). Conclusies

9.2.9.7(2). Links/literatuur


 

9.2.9.1(2). Inleiding

Doel van dit hoofdstuk is inzicht te geven in de aannames die een rol spelen bij de keuze voor 'snelle' compressie in hoortoestellen en te beschrijven welke verbeteringen deze techniek oplevert voor slechthorenden. We bespreken dit onderwerp door een vergelijking te maken tussen enkele eigenschappen van enerzijds 'langzame' en anderzijds 'snelle' compressie. Het hoofdstuk biedt m.b.t. dit onderwerp geen volledigheid, maar is vooral bedoeld een bijdrage te leveren aan de meningsvorming in dit verband.


Algemene benamingen voor compressie in hoortoestellen zijn 'dynamic range compression' en ‘amplitude compressie’. Het zijn bewerkingen waarbij het dynamisch bereik van een signaal wordt verkleind. Een voorbeeld hiervan is het inpassen van het spraaksignaal in het beperkte dynamisch bereik van het gehoor van een slechthorende. Dit kan bereikt worden door in het hoortoestel de zachte passages 'normaal' te versterken, maar de harde (luide) gedeelten (veel) minder. In Fig.4 en Fig.5 van Hfdst. 9.2.8 is deze bewerking geschematiseerd weergegeven. De bewerking van het spraaksignaal kan ‘langzaam’ en ‘snel’ uitgevoerd worden. Voor de vergelijking van de twee snelheden bij de uit te voeren berekeningen kiezen we de volgende release - en attacktijden (voor de definities van release - en attacktijden zie weer Hfdst.9.2.8):


Release tijd (RT) Attack tijd (AT)
Langzame compressie 1500 ms 3 ms
Snelle compressie 15 ms 3 ms

Tabel I. Keuze van release - en attacktijden. De tijden zijn ontleend aan waarden die in de praktijk gebruikt worden en die naar verwachting - in het kader van dit hoofdstuk - verschillen tussen snelle en langzame compressie voldoende duidelijke kunnen maken.


We bespreken het onderwerp aan de hand van vier vragen/punten:


  1. Welke overwegingen spelen een rol bij de toepassing van enerzijds langzame en anderzijds snelle compressie?

  2. Hoe is het verschil tussen langzame compressie en snelle compressie zichtbaar (als illustratie) in de temporele en spectrale structuur van het spraaksignaal?

  3. Welke (snelle) fluctuaties in het spraaksignaal zijn voor de compensatie van recruitment van belang?

  4. Wat zijn uiteindelijk de effecten van toepassing van enerzijds langzame en anderzijds snelle compressie in hoortoestellen op het spraakverstaan door slechthorenden?

 


9.2.9.2(2). (1) - Overwegingen bij de toepassing van compressie in hoortoestellen

Compressie in hoortoestellen wordt toegepast om spraak op een comfortabel geluidsniveau aan te bieden, zonder dat alle afzonderlijke klanken hoorbaar hoeven te zijn. Het is bijv. niet gewenst wanneer, als gevolg van de traagheid van de compressieschakeling, plotseling optredende harde geluiden als onaangenaam hard worden waargenomen. Een belangrijk doel bij een hoortoestelaanpassing is de verbetering van het spraakverstaan. Wanneer dit doel bereikt wordt zonder compressie (lineaire versterking of partiële inpassing van het signaal in het beperkte dynamisch bereik van het gehoor) dan is deze situatie te prefereren. Wel toegepast, hoeft deze bewerking niet noodzakelijkerwijs snelwerkend te zijn. De bewerking is niet specifiek gericht op de verbetering van de herkenning van afzonderlijke fonemen.


De herkenning van afzonderlijke syllaben en fonemen staat juist wel centraal in de toepassing van snelle compressie ('syllabische' of 'fonemische' compressie). Bij een binnenoorslechthorendheid is de comprimerende versterking in de buitenste haarcellen verloren gegaan. Dit heeft tot gevolg dat voor een signaal waarvan de geluidssterkte toeneemt, de luidheid voor slechthorenden veel snellere toeneemt dan voor normaalhorenden. Dit is de definitie van recruitment. Fig.1 geeft dit gestileerd weer. De aanpassing van de luidheid is een momentaan proces.


Fig.1. Toename van de luidheid van een geluid als functie van het geluidsniveau voor normaalhorende luisteraars en voor perceptief slechthorenden (met een drempelverschuiving 40 dB).


Bij fluctuerende geluiden zoals spraak zijn, als gevolg van recruitment, de normale variaties in luidheid verstoord. De zachte gedeelten worden minder luid, terwijl de harde even luid blijven. Dit heeft gevolgen voor het verstaan van die spraak. De afname van het spraakverstaan treedt het eerst en vooral op voor de syllaben en fonemen, omdat die gecodeerd worden in de snellere fluctuaties in het spraaksignaal. Met de toepassing van snelle compressie nu, ook wel fonemische of syllabische compressie genoemd, wordt beoogd het amplitudeverloop binnen deze snellere fluctuaties aan te passen zodat de zachte gedeelten luider worden en de harde even luid blijven.


Tabel I geeft een overzicht van de twee situaties en de verwachte effecten. De effecten zijn bij snelle compressie vooral aanwezig bij toepassing van meerdere kanalen. De RT- en AT waarden zijn in het kader van de vergelijking van de twee condities, indicatieve keuzes. De keuze van het aantal kanalen en de CR in de verschillende condities zijn soms - gezien vanuit de toepassing in hoortoestellen - wat onrealistisch, maar hier bedoeld om de effecten duidelijk te maken. Een probleem, om de beoogde effecten experimenteel duidelijk te maken, wordt gevormd door het grote aantal parameters dat een rol speelt.


Type compressie Langzame compressie
(RT = 1500 ms, AT = 3 ms)
Snelle compressie
(RT = 15 ms, AT = 3 ms)
Naam 'Automatic Gain Control' (AGC) Syllabische / fonemische compressie
Effect op het signaal Behoud temporele contrasten Vermindering temporele contrasten
Verondersteld resultaat Minder vervorming
Spraak aanbieden op een comfortabel volumeniveau zonder dat alle afzonderlijke klanken hoorbaar hoeven te zijn
Spraakverstaan?
Meer vervorming
Hoorbaarheid vergroten van alle spraakklanken
Spraakverstaan?
Werkelijke resultaten Zie verder

Tabel II. Kenmerken van de effecten van langzame en snelle compressie in hoortoestellen.

 


9.2.9.3(2). (2) - Verschil tussen 'snelle' en 'langzame compressie' in de temporele structuur van het spraaksignaal

Om het effect van compressie op lopende spraak te visualiseren wordt vaak gebruik gemaakt van afbeeldingen van de amplitude van het spraaksignaal als functie van de tijd. Bij een geschikte schaalverdeling van de tijd as ziet men dan de omhullende van het signaal en kan men daarin tot op zekere hoogte onderscheid maken tussen bijv. de hoogfrequente en laagfrequente bestanddelen en anderzijds, tussen de zwakke en sterke gedeelten. Fig.2 geeft, uitgaande van het oorspronkelijke signaal in de afbeelding links boven, in drie afbeeldingen het effect weer van een geleidelijk sneller wordende compressie op een spraaksignaal. Het is duidelijk dat, met de toename van de snelheid van de compressie, de contrasten in de temporele patronen geleidelijk kleiner worden. Dit komt omdat de zwakke gedeelten van het signaal in de opeenvolgende plaatjes geleidelijk meer versterkt worden dan de sterke.


Fig.2. Effect van een geleidelijk kleiner wordende releasetijd op de temporele structuur van een spraaksignaal, bij een 16-kanaals compressiesysteem met een (forse) CR van 8:1. De afbeelding links boven toont het originele signaal. In de drie afbeeldingen mét compressie is de attacktijd 3 ms. Afbeelding ontleend aan Holube et al., 2016.


Deze effecten zijn ook zichtbaar in Fig.11 van Hfdst. 9.2.8. De reductie van temporele contrasten is uiteraard ook noodzakelijk om het signaal in te passen in het gereduceerde dynamisch bereik van het gehoor van de slechthorende, maar voor dat doel is snelle compressie niet vereist.


De aanpassing van de contrasten in het spraaksignaal bij compressie is op een andere manier geïllustreerd in Fig.3.


Fig.3. Links (3a): Omhullende van het spraaksignaal 'press' (onbewerkt). Midden (3b): Omhullende na toepassing van snelle compressie. Rechts (3c): Omhullende na extra versterking van de hogere frequenties in het signaal. Het amplitude contrast tussen de relatief laagfrequente klinker /e/ en de hoogfrequente medeklinker /s/ is, vergeleken met het onbewerkte signaal, bij zowel bij de snelle compressie als bij de extra versterking van de hoge frequenties verminderd, maar het contrast tussen de laagfrequente klinker /e/ en de laagfrequente medeklinkers /p/ en /r/ wordt bij de extra versterking van de hogere frequenties niet beïnvloed. Ontleend aan Villchur, 2008.


De linker afbeelding is het amplitudeverloop van het woord 'press'. Dat bestaat uit de laagfrequente element /p/ en /r/, een relatief laagfrequente klinker /e/ en een hoogfrequent medeklinker /s/. De snelle compressie (in Fig.3b) heeft als resultaat, net zoals in Fig.2, dat de zwakke elementen /p/ en /r/ meer worden versterkt dan de relatief sterke elementen (in dit geval de klinker). Van de andere kant uit geredeneerd: Fig.3b laat ook zien dat de klinker /e/ (met relatief meer energie) minder wordt versterkt.


Bij snelle compressie (en toepassing van meerdere kanalen) ziet men dat het contrast tussen de lagere en hogere frequenties kleiner wordt. De hogere frequenties worden enigszins bevoordeeld, net zoals bij extra versterking van de hogere frequenties. Dit gebeurt ook in de modelberekeningen aan het eind van dit stuk. We komen er daar op terug.

 


9.2.9.4(2). (3) - Welke snelle fluctuatie in het spraaksignaal zijn voor de compensatie van recruitment van belang?

Om duidelijk te maken hoe snel het amplitudeverloop van deze snelle fluctuaties is, dus welke eisen er gesteld moeten worden aan de 'snelheid' van de compressie, wordt gebruik gemaakt van Fig.4. Dit is een weergave van het spectrum van de omhullende van lopende spraak gemeten in vijf frequentiebanden van het spraaksignaal. De figuur laat zien dat de fluctuaties (in dit verband meestal 'modulaties' genoemd) in de syllaben en fonemen (waar het hier om gaat) zich bevinden in het modulatie-frequentiegebied 5 - 10 Hz. Dit zijn voor een compressieschakeling in een hoortoestel relatief hoge (snelle) waarden.


Fig.4. Spectrum van de omhullende van lopende spraak in 5 frequentiebanden, zoals aangegeven. Plomp, 1983.


Snelle compressie nu is bedoeld om in een opeenvolgende reeks frequentiebanden een reductie tot stand te brengen in de signaalpieken die horen bij de syllaben en fonemen (modulatiefrequenties 5-10 Hz). Zo wordt geprobeerd te compenseren voor het expanderende effect (t.g.v. het ontbreken van compressie in het beschadigde oor) van recruitment op die klanken. De vermindering van de temporele contrasten in het spraaksignaal bij snelle compressie en toepassing van meerdere kanalen kan echter een probleem opleveren omdat slechthorenden die fluctuaties wel nodig hebben om spraak te verstaan. In de 80-er jaren van de vorige eeuw is er over dit onderwerp een uitgebreide discussie geweest geïnstigeerd door Plomp(1983, 1994). Uiteindelijk is geconcludeerd dat het allemaal wel meevalt, zolang de compressiesnelheid en het aantal kanalen niet te groot zijn. Zie ook Fig.5. Het extra versterken van de hoge frequenties in het spraaksignaal leidt overigens ook tot een vermindering van de temporele contrasten. Hier wordt verwezen naar het proefschrift van Goedegebure (2005).


In de hierna volgende Fig.5 wordt aan de hand van een modelberekening (Rhebergen) het effect van een 'langzame' (RT = 1500 ms - linker blok) en een 'snelle' compressie (RT = 15 ms - rechter blok) op de het spectrum van de omhullende van lopende spraak uit Fig.4 duidelijk gemaakt. De CR heeft in alle gevallen de waarde 3.


Fig.5. Vergelijking van het effect van langzame compressie (linker blok) en snelle compressie (rechter blok) op de het spectrum van de omhullende van een spraaksignaal (de Plompzinnen). Voor verdere toelichting zie tekst. Figuren ontleend aan Rhebergen, p.c. 2017.


De bovenste figuren in de twee blokken zijn dezelfde en vergelijkbaar met Fig.4. Ze betreffen het onbewerkte spectrum van de omhullende ('modulation spectrum') van lopende spraak. De twee figuren daar direct onder laten zien wat het effect op het omhullende-spectrum is wanneer in de vijf aangegeven frequentiebanden compressie wordt toegepast, links langzame compressie en rechts snelle compressie. In het onderste tweetal figuren is de effectieve CR voor de betreffende condities en frequentiebanden weergegeven. Wanneer, zoals in het linker blok, voor bepaalde frequentiebanden compressie geen effect heeft is de effectieve CR gelijk aan 1. Over het geheel genomen is de snelle compressie dus veel effectiever dan de langzame.


De snelle compressie laat, net zoals hiervoor in Fig.3, ook enige frequentieafhankelijkheid zien. De compressie is voor de hogere signaalfrequenties groter dan voor de lagere signaalfrequenties. Het is niet duidelijk waardoor dit effect veroorzaakt wordt. Het is effectief een ‘hoogfrequent’ filter dus. Het is ook niet in overeenstemming met wat verwacht. Omdat er bij spraak meer vermogen in de lage geluidfrequenties zit, is vaak de compressie daar het grootst. Daar is dan ook meer verschil tussen snelle en langzame compressie te verwachten.

 


9.2.9.5(2). (4) - Gevolgen van snelle compressie voor het spraakverstaan door slechthorenden

Welke verbetering is er via de vele vormen van compressie nu bereikt? In dit intermezzo over compressie volgen we het artikel van Moore uit 2008 ('The Choice of Compression Speed in Hearing Aids: Theoretical and Practical Considerations and the Role of Individual Differences'. Brian C. J. Moore, PhD, FMedSci, FRS. Trends Amplif. 2008 Spring; 12(2): 103–112 (10.1177/1084713808317819). Hierin wordt puntsgewijs voor zowel langzame als snelle compressiesystemen aangegeven wat de voor- en nadelen zijn. We vermelden telkens de drie belangrijkste punten uit die vier lijsten. Het zal opvallen dat het spraakverstaan als zodanig niet vermeld wordt. Het gaat hoofdzakelijk om algemene kenmerken en factoren die er invloed op hebben. Het valt buiten het bestek van dit hoofdstuk 9.2.9 op het hiervoor genoemde artikel van Moore commentaar te leveren.


Langzame compressiesystemen- voordelen

  • Het spraaksignaal kan, d.m.v. een geschikte keuze van een CR, aangeboden worden op een niveau van aangename luidheid

  • De temporele omhullende van het spraaksignaal verandert nauwelijks

  • Er treden geen snelle veranderingen in de spectrale patronen van de geluiden op.


Langzame compressiesystemen- nadelen

  • De beoordeling van de sterkte van geluidsbronnen (waarneming van luidheid) blijft moeilijk; dit heeft consequenties voor de interpretatie van gelijktijdig aanwezige omgevingsgeluiden

  • Met de langzame systemen heeft men moeite met het volgen van twee sprekers die op variërende sterktes spreken; daarbij komt dat slechthorenden, in tegenstelling tot normaalhorenden, niet goed gebruik kunnen maken van de pauzes in het spreken van de tweede persoon (‘listening in the dips)

  • Bij overgangen van een situatie met veel achtergrondgeluiden naar een stille ruimte koste het enkele seconden voor de systemen zich aangepast hebben.


Snelle compressiesystemen- voordelen

  • De luidheidsperceptie is tot op zekere hoogte verbeterd, maar voor modulatiefrequenties groter dan ongeveer 10 Hz treedt niet voldoende reductie van de modulatiediepte op om de recruitment te corrigeren; dit heeft overigens geen consequenties voor de beoordeling van de overall sterkte van de spraak

  • Bij toepassing van meerdere kanalen kan snelle compressie – beter dan langzame compressie - compenseren voor frequentieafhankelijke veranderingen in de mate van recruitment

  • Snelle compressie kan het ‘listening in the dips’ (zie hiervoor) verbeteren; het verbetert ook het detecteren van zwakke medeklinkers na sterke klinkers.


Snelle compressiesystemen- nadelen

  • Er kunnen oneigenlijke veranderingen optreden in de vorm van de temporele omhullende van het spraaksignaal; deze zijn overigens te reduceren.

  • Er kunnen ook oneigenlijke veranderingen optreden in de amplitudes van geluiden waarin de frequenties verlopen zoals formanten met ‘verglijdingen’. Dit gebeurt vooral bij systemen waarin de verschillende kanalen scherp afgebakend zijn en de glijdende formanten een kanaalgrens passeren.

  • Contrasten in intensiteit (de diepte van de fluctuaties ) worden kleiner, vooral bij hoge CR’s; zolang echter de modulatie diepte niet meer dan een factor 2 wordt verkleind is er geen probleem.


Samenvattend kunnen we zeggen dat geen van de twee besproken compressiesystemen er ‘uit springt’, ondanks dat er in beide gevallen een plausibele motivering aan ten grondslag ligt. Elk heeft dus zowel voor- als nadelen. Daarbij is het goed ons te realiseren dat de luistersituaties waarin compressie wordt toegepast enorm uiteenlopen.

 


9.2.9.6(2). Conclusies

 

  • Snelle compressie doet - technisch gezien - tot op zekere hoogte wat het belooft, althans wanneer het aantal kanalen niet te groot is

  • Het grote aantal - niet onafhankelijke - parameters (instelmogelijkheden) maakt het moeilijk de effecten te voorspellen

  • De resultaten in de praktijk hangen sterk af van het grote aantal verschillende luistersituaties.

 


9.2.9.7(2). Links/literatuur

 

  1. Proefschrift Goedegebuure: Phoneme Compression - Processing of the Speech Signal and Effects on Speech Intelligibility in Hearing-Impaired Listeners (2005 - zeer uitgebreid en grondig; staat op Internet)
  2. Kates, JM. Understanding compression: Modeling the effects of dynamic-range compression in hearing aids. International Journal of Audiology, 2010;49:395-409.
  3. Francis K. Kuk, Ph.D. Trends Amplif. 1996 Mar; 1(1): 5–39. Theoretical and Practical Considerations in Compression Hearing Aids. doi:10.1177/108471389600100102PMCID: PMC4172289
  4. http://www.indiana.edu/~pacoust/ShenandLentz2010.pdf (Shen and Lentz, 2010
  5. http://www.hearingreview.com/2012/03/hearing-aids-for-severe-to-profound-losses-business-as-usual/ Kuk et al.
  6. http://www.hearingreview.com/2008/06/compression-in-hearing-aids-why-fast-multichannel-processing-systems-work-well/(Villchur)
  7. http://www.hearingreview.com/2016/01/multi-channel-compression-concepts-early-timeless-results/Multi-channel Compression: Concepts and (Early but Timeless) Results. Published on January 20, 2016 February 2016 Hearing Review. 'Less can be more in the application of compression, time constants, and channels'. By Inga Holube, PhD, Volkmar Hamacher, PhD, and Mead C. Killion, PhD
  8. http://en.wikiaudio.org/Dynamic_range_compression
  9. http://www.audiologyonline.com/articles/selecting-the-right-compression-18120 (Kuk)


© NVA leerboek 2000-2017 Privacy | Disclaimer | Copyright | Statistieken | Webredactie