Audiologieboek
Home  |   NVA  |   Print deze pagina  |    |     
 Titel: 9.2.8(2). Compressie van cochlea tot hoortoestel
 Auteur: Houben
 Revisie: 2016

Dit hoofdstuk is gebaseerd op het inleidende hoofdstuk van het proefschrift van Rolph Houben, Universiteit Utrecht, 2006)

Inhoud:

9.2.8.1(2). Inleiding

9.2.8.2(2). Informatieoverdracht in de cochlea en in de gehoorzenuw

9.2.8.3(2). De mogelijkheden van geluidsversterking c.q. geluidsbewerking

9.2.8.4(2). Toepassing van compressie in hoortoestellen

9.2.8.5(2). Compressiesystemen in hoortoestellen (en BCD's)

9.2.8.6(2). Conclusies

9.2.8.7(2). Links


 

9.2.8.1(2). Inleiding

Compressie is een belangrijke techniek in moderne hoortoestellen. Om te beginnen bestuderen we compressie zoals die plaats vindt in een normaal functionerende cochlea. Vervolgens wordt het effect van gehoorverlies op de signaalverwerking behandeld en tenslotte komen we uit bij de toepassing van compressie in hoortoestellen.


 


9.2.8.2(2). Informatieoverdracht in de cochlea

De mechanische trilling van het basilaire membraan (BM) heeft een zodanige niet-lineaire eigenschap dat deze in het verleden aangemerkt is als een essentiële niet-lineariteit (Goldstein). Niet-lineariteiten in het algemeen treden op bij oversturing van systemen, bijvoorbeeld bij hoge (geluid)niveaus. De essentiële niet-lineariteit van de trilling van het basilaire membraan treedt echter op bij heel zwakke ingangssignalen en wordt bewerkstelligd door een actief proces in de buitenste haarcellen (outer hair cells of OHC's). Het is een comprimerende niet-lineariteit. Fig.1 verduidelijkt de niet-lineaire karakteristiek van de beweging van het BM. De figuur geeft de in- output functie voor de trilling van het BM schematisch weer voor een stimulusfrequentie waarvoor de gemeten locatie maximaal gevoelig is (de CF of karakteristieke frequentie).


Fig.1. Schematische weergave van de in- output functie van de trilling van het BM voor een stimulusfrequentie waarvoor de gemeten locatie maximaal gevoelig is. Figuur gebaseerd op een beroemd in vivo experiment uitgevoerd door Ruggero en Rich (1991). Weergegeven is de snelheid van het trillende BM als functie van het ingangsgeluidsniveau. De hier weergegeven curven gelden voor chinchilla’s.


Uitgezet staat de snelheid van de beweging van het BM (in μm/s) als functie van de sterkte van de geluidsstimulus (in dB SPL). Het lijnstuk rechts heeft een helling die overeenkomt met een lineaire toename van deze snelheid (20 dB geeft een factor 10 toename).We zien twee belangrijke fenomenen, afhankelijk van het functioneren van de OHC's. Wanneer de OHC's normaal functioneren, is de trilling van het BM, voor lage intensiteiten, groter dan bij niet-functionerende OHC's (de gestreepte lijn). Dit wordt ook wel het effect van de cochleaire versterker genoemd. Hierdoor is de hoordrempel met normaal functionerende buitenste haarcellen lager dan wanneer de haarcellen uitgevallen zijn.


Het tweede fenomeen, bij normaal functionerende OHC's, is dat de versterking van de trilling afneemt naarmate de stimulussterkte toeneemt: er treedt compressie op over een range van ongeveer 60 dB. Dit betekent een vergroting van het dynamisch bereik van de signaaloverdracht. Wanneer de OHC's uitgeschakeld zijn is er een lineaire toename in de BM beweging (de streepjeslijn in Fig. 1). Dan is er geen versterking bij de drempel en treedt er een gehoorverlies op.


De effecten van een goed werkende cochleaire versterker zijn dus een verlaging (verbetering) van de gehoordrempel en een vergroting van het dynamisch bereik van de signaaloverdracht. Aangezien de grootte van de cochleaire versterking maximaal is voor de CF en voor frequenties daar vandaan afneemt gaat dit samen met een toename in de frequentieselectiviteit. Bovendien zorgt de toename in de cochleaire versterking bij lagere intensiteiten voor een toename van het tijdoplossend vermogen. Hieronder worden de eerder genoemde effecten van de cochleaire versterker uitgewerkt.


  • De vergroting van het dynamisch bereik wordt bepaald door de verlaging van de drempel (Fig. 1.). Bij de mens bedraagt die vergroting 50 tot 60 dB.


  • De toename van de frequentieselectiviteit wordt toegelicht aan de hand van Fig.2. Zoals gezegd is de cochleaire versterking maximaal rond de beste frequentie (10 kHz hier), waar de gevoeligheid voor het inkomende geluid het grootst is.De ingangssignalen met frequenties in dat gebied worden meer versterkt dan naburige frequenties en vergroten dus het contrast daarmee, met als resultaat een toename van de frequentieselectiviteit. Wanneer de cochleaire versterker niet (meer) functioneert door cochleair gehoorverlies, neemt niet alleen de gehoorgevoeligheid af, maar ook het contrast tussen de karakteristieke frequentie en de omliggende regio. Met het verdwijnen van de compressieve niet-lineariteit verslechtert de frequentieselectiviteit. Ook verschuift het punt van maximale gevoeligheid iets naar lagere frequenties. De vorm van het gevoeligheidspatroon verandert dus bij cochleaire gehoorschade.

    Fig.2. Gevoeligheid (verplaatsing per Pa geluidsdruk van de stimulus) van de BM responsies als functie van de frequentie. De verschillende curven zijn iso-intensiteitscurven. De gevoeligheid is dus het grootst rond de karakteristieke frequentie.


  • Het tijdoplossend vermogen van een fysiologisch systeem geeft informatie over het gescheiden kunnen detecteren van afzonderlijke signalen, zoals geluidsimpulsen. De toename van het tijdoplossend (‘temporeel contrast’) bij een maskeersignaal en een testsignaal bij functionerende OHC’s is geïllustreerd in Fig.3.


    Fig.3. Schematische weergave van de werking van de compressieve niet-lineariteit bij 'temporal masking'. De linker afbeelding is de situatie zonder compressie, dus wanneer het systeem lineair is. Rechts is compressie aanwezig; de voorwaartse invloed van de maskeerder is door de snelle compressieve versterker zo snel uitgedoofd dat het testsignaal - bij dezelfde tijd na het eind van de maskeerder - bij een lager geluidsniveau detecteerbaar is.


De compressie zorgt ook voor andere, niet-lineaire, fenomenen zoals twee-toon suppressie en otoakoestische emissies (OAEs). Disfunctie van OHC’s geeft een verstoorde werking van de cochleaire versterker, met als gevolg een vermindering van het dynamisch bereik van de signaaloverdracht, een afname van de compressie en daarmee een afname van de niet-lineaire effecten zoals OAE's, een afname van de frequentieresolutie en een afname van het temporeel oplossend vermogen. Ook kunnen in de gehoorzenuw de normale activatiepatronen gewijzigd zijn. Herstel is (nog) niet medisch mogelijk.


Zoals genoemd levert een maximale disfunctie van OHC's een drempelverschuiving van 50 tot 60 dB. Gehoorverlies waarbij de OHC’s zijn beschadigd komt relatief vaak voor, omdat de OHC's kwetsbaar zijn. OHC schade treedt bijvoorbeeld op bij ouderdomsslechthorendheid (zie Hfdst.7.2.6, niveau 3), na blootstelling aan te hard geluid, oplosmiddelen, en bepaalde medicatie. Externe versterking, bijvoorbeeld door middel van een hoortoestel, kan wel de gehoordrempel herstellen maar niet de frequentieselectiviteit.

 


9.2.8.3(2). De mogelijkheden van geluidsversterking en geluidsbewerking

Dynamisch bereik

Bij een normaal gehoor is de cochleaire versterking het grootst voor lage geluidsniveaus. Bij toename van de geluidsniveaus neemt de versterking af. Bij cochleaire verliezen, wanneer de OHC's niet functioneren, worden zachte geluiden, die normaal wel hoorbaar zijn, onhoorbaar, maar blijven harde geluiden even luid klinken. Het resultaat is een verkleind dynamisch bereik, zoals schematisch weergegeven in Fig.4


Fig.4. Schematische weergave van het verkleinde dynamisch bereik (DR) van het gehoor als gevolg van een cochleair gehoorverlies (uitval van OHC's). Terwijl de gehoordrempel verhoogd is blijft het niveau van onaangename luidheid (UCL) onveranderd.


De combinatie van een verhoogde drempel en normale UCL's betekent dat een geluid dat vanaf de (verhoogde) drempel harder gemaakt wordt meer dan normaal in luidheid toeneemt. Deze abnormaalgrotetoename van de luidheid heet 'recruitment'. Een mogelijke (deel)oplossing van dit hoorprobleem is het inbouwen in hoortoestellen van een compressieve versterking. Een compressieve versterker is een versterker die zachte geluiden het meest versterkt en harde geluiden het minst, zoals geïllustreerd in Fig.5. Het principe is dat het aangeboden (spraak)signaal afgebeeld wordt in het resterend dynamisch bereik van het aangedane gehoor.


Fig.5. Principe van compressieve versterking.


Frequentieselectiviteit

Een normale cochleaire versterking gaat gepaard met een hoge frequentieselectiviteit rond de karakteristieke frequentie (Fig.2). Bij beschadiging van de OHC's neemt deze frequentieselectiviteit af en verdwijnen de scherpe pieken in het frequentiespectrum. De maxima verschuiven enigszins naar lagere frequenties. Modelberekeningen (Lijzenga, 2002) laten zien dat deze afname van frequentieselectiviteit niet of slechts beperkt d.m.v. signaalbewerking in hoortoestellen te compenseren is. Het modelwerk suggereert dat dit komt doordat het bewerkte geluid uiteindelijk altijd door de beschadigde, minder gevoelige, cochlea moet worden gedetecteerd. Vergroting van de spectrale contrasten in het spraakgeluid levert daardoor slechts kleine verbeteringen.


Tijdoplossend vermogen

Als de cochlea een lineair resonerend systeem zou zijn zou een verkleining van de frequentieselectiviteit, zoals plaatsvindt bij uitval van de OHC's, leiden tot een vergroting van het tijdoplossend vermogen. Maar de cochlea is geen lineair resonerend systeem en in het vorige hoofdstuk hebben we gezien dat de comprimerende eigenschap van de cochleaire versterker het tijdsoplossend vermogen vergroot. Omgekeerd zal bij het afnemen van genoemde compressie het tijdoplossend vermogen afnemen. Dit gebeurt echter niet. We gaan hier niet verder op in.


Samenvattend

De mogelijkheden overziende is in geval van cochleaire slechthorendheid een verbetering van het gehoor d.m.v. akoestische versterking (hoortoestellen) optimaal te realiseren wanneer er een intensiteitsafhankelijke compressie wordt toegepast. Daarmee wordt, net zoals bij de intacte OHC's, het dynamisch bereik van het ingangsgeluid vergroot om het verkleinde dynamisch hoorbereik van de aangetaste cochlea zo goed mogelijk te benutten. Helaas kunnen hiermee niet andere voordelen van de cochleaire versterker zoals vergroting van de frequentie selectiviteit hersteld worden. Verschillende mogelijkheden en toepassingen van akoestische compressie worden hierna besproken.

 


9.2.8.4(2). Toepassing van compressie in hoortoestellen

Een compressiesysteem in hoortoestellen is een versterker met een hoge versterking voor zachte geluiden en een lage versterking voor harde geluiden. Een mogelijk doel van zo'n compressiesysteem is dat de zachte geluiden net hoorbaar gemaakt worden en de harde geluiden net onder de UCL blijven. Er spelen verschillende instelbare parameters een rol, zoals compressie ratio, tijdconstanten en aantal frequentiekanalen. Die parameters worden eerst besproken.


Compressie ratio

De compressie ratio (CR) is gedefinieerd als de verandering van het input-geluidsniveau gedeeld door de verandering van het output-geluidsniveau, dus ΔLin/ ΔLout. Zie Fig.6. De CR is dus de reciproke waarde van de afgeleide van de output-input curve. Er is compressie als de CR groter dan 1 is. Compressie treedt pas op boven de compressiedrempel. De compressiedrempel ligt in Fig.6. bij een ingangsniveau van 50 dB SPL.


Fig.6. Input-output curve van een compressiesysteem. De compressie ratio (CR) is gedefinieerd als de verandering van het input geluidsniveau gedeeld door de verandering van het output geluidsniveau, dus als ΔLin/ΔLout.


De mate van compressie (en daarmee de grootte van de versterking) bepaalt de grootte van de omhullende van het ingangssignaal. De omhullende geeft de veranderingen in volume van een geluidssignaal weer. De fijnstructuur blijft onaangetast, zie Fig. 7.


Tijdconstanten

Een compressiesysteem heeft een bepaalde tijd nodig om op veranderingen in de grootte van het inputsignaal te reageren. De tijdconstanten die daarbij een rol spelen zijn de attacktijd en de releasetijd. De definities worden geïllustreerd in Fig.7.


Fig.7. Dynamische eigenschappen van compressie. Het bovenste paneel toont een sinusvormig signaal gemoduleerd met een blokgolf. Toepassing van compressie leidt tot veranderingen in de omhullende terwijl de fijnstructuur hetzelfde blijft (het sinusvormige signaal). Het resultaat daarvan is weergegeven in het onderste paneel. Ta = attacktijd; Tr = release tijd.


De attacktijd is de tijd die het systeem nodig heeft om zich aan te passen aan de plotselinge toename van de geluidssterkte. Dit gaat gepaard met een ‘overshoot’, waarbij de versterking even te groot is omdat het systeem tijd nodig heeft om te reageren op het nieuwe, hardere, geluid. De releasetijd is de tijd die nodig is voor aanpassing aan een plotselinge afname van de sterkte van het geluid. De versterking is dan even te klein (‘undershoot’). Attack- en releasetijd kunnen onafhankelijk van elkaar worden ingesteld. De definities van de tijdconstanten worden besproken in Niveau 3 van dit hoofdstuk.


Aantal compressiekanalen

Compressie kan toegepast worden op het akoestische signaal als geheel (éénkanaals- of breedbandcompressie), maar ook op een reeks opeenvolgende frequentiebanden, met instellingen die voor elke band verschillend zijn (meerkanaalscompressie). De principes van deze twee systemen zijn schematisch weergegeven in Fig.8.


Fig.8. Principes van éénkanaalscompressie (boven) en meerkanaalscompressie (onder).


Het type compressie (éénkanaals- vs. meerkanaals-) heeft verschillende gevolgen voor zowel de spectrale contrasten in het spraaksignaal als voor de temporele interacties. We bespreken eerst de consequenties voor het spectrale contrast.


  • Spectraal contrast

    Bij éénkanaalscompressie (breedbandcompressie) wordt de compressie toegepast op het (spraak)signaal als geheel. Dat heeft tot gevolg dat de spectrale contrasten gelijk blijven (Fig.9, midden). Bij meerkanaalscompressie daarentegen vindt de compressie in elk kanaal afzonderlijk plaats, met instellingen die voor elk kanaal anders zijn. Wanneer de uitgangen van de kanalen daarna worden samengevoegd geeft dit een verkleining van de spectrale contrasten (Fig.9, rechts). Dit laatste geldt overigens alleen wanneer de componenten ver genoeg van elkaar liggen zodat ze in verschillende kanalen vallen.


    Fig.9. Voorbeeld van afname van spectraal contrast bij meerkanaalscompressie. De verschillende panelen laten de relatieve niveaus van twee formanten F1 en F2 zien. Het input signaal is te zien in het linker paneel. Het middelste paneel geeft de output na éénkanaalscompressie. In dit geval is het spectrale contrast (ΔLs) gelijk aan het spectrale contrast van het inputsignaal (ΔLi). Het rechter paneel is de situatie voor meerkanaalscompressie. In dit geval is ΔLs kleiner dan ΔLi.


    Het behoud van de spectrale contrasten bij éénkanaalscompressie is een groot voordeel, maar het kan zijn dat dit ten koste gaat van de benodigde versterking voor de hogere frequentiecomponenten. In een spraaksignaal zijn de laagfrequente componenten meestal het sterkst vertegenwoordigd en bepalen bij éénkanaalscompressie daardoor de mate van compressie.


    Meerkanaalscompressie heeft als voordeel dat er rekening gehouden kan worden met de frequentieafhankelijkheid van het gehoorverlies van de individuele patiënt. Nadeel is dus dat het spraaksignaal spectraal wordt afgevlakt.


  • Temporele interactie

    De consequenties van éénkanaals- en meerkanaalscompressie voor de temporele structuur van de signalen (temporele interactie) zijn geïllustreerd in Fig.10 m.b.v. een signaal dat bestaat uit twee componenten, f1 en f2, met frequenties van respectievelijk 375 Hz en 3000 Hz waarvan de amplitudes blokvormig worden gemoduleerd met frequenties van respectievelijk 10 en 100 Hz.


    Fig.10.Voorbeeld van de verschillen in temporele vervorming bij respectievelijk éénkanaals- en meerkanaalscompressie. Het inputsignaal bestaat uit twee componenten, f1 en f2, met frequenties van respectievelijk 375 Hz en 3000 Hz waarvan de amplitudes blokvormig worden gemoduleerd met frequenties van respectievelijk 10 en 100 Hz. Er is geen overshoot en geen undershootaanwezig (Ta = Tr = 0). Zie verder de tekst.


    Het totale signaal wordt in dit voorbeeld drie keer bekeken. In de bovenste drie panelen wordt naar het geheel (f1 + f2) gekeken, in de middelste drie panelen wordt specifiek naar de f1 component gekeken en in de onderste drie panelen specifiek naar de f2 component. De middelste kolom geeft het resultaat voor de éénkanaalscompressie en de rechter kolom voor de meerkanaalscompressie.


    De figuur laat zien dat in geval van éénkanaalscompressie de componenten elkaar beïnvloeden. In het paneel voor f1 zijn bij éénkanaalscompressie behalve de f1 ook de f2 component en de modulatie daarvan te zien in het uitgangssignaal. Andersom geldt hetzelfde voor f2. Deze (ongewenste) interacties zijn veel minder duidelijk aanwezig bij meerkanaalscompressie (de rechter panelen). Meerkanaalscompressie heeft in dit opzicht een voordeel boven éénkanaalscompressie.



Eénkanaals- en meerkanaalscompressie zijn beide concepten ter compensatie van de niet functionerende cochlea. Zij brengen het dynamisch bereik van het ingangssignaal terug tot bruikbare proporties voor het restgehoor. Eénkanaalscompressie in een hoortoestel beperkt enigszins het verlies van spectrale contrast. Meerkanaalscompressie reduceert weliswaar de spectrale contrasten tussen de verschillende frequentiebanden, maar de vermindering van de temporele interacties tussen die banden compenseert dit nadeel. Het optimale aantal frequentiebanden dient experimenteel bepaald te worden. Het aantal gebruikte compressiekanalen in hoortoestellen varieert van ca. 4 tot ca. 20.

 


9.2.8.5(2). Compressiesystemen in hoortoestellen (en BCD's)

In hoortoestellen worden vanuit verschillende doelstellingen allerlei vormen van compressie toegepast, elk met eigen principes en toepassingen. Een aantal van deze typen wordt hier besproken. Voor de definities van de tijdconstanten wordt verwezen naar Niveau 3 van dit hoofdstuk (de IEC en ANSI definities).


  1. Automatic Gain Control (AGC) of Automatic Volume Control (AVC)

    Bij AGC wordt het gemiddelde lange termijn niveau van het spraaksignaal ingesteld op een niveau dat overeenkomt met maximaal spraakverstaan. Het wordt toegepast wanneer er slechts een beperkte reductie van het dynamisch hoorbereik is. De AGC voorkomt dat de spraak hetzij te hard, hetzij te zacht is om goed te kunnen worden verstaan. Dit systeem maakt het gebruik van een volumeregelaar, in principe, overbodig. AGC wordt gekenmerkt door een lage compressiedrempel (minder dan 50 dB SPL) en een CR van minder dan 5. De attacktijden zijn als regel kort, om plotselinge toenames van het inputniveau op te vangen. De releasetijden zijn meestal lang ter beperking van snelle fluctuaties in de versterking.


  2. Syllabische compressie

    Bij syllabische compressie wordt het dynamisch bereik van het spraaksignaal volledig aangepast aan het gereduceerde dynamisch bereik van de patiënt. De attack- en releasetijden zijn kort (kleiner dan 150 ms), de CR is laag (< 4). Omdat het zo'n snelle vorm van compressie is, worden alle relevante elementen uit het spraaksignaal zoals syllaben en fonemen in die bewerking meegenomen. Wanneer de tijdconstanten nog korter zijn (< 25 ms) worden ook fonemen in de bewerking meegenomen (fonemische compressie). Bij toepassing van syllabische en fonemische compressie is het ook mogelijk de abnormaal grote toename van de luidheid (recruitment) te compenseren.


    Fig.11. Vergelijking van wat er gebeurt bij een langzame compressie zoals AGC en een snelle zoals de syllabische compressie. In beide gevallen wordt het spraaksignaal getransponeerd naar het gereduceerde dynamisch bereik van de patiënt, maar bij SC werkt de compressie ook op de syllaben en fonemen.


  3. Compressive limiting (begrenzing)

    Begrenzing van het uitgangsniveau wordt toegepast om te voorkomen dat de aangeboden geluidsniveaus te hoog worden (reductie van piekwaarden). De drempels voor begrenzing zijn als regel hoger dan 90 dB SPL en de CR is als regel meer dan 9, en de attacktijden zijn zeer kort. Een hoortoestel kan zowel reguliere compressie als begrenzing hebben.


  4. Overige typen van compressie

    Er zijn, uitgaande van de hierboven beschreven typen, meerdere typen van compressie ontwikkeld. We bespreken enkele daarvan. Deze typen zijn niet bedoeld voor gebruik als begrenzer.


    • Toepassing van adaptieve releasetijden. Als het spraaksignaal gedurende langere tijd boven de compressiedrempel blijft wordt de releasetijd verlengd (Dillon, 1996, zie ook (https://starkeypro.com/pdfs/Compression_Handbook.pdf).

    • In hoortoestellen wordt soms gebruik gemaakt van verschillende CR's, afhankelijk van het niveau van het ingangssignaal (curvilineaire versterking). Een voorbeeld is de 'K-amp', ontwikkeld door Killion in 1993. Een K-amp bevat vier stappen van versterking: lineaire versterking met hoge gain voor lage signaalniveaus, compressie voor gemiddeld signaalniveaus, lineaire versterking voor hoge signaalniveaus en compressie om de output bij te hoge signaalniveaus te begrenzen. In een K-amp worden bij lage ingangsniveaus de hogere frequenties extra versterkt.

    • Er zijn systemen ontwikkeld om overshoot te reduceren die optreedt in het stuursignaal t.o.v. het audiosignaal. Die twee signalen worden dan gesynchroniseerd door een ingebouwde vertraging van het audiosignaal.

    • Compressie kan toegepast worden op verschillende frequentiegebieden. Er bestaat 'treble increase for low levels' (TILL) met meer compressie voor hoge frequenties dan voor lage frequenties en 'bass increase for low levels' (BILL) met meer compressie voor lage dan voor hoge frequenties (Killion, 1990; Dillon,1996). Dit komt overeen met meerkanaalscompressie waarbij er een bepaalde keuze is gemaakt voor de CR in de banden.

 


9.2.8.6(2). Conclusies

De verschillende compressiesystemen in hoortoestellen overziende brengt ons tot de algemene conclusie dat de syllabische (c.q. fonemische) compressie het meest lijkt op de fysiologische compressieve niet-lineariteit. Beide typen zijn snel en hebben een CR van 2 á 3. Dit betekent echter niet dat snelle compressie het meest geschikt is voor toepassing in hoortoestellen. Helaas brengt het compressiesysteem in hoortoestellen niet de andere voordelen van de compressieve cochleaire versterker met zich mee: frequentie-opscherping en vergroot tijdoplossend vermogen, deze blijven aangetast als gevolg van een uitval van OHC's.

 


9.2.8.7(2). Links

https://starkeypro.com/pdfs/Compression_Handbook.pdf.


http://www.few.vu.nl/~rplanque/resources/Theses/BachelorScriptieRemcoMenting1974394.pdf Cochlear Nonlinearity, door Luc Johan Kanis



 

9.2.8.1(3). Definitions of time constant

When comparing the effects different compression systems, it is important to know how attack and release time are defined, since they describe the reaction of a compressor to changes in signal amplitude. Currently, several definitions of attack and release time are in use. The two standards that are most frequently used are an international/European (IEC 60118-2, 1983) and an American (ANSI S3.22, 1996) standard. Both the IEC 60118-2 (1983) and the previous (obsolete) ANSI S3.22 from 1987, define attack and release time according to a change in input level from 55 to 80 dB (and vice versa) of a sine wave with a frequency of 2 kHz. Both attack and release times are defined with respect to a level 2 dB off the steady state output level.


However, the new ANSI S3.22 (1996) defines attack and release time for a change in input level from 55 to 90 dB (and vice versa) for a sine wave of arbitrary frequency. Attack time is defined as the time it takes the output level to reach 3 dB above steady state output level, release time is the time it takes to reach 4 dB below steady state output level.


Both IEC and ANSI define time constant as the time it takes the output level to reach a certain distance from the final steady state level. This type of definition is ambiguous because the value of time constant is not only influenced by the speed of the peak detector (the RC constant), but also by the amount of overshoot. This implies that the behavior of two systems with the same IEC/ANSI time constant can be very different (Kates, 1993). For instance, one system with a low threshold and fast compression, and another system with a high threshold and slow compression, might have the same release time constant when measured over the entire input range. Of course, this is remedied by IEC and ANSI through the specification of fixed input levels for time constant measurements.


In contrast to IEC and ANSI, we define time constant mathematically as the time it takes for the output level to reach 1/e (± 37%) of the ultimate change in gain. Fig. 1 illustrates the difference between our and the IEC definition. From the figure it can be seen that the definitions are fundamentally different. Both the IEC and ANSI definitions are based on the tail of the response, while our definition is based on the initial part. Consequently, the ratio of time constants according to the IEC/ANSI definition and ours is not constant, but depends on the amount of overshoot (and therefore on the combination of input signal, compression ratio and threshold).


Fig.1. Different definitions of time constant. TIEC represents time constant as defined by IEC 60188-2; T1/e is our mathematical definition.


A change in input from 55 to 80 dB with CR = 2 results in an overshoot of the output level of 12.5 dB. Using this overshoot and assuming logarithmic decay for an IEC system, the ratio between our (Texp) and the IEC definition (TIEC) is Texp/TIEC = 0.4 for both attack and release time. For an ANSI (1996) system the ratio for the same input rise is Texp/TANSI = 0.5 for attack time and Texp/TANSI = 0.6 for release time. Since these ratios depend on overshoot, they differ for different input signals and compression ratios.


An overshoot of 6.25 dB (25 dB input change with CR = 4) and 16.7 dB (25 dB input change with CR = 1.5) results in Texp/TIEC = 0.7, and Texp/TIEC = 0.3, respectively. Incomparing our results to those specified in terms of TIEC or TANSI we suggest to use the factor of 0.4.


Literatuur

  1. Dillon, H. (1996), “Compression?: Yes, but for low or high frequencies, for low or high intensities, and with what response times?” Ear and Hearing 17, 287–307.
  2. Goedegebuure A. 'Phoneme Compression Processing of the Speech Signal and Effects on Speech Intelligibility in Hearing-Impaired Listeners'. Proefschrift Erasmus Universiteit Rotterdam, 2005.
  3. Goldstein, JL. (1967), 'Auditory nonlinearity' Journal of the Acoustical Society of America 41, 676–689.
  4. Houben 2006. 'The Effect of Amplitude Compression on the Perception of Speech in Noise by the Hearing Impaired'
  5. Killion, M. C., Staab,W. J., and Preves, D. (1990), 'Classifying automatic signal processors'. Hearing Instruments 41, 24–26.
  6. Lyzenga, J., Festen, J., and Houtgast, T. (2002), 'A speech enhancement scheme incorporating spectral expansion evaluated with simulated loss of frequency selectivity'. Journal of the Acoustical Society of America 112, 1145–1157.
  7. Oxenham, A. J. and Bacon, S. P. (2003), “Cochlear compression: Perceptual measures and implications for normal and impaired hearing,” Ear and Hearing 24, 352–366.

© NVA leerboek 2000-2017 Privacy | Disclaimer | Copyright | Statistieken | Webredactie