5.5.1.1(2). Inleiding
Wanneer men het verstaan van spraak als een proces beschouwt kan men drie onderdelen onderscheiden: de spreker (zender), de spraakoverdracht (transmissie) en de luisteraar (ontvanger). De mate van overdracht van spraak wordt bepaald door de akoestische eigenschappen van de ruimte waarin de overdracht plaatsvindt. In dit hoofdstuk worden deze kort besproken. Er is daarbij wel een selectie gemaakt naar eigenschappen die van belang zijn om de mate van overdracht, zowel voor normaal- als slechthorenden, te beschrijven.
Tevens worden in dit hoofdstuk twee methoden behandeld die de – akoestische – overdracht van het spraaksignaal in een ruimte beschrijven. Het effect van de eigenschappen van de ruimte (omgeving) op de verstaanbaarheid van spraak bij slechthorenden komt aan de orde in Hfdst.7.4.3.
5.5.1.2(2). De akoestische eigenschappen van de ruimte
Geluid in het ‘vrije veld’
Met het ‘vrije veld’ wordt een ruimte bedoeld waarin geen weerkaatsing van geluidsgolven plaatsvindt. Bij een geluidsbron die in alle richtingen een even sterk geluid uitzendt spreekt men van een bolvormige uitbreiding van de geluidsgolven. Deze bolvormige uitbreiding leidt er toe dat de per seconde uitgezonden energie zich bij grotere afstand over een steeds groter (bol)oppervlak verdeelt. De sterkte van het geluid neemt dus af bij toenemende afstand tot de bron.
Maakt men de afstand tot de bron 2 keer zo groot, dan is het boloppervlak 4 keer zo groot en is op een bepaald punt de intensiteit van het geluid ook 4 keer zo klein geworden. Het oppervlak van de bol, met de bron als middelpunt, is immers 4πr2. In formule, bij een bron met vermogen P die in alle richtingen even sterk geluid uitzendt, geldt voor de intensiteit I op afstand r van de bron:
We kunnen de verzwakking omrekenen in dB’s door gebruik te maken van de in Hfdst.5.2.2(2) afgeleide formule:
Een verdubbeling van de afstand (r2 een factor 4 groter) betekent dus een verzwakking van 6 dB (10.log 4 = 6.0). In Fig.1 is de geluidsterkte uitgezet voor verschillende afstanden tot een geluidsbron die op een afstand van 1 m een geluidsterkte van 62 dB SPL produceert.
Geluid in een gesloten ruimte
Voor een geluidsbron in een gesloten ruimte zoals een kamer of zaal, is de situatie heel anders dan in de boven besproken ‘vrije veld’ situatie. Als de bron in een gesloten ruimte geluid produceert, neemt de geluidsterkte in die ruimte toe, omdat de bron steeds energie aan de ruimte toevoert. Omdat de wanden van de ruimte geluidsenergie absorberen, zal er ook voortdurend energie uit de ruimte verdwijnen. Er ontstaat uiteindelijk een evenwichtssituatie, waarbij er per seconde evenveel energie uit de ruimte verdwijnt, als de bron produceert. Een waarnemer ergens in die ruimte zal een bepaalde geluidsterkte waarnemen, die afhangt van de sterkte van de bron en de mate waarin de wanden absorberen. Het geluid zal de waarnemer op twee manieren bereiken: rechtstreeks vanuit de bron (het directe geluid) en via één of meer weerkaatsingen tegen de wanden (het indirecte of diffuse geluid). Bij benadering kan gesteld worden dat het indirecte geluid op elke plaats in de ruimte dezelfde sterkte heeft. Voor het directe geluid blijft, zoals in de vrije veld situatie, gelden dat de sterkte ervan afneemt bij toenemende afstand tot de bron.
De geluidsdruk in een willekeurig punt van de ruimte veroorzaakt door het indirecte geluid (pi) wordt gegeven door:
Hierin is P weer het vermogen van de bron, z de ‘specifieke akoestische impedantie’ van het medium waarin het geluid zich voortplant en α een maat voor geluidsabsorptie door de wanden van de ruimte. De absorptiecoëfficiënten kunnen waarden aannemen tussen 0 (geen absorptie) en 1 (totale absorptie). Tabel I geeft de absorptiecoëfficiënten van een aantal materialen bij verschillende frequenties. In de formule zien we dat het indirecte geluid des te zwakker is, naarmate de wanden sterker absorberen.
Voor de eerder ten tonele gevoerde geluidsbron (dit kan ook een spreker zijn), nu aannemend dat deze zich bevindt in een doorsnee huiskamer van 4×6×2,25 m en waarbij alle wanden een absorptiecoëfficiënt van 0,2 hebben, kan men berekenen (niveau 3) dat de sterkte van het indirecte geluid 66.5 dB SPL bedraagt. Vergelijken we deze uitkomst met Fig.1 dan valt op dat alleen heel dicht bij de bron het directe geluid sterker is dan het indirecte geluid.
125 Hz | 250 Hz | 500 Hz | 1000 Hz | 2000 Hz | 4000 Hz | |
Betonvloer | 0.02 | 0.02 | 0.02 | 0.04 | 0.05 | 0.05 |
Houten vloer | 0.15 | 0.20 | 0.10 | 0.10 | 0.10 | 0.10 |
Vloer met tapijt | 0.10 | 0.15 | 0.25 | 0.30 | 0,30 | 0.30 |
Bakstenen muur | 0.05 | 0.04 | 0.02 | 0.04 | 0.05 | 0.05 |
Gordijnen | 0.05 | 0.12 | 0.15 | 0.27 | 0.37 | 0.50 |
Akoestische panelen | 0.15 | 0.30 | 0.75 | 0.85 | 0.75 | 0.40 |
Zittende persoon | 0.18 | 0.40 | 0.46 | 0.46 | 0.51 | 0.46 |
Tabel I. De absorptiecoëfficiënten (in Sabins per m2) van een aantal materialen; de mate van absorptie hangt af van de frequentie van het geluid.
De sterktes van het directe en indirecte geluid uit ons voorbeeld zijn gecombineerd in Fig.2. We zien dat in de kamer de sterkte van het stemgeluid alleen dicht bij de spreker (afstand kleiner dan 1 m) sterk afhankelijk is van de afstand. Wat verder weg is deze sterkte vrijwel onafhankelijk van de afstand, door de bijdrage van het indirecte, weerkaatste geluid.
Uit de formules voor de sterkte van het directe veld en van het indirecte veld kan worden afgeleid dat de afstand tot de bron, waarbij het directe en het indirecte geluid even sterk zijn, wordt gegeven door:
Hierin is α de totale hoeveelheid absorptie in de betreffende ruimte, uitgedrukt in Sabins (voor de berekening van deze absorptie zie hierna). De grootheid R heet de galmstraal van de ruimte. In ons voorbeeld is deze galmstraal R = 0.61 m.
In een klaslokaal met weinig demping (α = 0.1; zie Tabel I) met afmetingen 10×8×2.5 m heeft de galmstraal de waarde 0.71 m. Men kan berekenen (niveau 3) dat met 40 leerlingen in deze klas de galmstraal 0.95 m bedraagt. Dus ook in een groot klaslokaal is alleen dicht bij de spreker het directe geluid sterker dan het indirecte geluid.
De akoestische demping in een ruimte is natuurlijk niet alleen van invloed op de sterkte van het geluid van een spreker, maar ook op die van stoorbronnen zoals een ventilator en een diaprojector. Omdat spreker en stoorbronnen dezelfde demping ondervinden, zal de sterkteverhouding in het indirecte veld bepaald worden door de verhouding van het door de spreker geproduceerde vermogen en dat van de stoorbron(nen). Het is dus niet zo dat bij meer demping een spreker zachter zou hoeven te spreken om ‘boven het stoorlawaai uit te komen’. Wel is het zo dat het dempende materiaal van invloed kan zijn op het door de stoorbron geproduceerde vermogen ter plaatse van de luisteraar. Vergelijk bijvoorbeeld het geluid van schuivende voeten en meubilair in een klaslokaal met een houten vloer met dat in een lokaal met tapijt.
Nagalm in een ruimte
In een grote ruimte, zoals een zaal en een kerk, bereikt het indirecte geluid de luisteraar later dan het directe geluid. Omdat spraaksegmenten enkele tienden van seconden duren treedt ‘versmering’ van het spraakgeluid op. De optelling en vermenging van het directe en indirecte geluid verstoort het patroon van de modulaties in het spraaksignaal en daarmee de verstaanbaarheid ervan. Deze invloed zal des te groter zijn naarmate de nagalmtijd van de betreffende ruimte groter is. Met nagalmtijd wordt bedoeld de tijd dat een kortdurend geluid (b.v. een harde tik) naklinkt. De precieze definitie luidt: de tijd, in seconden, die verstrijkt na het uitschakelen van een geluidsbron tot de geluidsterkte met 60 dB is afgenomen.
Een indruk van de grootte van de nagalmtijd in seconden kan worden verkregen met de in 1895 door Sabine empirisch gevonden formule:
T | nagalmtijd (s) |
V | volume ruimte (m3) |
α | totale hoeveelheid absorptie (m2 Sabine) |
αi | absorptiecoëfficiënt van vlak i |
Si | oppervlak van vlak i (m2) |
De nagalmtijd hangt dus (via de absorpties α) ook af van de frequentie van het naklinkende geluid. De nagalmtijd is voor een bepaalde ruimte dus geen vast getal.
Voor het eerder behandelde voorbeeld van de huiskamer van 4×6×2.25 m3 waarbij alle wanden een absorptiecoëfficiënt van 0,2 hebben kan men berekenen (niveau 3) dat de nagalmtijd 0.46 s bedraagt. Voor het voorbeeld van het klaslokaal van 10×8×2.5 m3 met α=0.1 en waarin zich 40 personen bevinden, komt de nagalmtijd T op 0.71 s.
In het algemeen geldt dat voor een klaslokaal met een volume van 200 m3 bij een frequentie van 500 Hz een nagalmtijd van 0.5 tot 0.8 s acceptabel is. Hierbij is er vanuit gegaan dat zich in het lokaal luisteraars bevinden met een normaal gehoor.
5.5.1.3(2). Maten voor de overdracht van spraak in een ruimte
Articulatie Index (AI)
Om verstaanbaarheid van spraak te kunnen voorspellen, uitgaande van de akoestische eigenschappen van een ruimte en aanwezig achtergrondgeluid, zijn verschillende meet- en rekenmethoden ontwikkeld. De eerste die we bespreken is de bepaling van de ‘Articulatie Index’ (AI), in de USA ongeveer 30 jaar geleden ingevoerd. De Articulatie Index is een getal dat een waarde kan aannemen van 0 tot 1. Een AI=1 betekent een ongestoorde overdracht van de spraak. Bij een AI=0 wordt er niets overgedragen.
Ter bepaling van de AI voor een ruimte wordt een spraaksignaal, geproduceerd door een stem of uit een luidspreker, ter plaatse van de luisteraar met een microfoon opgevangen en in frequentiebanden geanalyseerd. Per frequentieband wordt bepaald hoe sterk het spraaksignaal is t.o.v. de sterkte van de achtergrondruis (signaal-ruis (S/N) verhouding). De S/N’s van de verschillende frequentiebanden worden gewogen gemiddeld: frequentiebanden die belangrijk zijn voor het verstaan van spraak leveren een grotere bijdrage dan banden die minder belangrijk zijn. In de standaardprocedure wordt het spraaksignaal in 20 frequentiebanden verdeeld. Er kan eventueel worden volstaan met een verdeling in 15 banden met een breedte van 1/3 octaaf. Bij een minder nauwkeurige snelle procedure wordt gebruik gemaakt van een verdeling in 5 banden met een breedte van 1 octaaf. Een van de bezwaren tegen de bepaling van de AI is dat de invloed van nagalm buiten beschouwing wordt gelaten.
Spraak Transmissie Index (STI)
De Spraak Transmissie Index (STI) is eveneens een maat voor de kwaliteit van de overdracht van spraak in een ruimte. De STI is gebaseerd op het gedrag van de fluctuaties – in het vervolg ‘modulaties’ genoemd – in het spraaksignaal in de ruimte. De akoestische eigenschappen van de ruimte en het achtergrondlawaai verminderen de modulaties – ‘vlakken deze af’ – en beperken daardoor de verstaanbaarheid van het spraaksignaal. De resterende sterkte van de modulaties kan daarom gebruikt worden als een maat voor verstaanbaarheid. De index heeft een waarde tussen 0 en 1. Een waarde 1 betekent dat de spraak totaal ongestoord wordt overgedragen en de waarde 0 houdt in dat er een maximale ‘versmering’ is opgetreden in het geluid dat de luisteraar bereikt. De STI is ontwikkeld bij het Instituut voor Zintuig Fysiologie (IZF-TNO) te Soesterberg) door Houtgast en Steeneken.
Het principe van de STI is weergegeven in Fig.3. . De signaaloverdracht, van de mond van de spreker naar het oor van de luisteraar, wordt gekarakteriseerd door de vermindering van de modulaties in het oorspronkelijke signaal.
Voor de bepaling van de STI zijn zowel van belang de frequenties van de modulaties in normale spraak, variërend van 0.5 tot 16 Hz, als het frequentiespectrum van de spraak. In de praktijk wordt het spraaksignaal opgesplitst in octaafbanden en wordt voor elk daarvan bij een reeks modulatiefrequenties de afvlakking van de modulaties bepaald. De uiteindelijke STI is een gewogen gemiddelde van deze achteruitgang voor de verschillende modulatiefrequenties en octaafbanden.
5.5.1.4(2). Het meten van de STI – uitwerking
We beschrijven eerst, meer gedetailleerd, de uitvoering van een volledige STI meting. Er wordt uitgegaan van ‘spraakruis’. Dit is ruis welke gemiddeld hetzelfde frequentiespectrum heeft als lopende spraak. Deze spraakruis wordt achtereenvolgens opgesplitst in octaafbanden rond respectievelijk 125 Hz, 250 Hz, 500 Hz enz. tot 4000 Hz. De octaafbanden worden aangeboden via een geluidsbron en zijn 100% sinusvormig gemoduleerd. Bij elk van deze 6 octaafbanden worden achtereenvolgens de modulatiefrequenties 0.5 Hz, 0.63 Hz, 0.8 Hz enz. tot 16 Hz, oplopend in stappen van 1/3 octaaf ingesteld. Voor elk van deze 6×13 condities wordt de verzwakking van de modulatiediepte bepaald ter plaatse van de ontvanger, zoals geïllustreerd in Fig.3. Wanneer voor een bepaalde conditie de modulatiediepte b.v. 50% is geworden is er sprake van een verzwakking van 6 dB. De resulterende 78 bepalingen worden ‘gewogen gemiddeld’ en de uitkomst van deze middeling is de STI.
Het zal duidelijk zijn dat deze methode zeer tijdrovend is. Daarom is er een snellere methode ontwikkeld. Hierbij worden in plaats van de bovengenoemde 78 metingen slechts 9 bepalingen uitgevoerd. Men neemt dan een ruisband rond 500 Hz met de modulatiefrequenties 1 Hz, 2 Hz 4 Hz en 8 Hz en een ruisband rond 2 kHz met de modulatiefrequenties 0.7 Hz, 1.4 Hz, 2.8 Hz, 5.6 Hz en 11.2 Hz. Op deze manier wordt niet de STI maar de RASTI (‘RApid Speech Transmission Index’) bepaald. De firma Bruel & Kjaer heeft hiervoor apparatuur op de markt gebracht.
In sommige situaties is het mogelijk de RASTI te berekenen zonder metingen uit te voeren. Dit word behandeld op niveau 3.
5.5.1.5(2). (RA)STI en spraakverstaan
De (RA)STI uitkomst is een maat voor de – storende – invloed van de ruimte op het spraakverstaan. Het bijzondere van deze maat is dat zowel de invloed van nagalm als die van achtergrondlawaai op de verstaanbaarheid van spraak verrekend wordt. Fig.4. geeft de relatie tussen STI en spraakverstaan voor een groot aantal situaties die in ruimten aanwezig kunnen zijn, zoals storend achtergrondgeluid, galm en echo’s.
Tabel II geeft een overzicht van de verstaanbaarheid van spraak die men in een ruimte kan verwachten bij een bepaalde STI voor mensen met een normaal gehoor. Voor slechthorenden gelden andere waarden (Hfdst.7.4.3).
STI | Verstaanbaarheid |
0.00 – 0.30 | slecht |
0.30 – 0.45 | matig |
0.45 – 0.60 | redelijk |
0.60 – 0.75 | goed |
0.75 – 1.00 | uitstekend |
Tabel II. Relatie tussen de STI en de mate van verstaanbaarheid van spraak in een ruimte bij normaalhorenden
Auteur
Houtgast, Wit
Revisie
2011