2.7.1.1(2). Inleiding
Nederlandse zegswijzen zoals ‘het ene oor in, het ander oor uit’ en ‘de oren spitsen’ benadrukken het feit dat de mens beschikt over twee oren in plaats van één. Waartoe die twee oren? Natuurlijk, als het ene oor kapot zou gaan, heb je altijd het andere nog. En met twee oren blijkt het geluid ongeveer 6 dB sterker te worden waargenomen. Maar er is ook een echte functionele reden. In dit verband leidt een vergelijk tussen éénogig zien en éénorig horen tot een schokkende constatering. Terwijl we met één oog goed de positie (richting en afstand) van een voorwerp in de ruimte kunnen waarnemen, zijn we met één oor meestal matig in staat de richting van een geluidsbron te bepalen. Hoe komt dat?
De verklaring is dat het oog werkt met golflengten in zichtbaar licht die zeer klein zijn ten opzichte van de oogafmetingen; de lens maakt een nauwkeurige projectie van de buitenwereld op het netvlies. De golflengten in hoorbaar geluid, daarentegen, zijn groot vergeleken bij de afmetingen van het oor. Gelijktijdig geluid uit verschillende richtingen wordt op ‘een hoop gegooid’ op het trommelvlies en het uiteenrafelen daarna in het binnenoor en de hersenen lijkt een schier onmogelijke taak. Toch zullen we in het navolgende zien dat met twee oren i.p.v. één zo’n analyse van de ruimte wel mogelijk is.
We zullen de fysische en psychofysische feiten van dit binauraal horen behandelen in twee etappes. Dit eerste hoofdstuk behandelt de lokalisatie van één enkele geluidbron in de open (reflectie-vrije) ruimte, en bij geluidsweergave door middel van een hoofdtelefoon. Daarna wordt een apart tweede hoofdstuk (Hfdst.2.7.2 – ‘Ruimtelijk Horen’) gewijd aan het waarnemen van meerdere geluiden tegelijkertijd in de (niet noodzakelijk reflectie-vrije) ruimte, met name ten aanzien van detectie en lokalisatie.
Om de invalsrichtingen van het geluid naar de oren goed aan te geven wordt gebruik gemaakt van drie loodrecht op elkaar staande vlakken door het midden van het hoofd, weergegeven in Fig.1. . Deze zijn:
- Het ‘horizontale vlak’ door de verbindingslijn van de twee oren; verdeling van de ruimte in boven en onder
- Het ‘frontale vlak’, eveneens door de verbindingslijn van de twee oren; verdeling van de ruimte in vóór en achter
- Het ‘mediane vlak’, door het midden van het hoofd; verdeling van de ruimte in links en rechts .
Een hoek opzij t.o.v. het mediane vlak, dus t.o.v. recht voor en ‘recht’ achter, wordt aangegeven met het symbool φ en wordt ‘azimut’ genoemd. Voor een geluid komend van rechts (in het horizontale vlak) geldt dus φ = 90°. Een hoek omhoog in de kijkrichting, t.o.v. het horizontale vlak, wordt aangegeven met het symbool δ en wordt ‘elevatie’ genoemd.
2.7.1.2(2). Lokalisatie in het horizontale vlak
In het algemeen is de mens met gebruikmaking van zijn twee oren, in de vrije ruimte en in het horizontale vlak, goed in staat de richting van een enkele geluidsbron te bepalen. De nauwkeurigheid waarmee dit geschiedt is afhankelijk van diverse factoren, waaronder de stimulus. Voor het gemak gaan we in deze paragraaf uit van een puntvormige geluidsbron (b.v. een zeer kleine luidspreker) die zich bevindt in de open lucht op de hei of in een ruimte zonder reflecties. We beperken ons verder, zoals gezegd, tot puntbronnen in het horizontale vlak waarin de verbindingslijn van linker en rechter oor gelegen is (zie Fig.1).
De psychofysische vraagstelling is nu welk verband er bestaat tussen de fysische richting (azimut φ) en de waargenomen richting van de geluidsbron. Fig.2a geeft dit verband voor 100 ms durende impulsen van witte ruis als bronsignaal. Proefpersonen hadden hierbij als opdracht de positie van een luidspreker zo in te stellen, dat het geluid achtereenvolgens recht van voren, van achter of opzij werd waargenomen. De pijltjes in de figuur geven de – aldus waargenomen – positie van de geluidsbron (‘auditory event’) weer, de open rondjes op de cirkelboog de gemeten gemiddelde – fysische – richting van de geluidsbron (‘sound event’) en de boogstukjes de spreiding in de ingestelde – fysische – richting.
Fig.2b geeft het resultaat van een soortgelijk experiment voor proefpersonen met (al of niet gesimuleerde) doofheid links en normaal gehoor rechts. Hierbij werd dezelfde stimulus gebruikt. Deze figuren bevestigen de constatering uit de Inleiding dat voor nauwkeurig richtinghoren twee goed functionerende oren nodig zijn. Zie ook b.v. Schmidt (1955), Sedee (1957) en van der Veer (1957).
Richtinghoren of lokalisatie van een geluidsbron treedt op wanneer de afstanden van de geluidsbron naar de afzonderlijke oren ongelijk zijn. Dit heeft tot gevolg dat de geluiden in de afzonderlijke oren zowel verschillen in (aankomst)tijd als in intensiteit. Deze verschillen treden altijd op wanneer φ ≠ 0°, dus wanneer de bron zich buiten het mediane vlak bevindt. De schaduwwerking van het hoofd t.o.v. het geluid speelt hier een aanvullende rol. Zolang de verschillen in aankomsttijd bij de twee oren klein zijn, is men zich niet bewust van deze verschillen. Er treedt ‘fusie’ op: men hoort één geluid, waar een bepaalde richting aan toegekend wordt. Voor een interauraal verschil in aankomsttijd wordt de Engelse term ‘ITD’ – ‘Interaural Time Difference’) gebruikt en voor een interaurale verschil in intensiteit, uitgedrukt in dB, de Engelse term ‘ILD’ – ‘Interaural Level Difference’ .
Bij het spreken over een geluid dat bij het ene oor ‘eerder aankomt’ dan bij het andere is stilzwijgend verondersteld dat het een kortdurend geluid is (b.v. een korte tik). Bij langer durende geluiden – dit treedt m.n. op bij laagfrequente tonen – zal bij een geluidsbron die zich rechts opzij bevindt, het geluid in het linker oor iets vertraagd zijn t.o.v. hetgeen opgevangen wordt in het rechter oor. Men omschrijft deze vertraging als een ‘faseverschil’. Hebben we een tijdverschil Δt en is de periode van een zuivere toon T (een hele periode komt overeen met faseverschuiving van 360°), dan bedraagt de faseverschuiving Δφ = Δt/T.
Men kan het ITD als functie van de hoek φ, het azimut, berekenen. Benadert men de gemiddelde afmetingen van het menselijk hoofd door een bol met diameter van 17,5 cm, en kiest men een geluidsbron op oneindige afstand met azimut φ (uitgedrukt in radialen) en een geluidssnelheid van 340 m/s, dan volgt uit een goniometrische beschouwing voor het weglengteverschil ITD:
ITD = 257 x (φ + sin(φ)), in µs
Zie niveau 3 Par.1 voor de afleiding van deze formule. Het maximale ITD treedt op voor een azimut van 90° (π/2 radialen) en is gelijk aan 660 µs. Metingen met pulsvormige signalen tonen een goede overeenkomst met deze vergelijking, zoals te zien in Fig.3a. .
Interaurale verschillen in intensiteit (ILD’s), treden vooral op bij de hogere frequenties ten gevolge van de schaduwwerking van het hoofd. Voor ongeveer 2000 Hz correspondeert de golflengte van geluid met de diameter van het hoofd. Boven 2000 Hz is het hoofd dus groot vergeleken met de golflengte en produceert het een geluidsschaduw. Voor frequenties ver beneden 2000 Hz is het hoofd als het ware transparant. Berekeningen zijn hier niet zo eenvoudig te maken, omdat men rekening moet houden met buiging, diffractie en interferentie van de geluidsgolven. In Fig.3b is het gemeten ILD gegeven voor vier verschillende frequenties als functie van de invalsrichting (azimut φ) van het geluid. In het bijzonder voor hoge frequenties kunnen er dus interaurale intensiteitsverschillen tot 20 dB optreden.
Het is interessant bovenstaande resultaten omtrent de fysische parameters te vergelijken met resultaten van psychofysische metingen van de juist waarneembare azimutverandering (in het Engels ‘MAA’ – ‘Minimum Audible Angle’). Fig.4 toont het MAA voor sinusvormige signalen als functie van de frequentie voor 4 verschillende waarden van het azimut. Het valt op dat beneden ongeveer 1500 Hz de nauwkeurigheid in lokalisatie, uitgedrukt als MAA in graden, nagenoeg alleen van het azimut afhankelijk is. Aangezien bij deze lage frequenties ILD’s geen rol van betekenis spelen (zie Fig.3b), moet geconcludeerd worden dat lokalisatie hier alleen berust op de meting, door het centraal zenuwstelsel, van ITD’s. Boven 1500 Hz ziet men weinig systematiek. Het steil omhoog lopen van de curven bij 1500 Hz suggereert dat ITD’s hier geen rol meer spelen. Het feit tevens dat ILD’s een ingewikkelde functie zijn van azimut en frequentie, kan een verklaring zijn voor het op het eerste gezicht weinig systematische verloop van de curven boven 1500 Hz.
2.7.1.3(2). Lateralisatie
Normaliter zijn bij natuurlijke geluidsbronnen in de ruimte interaurale verschillen in tijd en intensiteit gekoppeld. Men kan ze niet onafhankelijk van elkaar variëren. Om de specifieke rol van het ITD en ILD te onderzoeken zal men ze moeten zien te ontkoppelen. Dit is mogelijk door een geluidssignaal te presenteren met behulp van een hoofdtelefoonopstelling zoals in Fig.5 geschematiseerd is weergegeven. Een vertragingslijn en/of een verzwakker verzorgen de twee onafhankelijk varieerbare parameters, respectievelijk ITD en ILD.
Bij een dergelijke stimuluspresentatie treedt een subjectieve brongewaarwording in het hoofd op (in het Engels ‘IHL’ – ‘Inside the Head Locatedness’). Blijkbaar ervaren onze hersenen zo’n stimulus als onnatuurlijk en het is dus niet zondermeer mogelijk een ‘percept’ (gewaarwording) ver buiten het hoofd te genereren. Het percept bevindt zich daarentegen op een denkbeeldige as door de beide oren en de positie ervan langs deze as kan veranderd worden door of het ITD, het ILD, of beide tegelijk te veranderen. Bij een ITD en ILD gelijk aan nul bevindt het beeld van het signaal zich midden in het hoofd. Bij een zijdelingse uitwijking uit het midden spreken we van ‘lateralisatie’.
Terminologie. Wanneer de twee oren tegelijkertijd worden gestimuleerd spreekt men in het algemeen van een ‘binaurale presentatie’. Bij een ‘monaurale presentatie’ wordt het geluid – via een hoofdtelefoon – aan één oor aangeboden. Biedt men met een hoofdtelefoon aan beide oren dezelfde stimulus aan – dus met ITD en ILD gelijk aan nul – dan noent men dat een ‘diotischepresentatie’. Bij presentatie via een hoofdtelefoon van verschillende signalen aan linker- en rechter-oor spreekt men van een ‘dichotische presentatie’.
In Fig.6 is de ‘grootte’ van de lateralisatie afgebeeld als functie van respectievelijk het interauraal looptijdverschil (faseverschil – linker paneel) en interauraal niveauverschil (rechter paneel). Langs de verticale as staat de zijdelingse verplaatsing uitgezet op een lineaire schaal zoals geschat door de proefpersonen. Hierbij correspondeert 0 met het midden van het hoofd en 5 met de maximale uitwijking van het percept, ongeveer bij de ingang van het oorkanaal. Het is belangrijk op te merken dat Fig.6 het gemiddelde gedrag geeft voor verschillende typen signalen, waaronder ook continue sinustonen.
Een vergelijk met Fig.3 is instructief. ITD’s groter dan ± 660 µs hebben geen fysische betekenis voor lokalisatie in het algemeen. Hiermee lijkt in overeenstemming dat de lateralisatie-curve (Fig.6, linker paneel) een verzadiging gaat vertonen bij deze waarden. Zo ook liggen de waarden van het ILD (Fig.6, rechter paneel) in dezelfde orde van grootte als de fysisch relevante waarden.
De kleinst waarneembare verandering in lateralisatie voor looptijdverschillen, ΔITD (Δτ in µs) , is weergegeven in Fig.7 voor continue zuivere tonen en zuivere tonen met een Gauss-vormige omhullende.
De frequentie, respectievelijk de draaggolffrequentie, is uitgezet langs de horizontale as. Voor continue zuivere tonen is het ΔITD nagenoeg constant voor frequenties tussen 400 en 1000 Hz en gelijk aan 20 µsec. Bij ongeveer 1500 Hz neemt het ΔITD zeer sterk toe. Blijkbaar is het auditieve systeem niet in staat tijdverschillen te evalueren voor frequenties hoger dan 1500 Hz. Bij de sinustonen met een Gauss-vormige omhullende kan men zowel ten aanzien van de draaggolf als de omhullende – onafhankelijk van elkaar – een interauraal tijdverschil creëren . ΔITD’s in de draaggolf blijken volgens de figuur eenzelfde uitwerking te hebben als bij continue zuivere tonen. ΔITD’s in de omhullende (bij onvertraagde draaggolf) zorgen voor een goede lateralisatie, vooral bij hogere draaggolffrequenties. Bij lagere draaggolffrequenties werkt het onvertraagd blijven van de draaggolf de lateralisatie tegen. Zijn de tijdvertraging van draaggolf en omhullende met elkaar in overeenstemming (‘volledig signaal’) dan is de lateralisatie over het gehele frequentiegebied optimaal.
Ook bij continue signalen met een periodieke omhullende kan lateralisatie geschieden op basis van tijdvertragingen in de omhullende. Het is zelfs mogelijk een eenduidig lateralisatiepercept te verkrijgen uit signalen die aan beide oren dezelfde omhullende hebben doch een verschillende draaggolf, b.v. twee ongecorreleerde ruissignalen. Proefondervindelijk is vastgesteld dat lateralisatie optreedt voor frequenties van de omhullende die lager liggen dan ongeveer 300 Hz. Uiteraard heeft het spreken over een omhullende slechts zin als deze op cochleair en hogere niveaus behouden blijft, d.w.z. niet wordt aangetast door de cochleaire frequentieanalyse. Dit is in het algemeen het geval voor draaggolffrequenties boven ongeveer 3000 Hz. Ook transiënten bieden goede richtinginformatie. Zie in dit verband Hfdst.6.2.2(2), Par 6 .
Kleinst waarneembare veranderingen in de zijdelingse uitwijking op basis van interaurale verschillen in intensiteit (ΔILD’s) zijn nagenoeg onafhankelijk van het type signaal en de frequentieligging. Ze bedragen 0.5 à 1 dB.
Het feit dat lateralisatie kan geschieden op basis van zowel interaurale tijdverschillen als intensiteitsverschillen is aanleiding geweest tot experimenten die tot doel hadden te onderzoeken of een lateralisatie veroorzaakt door een tijdverschil ongedaan zou kunnen worden gemaakt door een intensiteitsverschil. Dit noemt men in de Engelstalige literatuur ‘Time Intensity Trading’, d.w.z. het uitwisselen van tijd tegen intensiteit. De resultaten tonen aan dat trading mogelijk is. Er bestaat echter wel onenigheid in de literatuur over de vraag in hoeverre een bij voorbeeld door trading in het midden van het hoofd gepositioneerd geluidsbeeld identiek is aan, d.w.z. subjectief niet te onderscheiden is, van een centraal beeld ontstaan door identieke signalen aan het linker en rechter oor. Bij precieze introspectie kan men voor signalen die frequenties onder 1500 Hz bevatten, in veel gevallen twee geluidsbeelden waarnemen, namelijk een zogenaamd ‘time-image’ en een ‘intensity image’. Het eerste is alleen gevoelig voor tijdverschillen; het tweede vertoont het trading-gedrag .
2.7.1.4(2). Lokalisatie in het verticale vlak
We beschouwen geluidsbronnen die gelegen zijn in het mediane vlak, d.w.z. voor azimut 0°. Geluidsbronnen in dit vlak zullen vanwege de symmetrie van het hoofd aan beide trommelvliezen nagenoeg dezelfde geluidsdruk, hetzelfde geluidsspectrum etc. produceren. Lokalisatie van een geluidsbron in dit vlak moet dus in principe berusten op monaurale kenmerken.
Het linker paneel van Fig.8 geeft een overzicht van het verband tussen de richting van een geluidsbron (‘sound event’: pijltjes), de waargenomen richting (‘auditory event’: gemiddelde meetpunten) en de nauwkeurigheid daarvan (cirkelboogstukken) voor normale spraak van een bekende spreker. Uit deze figuur blijkt dat de mens richting kan horen in het mediaanvlak, zij het met een veel kleinere nauwkeurigheid dan in het horizontale vlak (vergelijk Fig.2a) en onder voorwaarde van bekendheid met het signaal.
Bij onbekende zoals smalbandige signalen worden totaal andere resultaten verkregen. Het blijkt dat de subjectief ervaren richting in het geheel niet afhangt van de invalsrichting van het geluid, maar louter en alleen van de – centrale – frequentie van het geluid. In Fig.8 (rechter paneel) is de baan geschetst die het subjectief beeld van een tertsband ruis beschrijft als functie van de centrumfrequentie, voor een willekeurige richting van de geluidsbron in het mediaanvlak. Dit resultaat hangt dus niet af van de positie van de luidspreker.
In Fig.9. is dit merkwaardige resultaat verder onderzocht voor 20 proefpersonen. Aangeboden werden weer ruispulsen met een bandbreedte van 1/3 octaaf, voor elke middenfrequentie éénmaal vóór en éénmaal achter. Uitgezet is als functie van de middenfrequentie het aantal malen, percentagegewijs, dat de proefpersonen het geluid hoorden komen van vóór, boven of achter. Het blijkt dus dat, afhankelijk van de fysische invalsrichting, er voor bepaalde frequentiebereiken uitgesproken voorkeuren bestaan voor één van de subjectieve invalsrichtingen. In het 1000 Hz frequentiegebied is er b.v. een voorkeur voor het horen van het geluid achter het hoofd. De frequentiebereiken met een voorkeursrichting zijn door Blauert ‘Richtungsbestimmende Bänder’ of ‘directional bands’ genoemd.
Voor de lokalisatie in het mediaanvlak en, meer algemeen, in het verticale vlak, maakt het auditieve systeem gebruik van de filtering van het binnenkomende geluid door m.n. de oorschelp. De aanwezigheid van de oorschelp en het hoofd hebben tot gevolg dat bepaalde frequentiegebieden in het spectrum van het geluid tengevolge van breking en interferentie een extra versterking of verzwakking ondervinden, afhankelijk van de invalsrichting van het geluid. Het spectrum van het geluid ter plaatse van het trommelvlies is sterk afhankelijk van de precieze geometrie van het oor, en daarmee sterk proefpersoonafhankelijk (‘idiosyncratisch’). Men zou het kunnen interpreteren als een ‘oorafdruk’. Voorkennis over het signaal is daarbij niet absoluut vereist, hoewel de nauwkeurigheid van de lokalisatie er door wordt vergroot. Hoofdbewegingen leiden tot veranderingen in het spectrum van het geluid en zijn dus eveneens van betekenis voor de lokalisatie. Fase-informatie lijkt daarbij alleen van nut voor de bepaling van het azimut.
Men kan het richtinghoren in het verticale vlak verstoren door het aanbrengen van buisjes in de externe gehoorgangen. Er ontstaat dan bij proefpersonen de neiging het geluid achter zich of in het hoofd te lokaliseren, zoals bij dichotische presentatie in het algemeen. Een dergelijke proef bevestigt nog eens dat de lineaire vervormingen van het geluid door hoofd en oorschelp een belangrijk gegeven zijn bij de bepaling van de richtingsindruk. In de alledaagse werkelijkheid is alles nog ingewikkelder omdat de lokalisatie nog kan worden beïnvloed en zelfs gedomineerd door andere zintuigen. Vermeldenswaard is in dit verband het ‘buiksprekereffect’ .
Voor de weergave van het spectrum van een geluid ter plaatse van het trommelvlies voor de verschillende richtingen wordt gebruik gemaakt van een overdrachtsfunctie, de ‘Head Related Transfer Function’ (HRTF). Deze functie geeft, als functie van de frequentie, de extra versterking en verzwakking van het geluid, afhankelijk van de invalsrichting van het geluid. Voorbeelden van HRTF’s zijn te zien in niveau 3 van dit hoofdstuk (Par.4, Fig.4 en Fig.5).
Tenslotte zij hier vermeld dat men tegenwoordig ook met hoofdtelefoons al aardig in staat is geluid in de ruimte (dus zonder ILD) correct weer te geven (virtual reality). Hiervoor is nodig dat men het ‘continuüm’ van (liefst individuele) HRTF’s in de weergeef-computer inbouwt, hoofdbewegingen toelaat (registreert en koppelt aan de HRTF’s) en tevens invers filtert voor de overdracht van hoofdtelefoon naar trommelvlies .
2.7.1.5(2). Links
http://www.xs4all.nl/~fabilsen/#Repetition_Pitch
(website met geluidsdemonstraties over o.m. de herhalingstoonhoogte en het ruimtelijk horen door F. A. Bilsen)
http://www.mbfys.ru.nl/~johnvo/localisatie/localisatie_2.html
(website over het gehoor en het richtinghoren door J. van Opstal)
Literatuur
Dit overzicht bevat voornamelijk Engelstalige handboeken. In verband met het nationale karakter van het onderhavige (Nederlandstalige) Nederlands Leerboek Audiologie wordt slechts verwezen naar Nederlandse dissertaties.
Handboeken
- Beranek, LL. ‘Concert and Opera Halls. How They Sound’, ASA-AIP Press, Woodbury NY, 1996.
- Blauert, J. ‘Spatial Hearing. The Psychophysics of Human Sound Localization’, MIT Press, Cambridge Mass., 1997.
- Gilkey, RH., en Anderson, TR. ‘Binaural and Spatial Hearing in Real and Virtual Environments’, Erlbaum Publ., Mahwah NJ, 1997.
- Moore, BCJ. ‘Hearing’, Academic Press, San Diego, 1995.
- Slis, IH. ‘Audiologie – Horen in een wereld van geluid’. Dick Coutinho, Bussum, 1996.
Dissertaties
- Bilsen ‘On the interaction of a sound with its repetitions’, T.H. Delft, 1968.
- Boer, K. de. ‘Stereofonische geluidsweergave’, T.H. Delft, 1940.
- Breebaart, J. ‘Modelling binaural signal detection’, T.U. Eindhoven, 2001.
- Bronkhorst, AW. ‘Binaural aspects of speech perception in noise’, V.U. Amsterdam, 1990.
- Franssen, NV. ‘Some considerations on the mechanism of directional hearing’, T.H. Delft, 1960.
- Goverts, ST. ‘Assessment of spatial and binaural hearing in hearing impaired listeners’, VU Amsterdam, 2004.
- Heijden, M. van der. ‘A comparison of masking by tones and noise’, T.U. Eindhoven, 1995.
- Hofman, P. ‘On the role of spectral pinna cues in human sound localization’, K.U. Nijmegen, 2000.
- Kuyper, P. ‘Horen met twee oren’, U. van Amsterdam, 1969.
- Langendijk, E. ‘Spectral cues of spatial hearing’, T.U. Delft, 2002.
- Par, S. van der. ‘A comparison of binaural detection at low and high frequencies’, T.U. Eindhoven, 1998.
- Potter, J.M. ‘On the binaural modelling of spaciousness in room acoustics’, T.U. Delft, 1993.
- Raatgever, J. ‘On the binaural processing of stimuli’, T.H. Delft, 1980.
- Salomons, AM. ‘Coloration and binaural decoloration of sound due to reflections’, T.U. Delft, 1995.
- Schmidt, PH. ‘Phantom source experiments in auditory localization’, R.U. Leiden, 1955.
- Sedee, GA. ‘Over stereo-akoesie’, R.U. Utrecht, 1957.
- Veer, RA. van der. ‘Enige onderzoekingen over richting horen’, U. van Amsterdam, 1957.
- Zwiers, M. ‘Cross-sensory calibration of spatial hearing’, K.U. Nijmegen, 2003.
Overige literatuur
- Sayers, BMcA. Acoustic image lateralization judgement with binaural tones. J Acoust Soc Amer 1964;36:923-926.
Auteur
Bilsen, Lamoré
Revisie
mei 2011