De schrijver van dit hoofdstuk is dr. ir Gerrit Bloothoofd dankbaar voor het overnemen van informatie uit het werkboek ‘Inleiding in de Fonetiek’ van de studierichting ‘Fonetiek’ (Opleiding Taalwetenschap) van de Universiteit Utrecht en voor de daarbij ontvangen adviezen .
10.1.2.1(2). Inleiding en overzicht
In dit hoofdstuk worden de spraakorganen en de basisprincipes van de productie van spraak besproken. Aan de orde komen de stemgeving (het ‘foneren’), de organen die daarbij een rol spelen, de vorming van de klinkers (vocalen) en de productie van de medeklinkers (consonanten). De classificatie van de klinkers en medeklinkers naar de wijze waarop zij in het aanzetstuk gevormd worden is het onderwerp van Hfdst.10.2.2(2). De akoestische eigenschappen van spraakklanken die relevant zijn voor de herkenning van die klanken worden besproken in Hfdst.10.2.1(2).
De belangrijkste organen die bij de vorming van de spraak een rol spelen zijn weergegeven in Fig.1. Hun functies worden in het vervolg van dit hoofdstuk besproken.
In het productieproces zijn, uitgaande van Fig.1, drie schakels aan te geven:
Het ademhalingsapparaat bestaat uit de longen, de luchtwegen en de ademhalingsspieren. Dit geheel vormt de energiebron voor de spraakproductie. Bovenaan de luchtpijp (de ‘trachea’) bevindt zich het strottenhoofd (de ‘larynx’), met daarin de stembanden. Het ademhalingsapparaat en de stembanden samen produceren een ‘basisgeluid’ . Dit basisgeluid heeft, althans wanneer men stemhebbend spreekt, een periodieke (tijd)structuur en de vorm van een zaagtand, zoals afgebeeld in Fig.2. Dit betekent dat het geluid breedbandig is en bestaat uit een grondtoon en een reeks hogere harmonischen.
De periodieke zaagtandvorm van het basisgeluid impliceert dat het spectrum een ‘lijnenspectrum’ is, met de grondfrequentie van het stemgeluid als ‘eerste lijn’. Fig.3 geeft een voorbeeld. De grondfrequentie is in dit geval 100 Hz. De sterkte van de componenten neemt af met 12 dB per octaaf .
Het basisgeluid dat door de stembanden wordt geproduceerd ondergaat een akoestische bewerking in het ‘kauwapparaat’, in de experimentele fonetiek ‘aanzetstuk’ genoemd. De akoestische bewerking is afhankelijk van de stand van de verschillende onderdelen van het aanzetstuk, zoals de tong, de onderkaak, het palatum en het velum . Spraak kan men dus definiëren als het ‘akoestisch eindpunt van de samengestelde bewegingen van het ademhalings- en kauwapparaat’. In het vervolg van dit hoofdstuk wordt nader ingegaan op de vorming van het basisgeluid en vervolgens op de bewerkingen van dit basisgeluid in het aanzetstuk.
10.1.2.2(2). Ademhalingsspieren en stembanden
De ademhalingsspieren vormen de energiebron voor de productie van spraak. Bij het inademen worden de borstkas vergroot en het middenrif verlaagd en stroomt er lucht in de longen. Wanneer vervolgens de stembanden (de ‘glottis’) gesloten worden en de borstkas verkleind, neemt de druk van de lucht in de longen toe.
Op een gegeven moment is de druk van de lucht direct onder de stembanden (de ‘subglottische druk’) zo groot dat de stembanden zijwaarts uitwijken en een beetje lucht doorlaten. De subglottische druk neemt hierdoor af en de stembanden sluiten zich weer. Daarna begint het proces opnieuw. Er worden dus in deze situatie, wanneer ‘met stem’ gesproken wordt, repeterend ‘plofjes’ lucht doorgelaten. De herhalingsfrequentie varieert van rond de 250 (tussen de 200 en 300) plofjes per seconde voor vrouwen tot 125 (tussen 80 en 200) per seconde voor mannen. De periodeduren T (Fig.2) zijn dus respectievelijk 4 en 8 ms. De subglottische druk bedraagt 4 cm water voor de vorming van ‘zachte’klinkers en 20 cm water voor het hard uitspreken van hoge klinkers.
De stembanden bevinden zich in het strottenhoofd. Dit is afgebeeld in Fig.4. De stembanden lopen van de binnenvoorkant van het ringvormige schildkraakbeen naar de arytenoïden op de achterkant daarvan. De bekervormige kraakbeentjes kunnen van elkaar af en naar elkaar toe bewegen over de bovenachterkant van het ringvormige kraakbeen en bovendien draaien om een verticale as. De verschillende bewegingen worden bestuurd door een aantal spiertjes. Het geheel leidt ertoe dat de stembanden verschillende standen kunnen innemen, afhankelijk van hun specifieke functie. Fig.5 illustreert dit.
De stembanden zijn in feite twee spierbandjes. Bij het ademhalen staan ze van achteren open en vormen ze dus een driehoek. Bij sommige vormen van fluisteren liggen ze tegen elkaar aan, maar wijken de arytenoïden uit elkaar en wordt de ‘fluisterdriehoek’ gevormd. Bij het stemgeven worden ze gesloten, maar laten ze periodiek kleine beetjes lucht ontsnappen (de ‘plofjes’, zoals hiervoor beschreven) wanneer de subglottische druk te hoog wordt.
De hoogte van de stem wordt bepaald door de herhalingsfrequentie van de ‘plofjes’. Dat zijn er gemiddeld 250 per seconde voor vrouwen en 125 per seconde voor mannen. Deze hoogte van de stem kan op drie manieren worden aangepast. Bij de eerste manier wordt de spanning in de stembanden vergroot. Immers, een grotere spanning in een snaar leidt tot een hogere klank. Bij de tweede mogelijkheid wordt met de ademhalingsspieren de inhoud van de borstkas verkleind. Een verkleining van die inhoud leidt tot een vergroting van de subglottische druk en dus weer tot een hoger stemgeluid. Tenslotte wordt in het lichtste register van de mannenstem, het falsetregister, de productie van de ijl en week klinkende hoge ‘falsettonen’ bereikt door de fors afnemende massa van de stembanden. In dat geval trilt slechts een klein (mediaal) deel van de stembanden.
Het basisgeluid is ‘stemhebbend’ wanneer de stembanden trillen, maar kan ook ‘stemloos’ zijn wanneer ze enigszins open staan en lucht doorlaten. Deze twee typen basisgeluid leveren het verschil tussen stemhebbende medeklinkers zoals de /v/ en stemloze klanken zoals de /f/. De klinkers zijn, althans wanneer er niet gefluisterd wordt, stemhebbend.
Fig.2 liet zien dat het – stemhebbende – basisgeluid periodiek is en de vorm van een zaagtand heeft. Dit betekent dat het spectrum ervan bestaat uit een grondtoon en een reeks boventonen. De frequentie van de grondtoon is gemiddeld 250 Hz voor vrouwen en 125 Hz voor mannen. De sterkte van de boventonen (hogere harmonischen) neemt met 12 dB per octaaf af, althans wanneer het basisgeluid direct boven de stembanden wordt gemeten. Het basisgeluid is dus een ‘breedbandig’ geluid. Dit geldt ook wanneer het basisgeluid wordt gevormd door ruis, zoals bij fluisteren. Dat basisgeluid heeft dan uiteraard geen periodiek karakter. Het breedbandige basisgeluid ondergaat in het aanzetstuk bewerkingen, zowel spectraal (onderdrukking van frequentiegebieden) als temporeel (introductie van pauzes en afwisseling van stemhebbend geluid met stemloos geluid). Deze bewerkingen worden in de volgende paragraaf besproken.
10.1.2.3(2). Beschrijving van de rol van het aanzetstuk – Akoestische en articulatorische fonetiek
Het aanzetstuk is een akoestische buis die begint bij de stembanden en via de keelholte en de mond bij de lippen eindigt. De neusholte maakt eveneens deel uit van het aanzetstuk, want het basisgeluid kan ook via deze weg naar buiten komen. Dit gebeurt wanneer men ‘nasale’ klanken produceert. Bij de bespreking van de rol van het aanzetstuk in dit hoofdstuk laten we de rol van de neusholte echter buiten beschouwing.
In het aanzetstuk, afgebeeld in Fig.6, bevinden zich verschillende onderdelen zoals het ‘palatum’ (harde verhemelte), het ‘velum’ (zachte verhemelte), de tong en de lippen. De grootte en de vorm van het aanzetstuk kunnen op allerlei manieren gewijzigd worden, bijvoorbeeld door het strottenhoofd omhoog of omlaag te brengen, door de onderkaak te laten zakken, door met de tong op een bepaalde plaats een ‘bult’ te maken en door de lippen naar voren te steken. De verschillende spraakklanken komen tot stand door verschillende configuraties van het aanzetstuk. De meest elementaire spraakklanken zijn de fonemen. Een foneem is een spraakklank die, bij verwisseling met een andere spraakklank, een woord een andere betekenis geeft. Het gaat daarbij niet om de individuele uitspraak of om de schriftelijke weergave, maar om de ‘verzameling van uitspraken’ van de betreffende klank.
De fonemen worden genoteerd als /klinker/ en /medeklinker/. Tabel I geeft de symbolen die worden gebruikt voor de klinkers en Tabel II die voor de medeklinkers.
/i/ | biet | /e/ | beek | /o/ | boot | /a/ | baas | /y/ | buut | /u/ | boek |
/I/ | bit | /ɛ/ | bed | /ɔ/ | bot | /ɑ/ | bad | /œ/ | bus | /ø/ | beuk |
/ə/ | de |
Tabel I. De fonetische notatie van de klinkers (willekeurige volgorde).
/p/ | peer | /b/ | boek | /t/ | taal | /d/ | deur | /k/ | kaal | /m/ | meel |
/n/ | nood | /f/ | fijn | /v/ | veel | /s/ | soep | /z/ | zaal | /l/ | laat |
/r/ | riet | /R/ | riet | /j/ | jas | /h/ | hoed | ||||
/c/ | matje | /χ/ | lach | /ʃ/ | huisje | /ɳ/ | hang | /ɲ/ | oranje | /ʋ/ | wij |
Tabel II. De fonetische notatie van de medeklinkers (willekeurige volgorde).
Op dit punt aangekomen zijn er twee mogelijkheden om de vorming van de verschillende elementaire spraakklanken te beschrijven. De eerste is een fysische en sterk modelmatige benadering. Deze methode wordt toegepast in de ‘akoestische fonetiek’ en is uitermate geschikt om de vorming van de klinkers te beschrijven. De tweede methode is beschrijvend (fenomenologisch) van aard en geeft de relatie tussen de posities van de verschillende onderdelen van het aanzetstuk (de ‘articulatoren’) en de spraakklanken. Deze beschrijving noemt men ‘articulatorische fonetiek’. In Hfdst.10.1.1 en in Par.3 van dit hoofdstuk worden deze twee benaderingen met elkaar vergeleken.
10.1.2.4(2). Rol van het aanzetstuk – Fysische beschrijving van de vorming van de klinkers
Een goed inzicht in de vorming van de klinkers wordt verkregen wanneer men het aanzetstuk (de mond- en keelholte) opvat als een stelsel van twee of méér – gekoppelde – resonatoren, dus als een aaneenschakeling van stukken pijp van verschillende diameter, elk met een eigen resonantiefrequentie. De eenvoudigste benadering wordt verkregen wanneer men gebruik maakt van twee stukken pijp. Die representeren het aanzetstuk dat door de tongbult in tweeën verdeeld wordt. De tongbult kan naar voren en naar achteren geplaatst zijn, maar ook omhoog en omlaag. Fig.7 laat dit voor een drietal Nederlandse klinkers zien. De vorm en grootte van de twee ‘holtes’, dus van het tweetal resonatoren, varieert van klinker tot klinker. Dit systeem van resonatoren werkt als een akoestisch filter voor het basisgeluid. Bepaalde delen van het spectrum worden goed doorgelaten en andere minder.
De gebieden in het spectrum waar zich maxima bevinden heten ‘formanten’, met F1 als laagste formantfrequentie, vervolgens F2, F3, etc. Een model met meer opeenvolgende stukken pijp zal meer formantfrequenties aanreiken en de situatie nauwkeuriger beschrijven. Het resultaat van het filterproces is geïllustreerd in Fig.8, voor drie formanten F1, F2 en F3. De theorie heet de ‘filtertheorie’ van Von Helmholtz.
Naarmate de grondtoon in het basisgeluid lager is, liggen de boventonen in het spectrum dichter bij elkaar en zijn de formanten beter gedefinieerd. In de praktijk worden de vierde en hogere formanten niet in de beschouwingen betrokken, omdat het frequentie-analyserend vermogen van onze oren boven de 2000 Hz niet meer in staat is deze afzonderlijk te detecteren. De combinatie van F1 en F2 is geheel bepalend voor de klinker die gehoord wordt. Het maakt daarbij niet uit wat het basisgeluid is, ruis (fluisteren) of stem (hoog of laag).
Men kan de indeling van de klinkers visualiseren door voor elke klinker de formantfrequenties F1en F2 uit te zetten in een grafiek, met langs de horizontale as de F2 en langs de verticale as de F1. Men krijgt dan de ‘klinkerdriehoek’ (Fig.9).
Fig.9 laat deze zien voor 12 Nederlandse klinkers uitgesproken door mannen (gemiddeld over 50 personen) en Fig.10 diezelfde klinkers uitgesproken door vrouwen (gemiddeld over 25 personen). Het valt op dat de klinkerdriehoek voor vrouwen groter is dan die voor mannen. Dit komt doordat het aanzetstuk voor vrouwen gemiddeld kleiner is dan voor mannen. De formantfrequenties zijn daarmee hoger. De volgordes voor vrouwen en mannen zijn echter grotendeels gelijk.
Een vaak gebruikte methode om de fysische eigenschappen van een spraakgeluid weer te geven is het spectrum ervan uit te zetten tegen de tijd. Men noemt dit een ‘spectrogram’ (combinatie van spectrum en oscillogram). Een voorbeeld is te zien in Fig.11. Het voordeel van deze weergave is dat men het verloop van formanten in de tijd, bij tweeklanken, kan registreren en de mate waarin een beginmedeklinker de ligging van de formanten beïnvloedt.
In Fig.11 is nog net de verticale strepenstructuur van de individuele plofjes te zien. In dit geval is het analysefilter niet smal genoeg om de individuele boventonen zichtbaar te maken. De sterkte van de formanten wordt aangegeven door de mate van zwarting in de figuren. Vaak worden de zwarte banden gestileerd weergegeven.
10.1.2.5(2). Rol van het aanzetstuk – Fysische beschrijving van de vorming van de medeklinkers
De medeklinkers hebben ‘van huis uit’ een ruisachtig bronsignaal. Ze worden pas stemhebbend door een koppeling met een erop volgende klinker, zoals de /b/ in ‘boot’. Het breedbandige en niet-periodieke bronsignaal wordt – net zoals bij de vorming van de klinkers – spectraal en temporeel gemodelleerd door het aanzetstuk. Het verschil tussen bijvoorbeeld enerzijds de /f/ en de /p/ en anderzijds de /s/ en de /t/ komt grotendeels tot stand doordat in het eerste geval een vernauwing wordt aangebracht in de mondopening en in het tweede geval iets meer naar achteren, door de tong dicht bij de tanden te houden. Bij de /χ/ (zoals in ‘lach’) en de /k/ bevindt de vernauwing zich het meest naar achteren. Bij de plofklanken /p/, /t/ en /k/ komt de vernauwing op de betreffende plaatsen tot stand onmiddellijk na een volledige afsluiting aldaar. De specifieke vorm van het spraakkanaal in de genoemde drie gevallen leidt tot specifieke resonanties in het hoogfrequente deel van het ruisspectrum. In Fig.12 zijn, voor drie goed aan te houden medeklinkers /χ/, /f/ en /s/, zowel de vormen van het aanzetstuk als de spectra afgebeeld. Men kan zich voorstellen dat een grote holte in de mond, zoals bij de /χ/, een lagere resonantiefrequentie levert (rond de 1500 Hz) dan een kleinere holte zoals bij de /s/ (5000 Hz).
Duidelijk is de bij de /χ/ de laagfrequente band te zien, zoals in het voorafgaande beschreven. Voor de corresponderende plofklanken, respectievelijk /p/, /t/ en /k/, zal het beeld hetzelfde zijn, maar binnen de beperkte duur van de klanken.
De kennis van de akoestische eigenschappen van de klinkers en de medeklinkers is van groot belang voor het begrijpen waarom slechthorenden en doven bepaalde klanken wel of niet kunnen herkennen. Dit onderwerp wordt in Hfdst.10.2.1 verder besproken.
10.1.2.6(2). Links
http://www.phil.uu.nl/tst/2012/Slides/Spraakakoestiek.pdf (College Fonetiek van de Inleiding Taalwetenschap door Gerrit Bloothooft (Universiteit Utrecht).
10.1.2.7(2). Verwijzingen
Bij het schrijven van dit hoofdstuk is dankbaar gebruik gemaakt van het boek ‘Spreken en verstaan’ door Nooteboom en Cohen (1995).
Auteur
Lamoré
Revisie
november 2012