8.2.6.1(2). Inleiding
Bij een onderzoek dat in het kader van een screening plaats vindt, gaat het om de vraag of de ziekte waar de screening op gericht is mogelijk aanwezig is bij het betreffende individu. Een screeningsonderzoek is dus geen – op een individuele patiënt gericht – diagnostisch onderzoek, waarbij het doel is het vaststellen van de betreffende ziekte. Het fundamentele verschil tussen deze twee typen onderzoeken moet goed in het oog worden gehouden.
Het opsporen – via een screening – van de mogelijke aanwezigheid van een ziekte brengt een aantal onzekerheden met zich mee. De uitkomst van de test kan positief of negatief zijn. Bij een positieve uitkomst hoeft de ziekte niet aanwezig te zijn. Bij een negatieve uitkomst kan de ziekte wel degelijk wél aanwezig zijn. Een en ander hangt af van de nauwkeurigheid van de test en van de mate van voorkomen van de ziekte in de betreffende groep.
Het probleem van de correlatie tussen testuitkomst en aanwezigheid van een ziekte treedt ook wel op bij een diagnostisch onderzoek, maar daar worden andere eisen gesteld aan de tests en spelen de klachten van de patiënt een veel grotere rol. Wij concentreren ons hier op het onderwerp screening.
De vraag – in het licht van bovenstaande – is hoe goed een screening is. De onzekerheden in de uitkomst zijn van belang voor wat men het individu over de uitkomst meedeelt. Te veel vals positieven veroorzaken in eerste instantie onrust en ondergraven de geloofwaardigheid van de screening. Wanneer een ziekte nauwelijks vóórkomt heeft screening weinig zin.
Voor de beschrijving van het gedrag van de verschillende hierboven aangeduide variabelen en van de onzekerheden in de uitkomsten is een theorie beschikbaar. In het vervolg van dit hoofdstuk wordt deze besproken en worden enkele voorbeelden gegeven.
8.2.6.2(2). Begrippen en definities
We beginnen met invoeren van enkele begrippen en hun definitie. De ‘prevalentie’ (of ‘prevalence rate’) van een ziekte of aandoening is het percentage individuen bij wie, in een gegeven populatie en op een bepaald moment, de ziekte aanwezig is.
Om de hierna volgende definities overzichtelijk te houden gaan we uit van de volgende matrix (Tabel I):
Ziekte aanwezig | Ziekte afwezig | |
Testuitkomst positief | ‘correct positief’ | ‘vals positief’ |
Testuitkomst negatief | ‘vals negatief’ | ‘correct negatief’ |
Tabel I.
Uiteraard dient de som van de getallen in elke rij en elke kolom, indien uitgedrukt in percentages, gelijk aan 100 te zijn. Op basis van deze matrix worden de volgende begrippen gedefinieerd:
Sensitiviteit en specificiteit zijn ‘eigenschappen’ van de betreffende test. De termen geven aan wat de test doet bij al dan niet aanwezigheid van de ziekte. De sensitiviteit geeft aan hoe vaak de testuitkomst correct (positief) is bij aanwezigheid van de ziekte en de specificiteit geeft aan hoe vaak de uitkomst correct (negatief) is bij afwezigheid van de ziekte. Vervolgens:
De positieve voorspellende waarde (‘predictieve waarde’) geeft dus de kans dat bij een positieve testuitkomst de ziekte inderdaad aanwezig is en de negatieve voorspellende waarde relateert een negatieve testuitkomst aan de afwezigheid van de ziekte. Het gaat hier dus om de kwaliteit van de beoordeling
De vier hierboven gedefinieerde grootheden en de prevalentie hebben een mathematisch verband via de regel van Bayes (niveau 3).
We geven nu enkele voorbeelden om een indruk te geven van de consequenties van bovenstaande definities. We gaan daarbij uit van een populatie van 10000 individuen en een prevalentie van 10%. De verondersteld – absolute – getallen zijn weergegeven in een matrix, in Tabel II.
Ziekte aanwezig | Ziekte afwezig | Totaal | |
Testuitkomst positief | 900 | 900 | 1800 |
Testuitkomst negatief | 100 | 8100 | 8200 |
Totaal | 1000 | 9000 | 10000 |
Tabel II. Prevalentie 10%
In dit voorbeeld is de sensitiviteit van de test 90% (900/1000 – de linker kolom) en de specificiteit 90% (8100/9000 – de rechter kolom). De (positieve) voorspellende waarde is 50% en er zijn 900 vals positieven (9% van de hele populatie).
Berekenen we nu de voorspellende waarde bij dezelfde sensitiviteit en specificiteit van de test, maar bij een prevalentie van de ziekte van 0.1% (Tabel III), dan vinden we een (positieve) voorspellende waarde van 0.9% een aantal van 999 vals positieven (10% van de hele populatie).
Ziekte aanwezig | Ziekte afwezig | Totaal | |
Testuitkomst positief | 9 | 999 | 1008 |
Testuitkomst negatief | 1 | 8991 | 8992 |
Totaal | 10 | 9990 | 10000 |
Tabel III. Prevalentie 0.1%
Het is duidelijk dat de voorspellende waarde van een test sterk afhankelijk is van de prevalentie van de ziekte waar de screening op gericht is. In het laatste geval worden 1008 individuen doorverwezen voor verder onderzoek, terwijl er bij 999 van hen (99%) geen ziekte aanwezig is.
We berekenen nu de uitkomst voor een herhaling van de test, bij de 1008 individuen met een positieve uitkomst bij de eerste test. De voorspellende waarde is nu 7%, maar er zijn nog altijd 100 vals positieven. Zie Tabel IV.
Ziekte aanwezig | Ziekte afwezig | Totaal | |
Testuitkomst positief | 8 | 100 | 108 |
Testuitkomst negatief | 1 | 899 | 900 |
Totaal | 9 | 999 | 1008 |
Tabel IV. Herhaling van de test bij individuen met positieve uitkomst van de test
Vervolgens kijken we welke winst er te behalen valt uit het opvoeren van de kwaliteit van de test. We kiezen nu een sensitiviteit en specificiteit van 99% bij weer een prevalentie van 0.1%.
Ziekte aanwezig | Ziekte afwezig | Totaal | |
Testuitkomst positief | 10 | 100 | 110 |
Testuitkomst negatief | 0 | 9890 | 9890 |
Totaal | 10 | 9990 | 10000 |
Tabel V. Prevalentie 0.1%
We vinden dan een voorspellende waarde van 9% en een aantal van 100 vals positieven (1% van de populatie). Vergelijken we deze uitkomst met de in Tabel III gepresenteerde dan zien we dat vergroting van de kwaliteit van de test niet alleen de voorspellende waarde van de screening doet toenemen, maar ook het aantal vals positieven doet afnemen. Maar ook een test met bijna 100% sensitiviteit en specificiteit levert in deze – relatief beperkte – populatie nog 100 vals positieven op. De tabellen laten ook zien dat het in een enkel geval voorkomt dat een individu goed uit de test komt terwijl de ziekte wel aanwezig is.
De lezer kan zelf narekenen dat een test met een – theoretische – sensitiviteit van 100% alle ‘ziektegevallen’ detecteert, maar dat wel ten koste van veel vals positieven (matige predictieve waarde). Anderzijds levert een test met een maximale specificiteit geen vals positieven, maar wel veel gevallen waarbij, ondanks een negatieve test, de ziekte wel aanwezig is.
8.2.6.3(2). Screening van het gehoor
We passen de boven beschreven regels nu toe op een screening van het gehoor bij zeer jonge kinderen.
Uit de gegeven voorbeelden zal duidelijk geworden zijn dat de prevalentie van een ziekte grote invloed heeft op de voorspellende waarde van de betreffende screening en op het aantal vals positieven wat daarbij optreedt. Het maakt in de praktijk veel uit of de screening van het gehoor gericht is op alle pasgeborenen of alleen op een risicogroep, zoals de NICU kinderen. Een goede screening vereist een schatting van de prevalentie van gehoorverliezen.
Verder moet een keuze gemaakt worden betreffende de aard en omvang van de gezochte gehoorverliezen waar de screening zich op richt:
- Een tweezijdig of eenzijdig gehoorverlies
- Een perceptief (al dan niet gemengd) gehoorverlies of een conductief gehoorverlies
- De grootte van het gehoorverlies (matig, ernstig, zeer ernstig)
In Nederland wordt als prevalentie van tweezijdige ernstige slechthorendheid in een gezonde populatie pasgeborenen 0.1% aangehouden (Hfdst.8.2.3). Voor de NICU kinderen geldt een prevalentie van 1.7%, eveneens voor bilateraal gehoorverlies. Uiteraard is het percentage sterk afhankelijk van de ‘definitie’ van ernstige slechthorendheid en is er enige variatie in de gevonden of geschatte prevalenties in de verschillende onderzoeken
Bij een screening dient niet alleen de prevalentie van gehoorverliezen bekend te zijn, al dan niet op basis van een schatting, maar ook dient er een indicatie te zijn van de sensitiviteit en specificiteit van de gebruikte test(s). De getallen hiervoor in de literatuur lopen nogal uiteen en zijn afhankelijk van de (risico)groep waarbinnen de screening uitgevoerd wordt. Voor een screening met een BERA in een niet-risicogroep kan uitgegaan worden van een sensitiviteit van 80% en een specificiteit van 95% voor bilateraal gehoorverlies. Voor een screening met TEOAE’s in dezelfde groep en op bilaterale verliezen worden deze getallen respectievelijk 80% en 90%. Op basis van deze getallen kan de lezer zelf een berekening maken en een indruk krijgen van de betrouwbaarheid en de consequenties van een positieve testuitkomst.
Er dient op gelet te worden dat de uitkomsten van een screening van het gehoor beïnvloed worden door een – op een bepaalde schaal – aanwezigheid van middenoorproblemen bij de kinderen in de betreffende groep. Tenslotte maken de gegeven voorbeelden duidelijk dat het altijd mogelijk is dat een kind met een significant gehoorverlies goed door de screening heen komt, zelfs in een risicogroep.
Slotopmerking: Voor de sensitiviteit en specificiteit van de AABR test in een niet-risicogroep wordt in dit hoofdstuk uitgegaan van waarden van respectievelijk 80% en 95%. In Hfdst.8.2.3 wordt uitgegaan van een range van 90 – 99.7% voor de sensitiviteit en een range van 93 – 97% voor de specificiteit. Van de TEOAE test zijn vooralsnog geen gegevens over de sensitiviteit en specificiteit beschikbaar. Gegevens hierover zullen in volgende versies van de twee hoofdstukken geplaatst worden (en op elkaar afgestemd).
8.2.6.4(2). Links
general information about data sources – informatie over begrippen in de statistiek
http://nl.wikipedia.org/wiki/Odds_ratio
Literatuur
Een zeer instructief artikel over het onderwerp van dit hoofdstuk is:
Stein LK. Factors influencing the efficacy of universal newborn hearing screening. The Pediatric Clinics of North America 1999; 46: 95-105.
Het onderwerp wordt – aan de hand van een kritische evaluatie van de SISI test – eveneens uitvoerig behandeld in: Lamoré PJJ, Rodenburg M. Significance of the SISI test and its relation to recruitment. Audiology 1980; 19: 75-85.
Overige literatuur
- American Academy of Pediatrics, Joint Committee on Infant Hearing 1994 Position Statement. Pediatrics 95, 1995
- Berlin CI: Role of infant hearing screening in health care. Seminars in Hearing 7(2):115-124, 1996
- Berlin CI, Hood LJ, Hurley A, et al: Contralateral suppression of otoacoustic emissions: An index of the function of the Medial Olivocochlear System. Otolaryngol Head Surg 110(1):3-21, 1994
- Bess FH, Paradise JL: Universal screening for infants screening: not simple, not necessarily beneficial, and not presently justified. Pediatrics 98(2):330-334, 1994
- Cevette MJ: Auditorv brainstem response testing in the intensive care unit. Semin Hear 5:57-68, 1984
- Davis A, Wood S: The epidemiology of childhood hearing impairment Factors relevant to planning of services. Br J Audiol 26:209-215, 1992
- Elssmann S, Matkin N, Sabo M: Early identification of congenital sensorineural hearing impairment. Hear J 40(9):13-17,1987
- Galambos R, Wilson Mj, Silva P: Identifying hearing loss in the intensive care nursery: A 20-year summary. J Am Acad Audiol 5:151-162,1994
- Haves D, Northern JL (eds): Infants and Hearing. San Diego, Singular Publishing Group, 1998
- Jacobson JT, Jacobson CA, Spahr RC: Automated and conventional ABR screening techniques in high-risk infants. J Am Acad Audiol 1:187-195, 1990
- Lutman ME, Davis AC, Fortnum HNI: Field sensitivity of targeted neonatal hearing screening by transient-evoked otoacoustic emissions. Ear Hear 18(4):265-276, 1997
- Mason JA, Herrmann KR: Universal infant hearing screening by automated auditory brainstem response measurement. Pediatrics 101(2):221-228, 1998
- Mason S, Davis A, Wood S: Field sensitivity of targeted neonatal hearing screening using the Nottingham ABR screener. Ear Hear 19(2):91-102, 1998
- Mauk G, White K: Giving children a sound beginning: The promise of universal newborn screening. Volta Rev 97:5-32, 1995
- Maxon AB, White K, Behrens T: Referral rates and cost efficiency in a universal newborn hearing screening program using transient otoacoustic emissions. J Am Acad Audiol 6:271-277, 1995
- McClelland RJ, Watson DR, Lawless V, et at: The cost effectiveness of hearing screening. Electroencephalogr Clin Nettrophvsiol 86:35P, 1993
- Mehl AL, Thomson V: Newborn hearing screening: The great omission. Pediatrics 101(l):4, 1998
- National Institutes of Health: Consensus Statement: Early Identification of Hearing Impairment in Infants and Young Children, National Institutes of Health Consensus Development Conference Statement. Bethesda, MD, NIH, 1993, pp 1-24
- Schulman-Galambos C, Galambos R: Brainstem evoked response audiometry in newborn hearing screening. Arch Otolaryngol 105:86, 1979
- Simmons FB: Patterns of deafness in newborns. Laryngoscope 90:448, 1980
- Starr A, McPherson D, Patterson, et al: Absence of both auditory evoked potentials and auditory percepts dependent on timing cues. Brain 114:1154-1180, 1991
- Starr A, Picton T, Sinninger Y.- Auditory neuropathy. Brain 119:741-753, 1996
- Stein LK, Boyer KM: Progress in the prevention of hearing loss in infants. Ear Hear 15(2):116-125, 1994
- Stein LK, Jabaley T, Spitz R, et al: The hearing impaired infant: Patterns of identification and habilitation revisited. Ear Hear 11:201-205, 1990
- Stein LK, McGee T, Tremblay K, et al: Auditory neuropathy associated with elevated bilirubin levels. Assoc Res Otolarngol Abstr p 208, 1997
- Stein LK, Ozdamar O, Kraus N: Follow-up of infants screened by auditory brainstem response in the neonatal intensive care unit. J Pediatr 103(3):447, 1983
- Stein LK, Tremblay K, Pasternak J, et al: Brainstem abnormalities in neonates with normal otoacoustic emissions. Semin Hear 17(2):197-213, 1996
- Stevens JC, Webb HD, Hutchinson J, et al: Click evoked otoacoustic emissions in neonatal screening. Ear Hear 11(2):128-133, 1990
- van de Bor M, van Zeben-van der Aa T, Verloove-Vanhorick S, et al: Hyperbilirubinemia in preterm infants and neurodevelopmental outcome at 2 years of age: Results of a national collaborative survey. Pediatrics 83:915-920, 1989
- Vohr B: New approaches to assessing the risks of hyperbilirubinemia. Clin Perinatol 17:293-306, 1990
- White KR: Universal newborn hearing screening using transient evoked otoacoustic emissions: Past, present, and future. Semin Hear 17(2):171-183, 1996
- White KR, Behrens T (eds): The Rhode Island Hearing Assessment project: Implications for Universal Newborn Hearing Screening. Semin Hear 14:1-122, 1993.
Auteur
Lamoré
Revisie
december 2012