Audiologieboek
Home  |   NVA  |   Print deze pagina  |    |     
 Titel: 8.2.6(2). Screening – Statistische aspecten
 Auteur: Lamoré
 Revisie: december 2012

Inhoud:

8.2.6.1(2). Inleiding

8.2.6.2(2). Begrippen en definities

8.2.6.3(2). Screening van het gehoor

8.2.6.4(2). Links


 

8.2.6.1(2). Inleiding

Bij een onderzoek dat in het kader van een screening plaats vindt, gaat het om de vraag of de ziekte waar de screening op gericht is mogelijk aanwezig is bij het betreffende individu. Een screeningsonderzoek is dus geen – op een individuele patiënt gericht - diagnostisch onderzoek, waarbij het doel is het vaststellen van de betreffende ziekte. Het fundamentele verschil tussen deze twee typen onderzoeken moet goed in het oog worden gehouden.


Het opsporen – via een screening - van de mogelijke aanwezigheid van een ziekte brengt een aantal  onzekerheden met zich mee. De uitkomst van de test kan positief of negatief zijn. Bij een positieve uitkomst hoeft de ziekte niet aanwezig te zijn. Bij een negatieve uitkomst kan de ziekte wel degelijk wél aanwezig zijn. Een en ander hangt af van de nauwkeurigheid van de test en van de mate van voorkomen van de ziekte in de betreffende groep.


Het probleem van de correlatie tussen testuitkomst en aanwezigheid van een ziekte treedt ook wel op bij een diagnostisch onderzoek, maar daar worden andere eisen gesteld aan de tests en spelen de klachten van de patiënt een veel grotere rol. Wij concentreren ons hier op het onderwerp screening.


De vraag – in het licht van bovenstaande – is hoe goed een screening is. De onzekerheden in de uitkomst zijn van belang voor wat men het individu over de uitkomst meedeelt. Te veel vals positieven veroorzaken in eerste instantie onrust en ondergraven de geloofwaardigheid van de screening. Wanneer een ziekte nauwelijks vóórkomt heeft screening weinig zin.


Voor de beschrijving van het gedrag van de verschillende hierboven aangeduide variabelen en van de onzekerheden in de uitkomsten is een theorie beschikbaar. In het vervolg van dit hoofdstuk wordt deze besproken en worden enkele voorbeelden gegeven.


 


8.2.6.2(2). Begrippen en definities

We beginnen met invoeren van enkele begrippen en hun definitie. De ‘prevalentie’ (of ‘prevalence rate’) van een ziekte of aandoening is het percentage individuen bij wie, in een gegeven populatie en op een bepaald moment, de ziekte aanwezig is.


Om de hierna volgende definities overzichtelijk te houden gaan we uit van de volgende matrix (Tabel I):


  Ziekte aanwezig Ziekte afwezig
Testuitkomst positief 'correct positief' 'vals positief'
Testuitkomst negatief 'vals negatief' 'correct negatief'

Tabel I.


Uiteraard dient de som van de getallen in elke rij en elke kolom, indien uitgedrukt in percentages, gelijk aan 100 te zijn. Op basis van deze matrix worden de volgende begrippen gedefinieerd:



 



Sensitiviteit en specificiteit zijn ‘eigenschappen’ van de betreffende test. De termen geven aan wat de test doet bij al dan niet aanwezigheid van de ziekte. De sensitiviteit geeft aan hoe vaak de testuitkomst correct (positief) is bij aanwezigheid van de ziekte en de specificiteit geeft aan hoe vaak de uitkomst correct (negatief) is bij afwezigheid van de ziekte. Vervolgens:



 



De positieve voorspellende waarde (‘predictieve waarde’) geeft dus de kans dat bij een positieve testuitkomst de ziekte inderdaad aanwezig is en de negatieve voorspellende waarde relateert een negatieve testuitkomst aan de afwezigheid van de ziekte. Het gaat hier dus om de kwaliteit van de beoordeling


De vier hierboven gedefinieerde grootheden en de prevalentie hebben een mathematisch verband via de regel van Bayes (niveau 3).


We geven nu enkele voorbeelden om een indruk te geven van de consequenties van bovenstaande definities. We gaan daarbij uit van een populatie van 10000 individuen en een prevalentie van 10%. De verondersteld – absolute – getallen zijn weergegeven in een matrix, in Tabel II.


  Ziekte aanwezig Ziekte afwezig Totaal
Testuitkomst positief 900 900 1800
Testuitkomst negatief 100 8100 8200
Totaal 1000 9000 10000

Tabel II. Prevalentie 10%


In dit voorbeeld is de sensitiviteit van de test 90% (900/1000 - de linker kolom) en de specificiteit 90% (8100/9000 - de rechter kolom). De (positieve) voorspellende waarde is 50% en er zijn 900 vals positieven (9% van de hele populatie).


Berekenen we nu de voorspellende waarde bij dezelfde sensitiviteit en specificiteit van de test, maar bij een prevalentie van de ziekte van 0.1% (Tabel III), dan vinden we een (positieve) voorspellende waarde van 0.9% een aantal van 999 vals positieven (10% van de hele populatie).


  Ziekte aanwezig Ziekte afwezig Totaal
Testuitkomst positief 9 999 1008
Testuitkomst negatief 1 8991 8992
Totaal 10 9990 10000

Tabel III. Prevalentie 0.1%


Het is duidelijk dat de voorspellende waarde van een test sterk afhankelijk is van de prevalentie van de ziekte waar de screening op gericht is. In het laatste geval worden 1008 individuen doorverwezen voor verder onderzoek, terwijl er bij 999 van hen (99%) geen ziekte aanwezig is.


We berekenen nu de uitkomst voor een herhaling van de test, bij de 1008 individuen met een positieve uitkomst bij de eerste test. De voorspellende waarde is nu 7%, maar er zijn nog altijd 100 vals positieven. Zie Tabel IV.


  Ziekte aanwezig Ziekte afwezig Totaal
Testuitkomst positief 8 100 108
Testuitkomst negatief 1 899 900
Totaal 9 999 1008

Tabel IV. Herhaling van de test bij individuen met positieve uitkomst van de test


Vervolgens kijken we welke winst er te behalen valt uit het opvoeren van de kwaliteit van de test. We kiezen nu een sensitiviteit en specificiteit van 99% bij weer een prevalentie van 0.1%.


  Ziekte aanwezig Ziekte afwezig Totaal
Testuitkomst positief 10 100 110
Testuitkomst negatief 0 9890 9890
Totaal 10 9990 10000

Tabel V. Prevalentie 0.1%


We vinden dan een voorspellende waarde van 9% en een aantal van 100 vals positieven (1% van de populatie). Vergelijken we deze uitkomst met de in Tabel III gepresenteerde dan zien we dat vergroting van de kwaliteit van de test niet alleen de voorspellende waarde van de screening doet toenemen, maar ook het aantal vals positieven doet afnemen. Maar ook een test met bijna 100% sensitiviteit en specificiteit levert in deze – relatief beperkte - populatie nog 100 vals positieven op. De tabellen laten ook zien dat het in een enkel geval voorkomt dat een individu goed uit de test komt terwijl de ziekte wel aanwezig is.


De lezer kan zelf narekenen dat een test met een – theoretische - sensitiviteit van 100% alle ‘ziektegevallen’ detecteert, maar dat wel ten koste van veel vals positieven (matige predictieve waarde). Anderzijds levert een test met een maximale specificiteit geen vals positieven, maar wel veel gevallen waarbij, ondanks een negatieve test, de ziekte wel aanwezig is.


 


8.2.6.3(2). Screening van het gehoor

We passen de boven beschreven regels nu toe op een screening van het gehoor bij zeer jonge kinderen.


Uit de gegeven voorbeelden zal duidelijk geworden zijn dat de prevalentie van een ziekte grote invloed heeft op de voorspellende waarde van de betreffende screening en op het aantal vals positieven wat daarbij optreedt. Het maakt in de praktijk veel uit of de screening van het gehoor gericht is op alle pasgeborenen of alleen op een risicogroep, zoals de NICU kinderen. Een goede screening vereist een schatting van de prevalentie van gehoorverliezen.


Verder moet een keuze gemaakt worden betreffende de aard en omvang van de gezochte gehoorverliezen waar de screening zich op richt:


  1. Een tweezijdig of eenzijdig gehoorverlies
  2. Een perceptief (al dan niet gemengd) gehoorverlies of een conductief gehoorverlies
  3. De grootte van het gehoorverlies (matig, ernstig, zeer ernstig)

In Nederland wordt als prevalentie van tweezijdige ernstige slechthorendheid in een gezonde populatie pasgeborenen 0.1% aangehouden (Hfdst.8.2.3). Voor de NICU kinderen geldt een prevalentie van 1.7%, eveneens voor bilateraal gehoorverlies. Uiteraard is het percentage sterk afhankelijk van de ‘definitie’ van ernstige slechthorendheid en is er enige variatie in de gevonden of geschatte prevalenties in de verschillende onderzoeken.


Bij een screening dient niet alleen de prevalentie van gehoorverliezen bekend te zijn, al dan niet op basis van een schatting, maar ook dient er een indicatie te zijn van de sensitiviteit en specificiteit van de gebruikte test(s). De getallen hiervoor in de literatuur lopen nogal uiteen en zijn afhankelijk van de (risico)groep waarbinnen de screening uitgevoerd wordt. Voor een screening met een BERA in een niet-risicogroep kan uitgegaan worden van een sensitiviteit van 80% en een specificiteit van 95% voor bilateraal gehoorverlies. Voor een screening met TEOAE’s in dezelfde groep en op bilaterale verliezen worden deze getallen respectievelijk 80% en 90%. Op basis van deze getallen kan de lezer zelf een berekening maken en een indruk krijgen van de betrouwbaarheid en de consequenties van een positieve testuitkomst.


Er dient op gelet te worden dat de uitkomsten van een screening van het gehoor beïnvloed worden door een – op een bepaalde schaal - aanwezigheid van middenoorproblemen bij de kinderen in de betreffende groep. Tenslotte maken de gegeven voorbeelden duidelijk dat het altijd mogelijk is dat een kind met een significant gehoorverlies goed door de screening heen komt, zelfs in een risicogroep.


Slotopmerking: Voor de sensitiviteit en specificiteit van de AABR test in een niet-risicogroep wordt in dit hoofdstuk uitgegaan van waarden van respectievelijk 80% en 95%. In Hfdst.8.2.3 wordt uitgegaan van een range van 90 - 99.7% voor de sensitiviteit en een range van 93 - 97% voor de specificiteit. Van de TEOAE test zijn vooralsnog geen gegevens over de sensitiviteit en specificiteit beschikbaar. Gegevens hierover zullen in volgende versies van de twee hoofdstukken geplaatst worden (en op elkaar afgestemd).


 


8.2.6.4(2). Links

general information about data sources – informatie over begrippen in de statistiek


http://nl.wikipedia.org/wiki/Odds_ratio


Inhoud:

8.2.6.1(3). De regel van Bayes

8.2.6.2(3). Casuïstiek


 

8.2.6.1(3). De regel van Bayes

De regel van Bayes geeft het verband tussen de volgende grootheden (voorwaardelijke kansen):


Prevalentie: P(Z+)
De kans dat de ziekte niet aanwezig is: P(Z–) = 1 – P(Z+)
Sensitiviteit: P(T+ | Z+)
Specificiteit: P(T– | Z–)
Voorspellende waarde positief P(Z+ | T+)
Voorspellende waarde negatief P(Z– | T–)



 


8.2.6.2(3). Casuïstiek

‘Veel afwijkingen plasbuis jonge Rotterdammers’ (uit Trouw van 23 december 2000)


In Rotterdam worden veel jongetjes geboren met een afwijking aan de urinebuis: 7 op de 1000, terwijl 2 'normaal' is.  Dat is gebleken uit onderzoek van het Academisch Ziekenhuis Rotterdam (AZR) bij 7292 pasgeborenen.


De plasbuis komt bij de baby.’s die de afwijking hebben niet in de top van de eikel uit, maar lager in de penis of in het scrotum.  De aandoening moet operatief worden verholpen.  Niet-geopereerde jongens kunnen later erectiestoornissen krijgen.


De oorzaken van het hoge aantal afwijkingen in Rotterdam zijn nog niet bekend.  Factoren die een rol zouden kunnen spelen zijn, voeding en werk van de ouders, de woonomgeving,, en blootstelling aan hormoonverstoorders. ‘Maar daar kunnen we nog geen uitspraak over doen’, aldus dr. R. Weber van de afdeling andrologie van het AZR. ‘Dat duurt nog zeker een jaar.’


Weber wijst erop dat hij de eerste is die in Nederland grootschalig onderzoek naar de afwijking aan de urinebuis doet. Het is mogelijk dat er geen oorzaak wordt gevonden. ‘Het feit dat er beter naar de aandoening is gekeken, kan ook de verklaring zijn voor het hogere aantal’, aldus Weber.  Dat er nu zulke grote aantallen aan het licht komen, kan dus komen doordat zoveel jongetjes zijn onderzocht.


‘Academici begrijpen kanspercentages niet’ (uit Trouw van 22 december 2000)


Statistiek ligt vaak aan de basis van belangrijke beslissingen. De meeste beslissers, zoals artsen en juristen, weten zich echter geen raad met kanspercentages.


Een man meldt zich bij zijn huisarts. Hij wil weten of hij seropositief is. Hij wil ook weten hoe betrouwbaar de test is: als de uitslag is dat hij met het aidsvirus is besmet, hoe zeker is dat dan?  De arts zet de percentages op een rijtje: de test is betrouwbaar, in 99.9 procent van de gevallen speurt hij het virus op, terwijl hij slechts bij 0,02 procent ten onrechte een besmetting meldt. ‘De uitslag is dus 99.9 procent zeker’, zegt de arts. ‘Maar maakt u zich geen zorgen. De kans dat u seropositief bent is slechts 0.01 procent.’


Hopelijk heeft de arts meer verstand van geneeskunde. Maar hij is niet de enige die van kanstheorie niet veel kaas heeft gegeten. De man stelde zijn aidsvraag in twintig Duitse klinieken: vijftien van de twintig artsen gaven het bovenstaande, foute antwoord.


Logisch, zeggen Duitse wetenschappers in Science van 22 december: als statistische informatie in percentages wordt gegeven, is het lastige materie. Het wordt een stuk eenvoudiger als de informatie in groepsgroottes wordt gegoten. Stel namelijk dat 100 000 mannen zich laten testen. Tien van hen (0.01 procent) zijn seropositief. Van de 99990 anderen zegt de test dat er twintig (0.02 procent) zijn besmet. Dertig mannen krijgen dus een positieve uitslag. De kans dat dát terecht is, is derhalve 33 procent (de betrouwbaarheid van 99.9 procent zegt alleen iets over de kansen vooraf; als er een positieve uitslag ligt, gaat het om de verhouding tussen terechte en onterechte uitslagen).


De Duitse wetenschappers hebben hun statistiekpuzzels zoals de aidstest aan allerlei academici voorgelegd en bijna iedereen ging met de percentages de mist in. En niet alleen artsen. Ook juristen werden erdoor beetgenomen, bijvoorbeeld door DNA-bewijs dat door fouten in het laboratorium aan zekerheid verliest.


Zet die percentages daarom om in groepsgroottes, adviseren de Duitsers en ze geven daarbij aan hoe: neem een grote groep, bepaal daarvan hoeveel personen de ziekte hebben en hoeveel van de overigen een fout-positieve uitslag krijgen en vergelijk de laatste twee groepen.  De proefpersonen in elk geval scoorden dan aanzienlijk beter met de puzzels.



Literatuur

Een zeer instructief artikel over het onderwerp van dit hoofdstuk is:

Stein LK. Factors influencing the efficacy of universal newborn hearing screening. The Pediatric Clinics of North America 1999; 46: 95-105.


Het onderwerp wordt – aan de hand van een kritische evaluatie van de SISI test - eveneens uitvoerig behandeld in: Lamoré PJJ, Rodenburg M. Significance of the SISI test and its relation to recruitment. Audiology 1980; 19: 75-85.


Overige literatuur

  1. American Academy of Pediatrics, Joint Committee on Infant Hearing 1994 Position Statement.  Pediatrics 95, 1995
  2. Berlin CI: Role of infant hearing screening in health care. Seminars in Hearing  7(2):115-124, 1996
  3. Berlin CI, Hood LJ, Hurley A, et al: Contralateral suppression of otoacoustic emissions: An index of the function of the Medial Olivocochlear System. Otolaryngol Head Surg 110(1):3-21, 1994
  4. Bess FH, Paradise JL: Universal screening for infants screening: not simple, not necessarily beneficial, and not presently justified.  Pediatrics 98(2):330-334, 1994
  5. Cevette MJ: Auditorv brainstem response testing in the intensive care unit. Semin Hear 5:57-68, 1984
  6. Davis A, Wood S: The epidemiology of childhood hearing impairment Factors relevant to planning of services. Br J Audiol 26:209-215, 1992
  7. Elssmann S, Matkin N, Sabo M: Early identification of congenital sensorineural hearing impairment.  Hear J 40(9):13-17,1987
  8. Galambos R, Wilson Mj, Silva P: Identifying hearing loss in the intensive care nursery: A 20-year summary.  J Am Acad Audiol 5:151-162,1994
  9. Haves D, Northern JL (eds): Infants and Hearing. San Diego, Singular Publishing Group, 1998
  10. Jacobson JT, Jacobson CA, Spahr RC: Automated and conventional ABR screening techniques in high-risk infants. J Am Acad Audiol 1:187-195, 1990
  11. Lutman ME, Davis AC, Fortnum HNI: Field sensitivity of targeted neonatal hearing screening by transient-evoked otoacoustic emissions.  Ear Hear 18(4):265-276, 1997
  12. Mason JA, Herrmann KR: Universal infant hearing screening by automated auditory brainstem response measurement.  Pediatrics 101(2):221-228, 1998
  13. Mason S, Davis A, Wood S: Field sensitivity of targeted neonatal hearing screening using the Nottingham ABR screener.  Ear Hear 19(2):91-102, 1998
  14. Mauk G, White K: Giving children a sound beginning: The promise of universal newborn screening. Volta Rev 97:5-32, 1995
  15. Maxon AB, White K, Behrens T: Referral rates and cost efficiency in a universal newborn hearing screening program using transient otoacoustic emissions. J Am Acad Audiol 6:271-277, 1995
  16. McClelland RJ, Watson DR, Lawless V, et at: The cost effectiveness of hearing screening.  Electroencephalogr Clin Nettrophvsiol 86:35P, 1993
  17. Mehl AL, Thomson V: Newborn hearing screening: The great omission.  Pediatrics 101(l):4, 1998
  18. National Institutes of Health: Consensus Statement: Early Identification of Hearing Impairment in Infants and Young Children, National Institutes of Health Consensus Development Conference Statement.  Bethesda, MD, NIH, 1993, pp 1-24
  19. Schulman-Galambos C, Galambos R: Brainstem evoked response audiometry in newborn hearing screening.  Arch Otolaryngol 105:86, 1979
  20. Simmons FB: Patterns of deafness in newborns.  Laryngoscope 90:448, 1980
  21. Starr A, McPherson D, Patterson, et al: Absence of both auditory evoked potentials and auditory percepts dependent on timing cues.  Brain 114:1154-1180, 1991
  22. Starr A, Picton T, Sinninger Y.- Auditory neuropathy.  Brain 119:741-753, 1996
  23. Stein LK, Boyer KM: Progress in the prevention of hearing loss in infants.  Ear Hear 15(2):116-125, 1994
  24. Stein LK, Jabaley T, Spitz R, et al: The hearing impaired infant: Patterns of identification and habilitation revisited.  Ear Hear 11:201-205, 1990
  25. Stein LK, McGee T, Tremblay K, et al: Auditory neuropathy associated with elevated bilirubin levels.  Assoc Res Otolarngol Abstr p 208, 1997
  26. Stein LK, Ozdamar O, Kraus N: Follow-up of infants screened by auditory brainstem response in the neonatal intensive care unit. J Pediatr 103(3):447, 1983
  27. Stein LK, Tremblay K, Pasternak J, et al: Brainstem abnormalities in neonates with normal otoacoustic emissions.  Semin Hear 17(2):197-213, 1996
  28. Stevens JC, Webb HD, Hutchinson J, et al: Click evoked otoacoustic emissions in neonatal screening.  Ear Hear 11(2):128-133, 1990
  29. van de Bor M, van Zeben-van der Aa T, Verloove-Vanhorick S, et al: Hyperbilirubinemia in preterm infants and neurodevelopmental outcome at 2 years of age: Results of a national collaborative survey.  Pediatrics 83:915-920, 1989
  30. Vohr B: New approaches to assessing the risks of hyperbilirubinemia.  Clin Perinatol 17:293-306, 1990
  31. White KR: Universal newborn hearing screening using transient evoked otoacoustic emissions: Past, present, and future.  Semin Hear 17(2):171-183, 1996
  32. White KR, Behrens T (eds): The Rhode Island Hearing Assessment project: Implications for Universal Newborn Hearing Screening.  Semin Hear 14:1-122, 1993.

© NVA leerboek 2000-2017 Privacy | Disclaimer | Copyright | Statistieken | Webredactie