Om at tolke kognitive testresultater fra gode og dårlige testsituationer

Efter at have haft et par sager med tolkning af kognitive testresultater i både gode og rigtig dårlige testsituationer, har jeg gjort mig nogle tanker – især om mulige fejlfortolkninger. Med “gode” og “dårlige” situationer mener jeg at børnene der blev testet i de gode tilfælde var tilstrækkeligt motiverede for at yde deres bedste for at klare opgaver, at de var veludhvilede, opmærksomme, trygge og havde en god relation til psykologen der udførte testen – og modsat i de dårlige. Dermed ikke sagt at testsituationen behøves være aldeles optimal, men bare tilstrækkelig god.

Hvad kan man tolke af et resultat af en intelligenstest og hvilke diagnoser kan man eventuelt stille, hvis testsituationen har været god henholdsvis dårlig? Og hvilke fejl kan man begå?

Her er et sted at starte overvejelserne – citeret fra en nyere grundbog i testning af børn og unge:

Det er særligt vanskeligt at drage slutninger om negativ testadfærd. Hermed mener vi mangel på eller meget sparsomme svar på testmaterialet. Inden for færdighedsområdet [kognitiv testning, red.] indebærer det at man ikke uden videre kan slutte sig til barnets manglende evner, blot fordi antallet rigtige svar er lavere end det for alderen forventede. Allerede i 1960’erne påpegede psykolingvisten Noam Chomsky at man bør foretage en omhyggelig distinktion mellem evne og præstation. Det er forsvarligt at drage konklusioner om evne hvis opgaverne er udført korrekt. Barnet har jo da vist at det faktisk kan løse opgaven og må formodes at besidde den evne der kræves. Det er dog ikke lige så selvfølgeligt at man ud fra forkerte eller manglende svar kan slutte sig til at barnet mangler evnen. Udover selve evnen kræver det at den er tilgængelig for barnet i den aktuelle situation, og at barnets motivation, opmærksomhed, følelsesleje og udtryksmåde harmonerer med testsituationens krav. (Smedler og Tideman 2011, s. 34, min kursivering)

Den bog af Chomsky der henvises til er i øvrigt Aspects of the Theory of Syntax (MIT Press, 1965).

Forskellen mellem evne og præstation skulle være let nok at forstå. Som psykolog må man sørge for at skabe tilstrækkelig gode muligheder for at barnets evner kan komme fuldstændigt til udtryk i dets præstation. Og lykkes det, kan man konkludere at barnet har de evner det viser. I en intelligenstest sammenfattes præstationerne på en lang række forskellige opgaver til en intelligenskvotient. At samle præstationerne til et enkelt tal indebærer selvfølgelig en forenkling, men vi kan godt tale om et bestemt evnemæssigt niveau.

Hvis testsituationen alligevel bliver dårlig, må man altså tage højde for det i fortolkningen. Der findes nemlig ikke nogen måde at “måle” hvor dårlig en testsituation er, som så kan bruges til at udregne et retvisende resultat. Man kan kun undlade at drage den konklusion at barnet er dårligt begavet, eller har indlæringsvanskeligheder. Og hvis omstændighederne tillader det, kan man teste barnet igen med en anden test.

Resultatet af en intelligenstest skal ret ofte bruges til en udredning i psykiatrien, og for det meste bliver barnet undersøgt og evt. diagnosticeret af andre fagfolk end den psykolog der har testet det. Dermed må psykologen være forpligtet til at rapportere klart og tydeligt om testsituationen var tilstrækkelig god. Dette gælder selv hvis man som psykolog ikke har tænkt sig at henvise barnet til psykiatrien! Andre kan jo vælge at henvise og vedlægge ens rapport som dokumentation. Og personalet i psykiatrien skal tage oplysninger om en dårlig testsituation meget alvorligt. Hvis oplysningerne mangler, må de forsøge at kontakte psykologen for at få den vurdering. Gør de ikke det kan konsekvensen meget let blive at barnet fejlagtigt får diagnoserne mental retardering eller inferioritas intellectualis (“dårligt begavet”) i stedet for den rigtige diagnose. (En intelligenskvotient (IK) på 100 regnes for gennemsnitlig for hele befolkningen, under 70 svarer til mental retardering og under 85 til inferioritas intellectualis.)

***

Det er ret almindeligt at beskrive et intelligenstestresultat som et “øjebliksbillede” af barnet. Ud fra det ovenstående burde være klart at et resultat fra en dårlig testsituation i højere grad er et øjebliksbillede end ét fra det modsatte. Præstationen var det der skete i situationen, men den afspejler dårligt barnets evner. Og vi regner ikke med at børn det ene øjeblik kan udvise intellektuelle evner af et bestemt niveau, blot for det næste øjeblik at miste dem. (Det skulle selvfølgelig kun være hvis barnet fik en hjerneskade.)

Ideen om at testresultater udgør et øjebliksbillede kan være særligt problematisk i tilfælde hvor et barn er blevet testet flere gange. Hvis et barn eksempelvis har præsteret to forskellige resultater på samme intelligenstest, og det første er inden for normalområdet (f.eks. en IK på 75), mens det andet er i området for mental retardering (f.eks. IK 60), så er det ikke logisk at mene at der er tale om to lige retvisende øjebliksbilleder, eller at det seneste resultat er mest troværdigt og dermed slutte at barnet er mentalt retarderet. Det er heller ikke logisk at antage at den faktiske IK ligger midt imellem de to testresultater. Det første resultat tyder på at barnet har evnerne til at præstere til en IK på 75, og det sidste indikerer at det har evne til en IK på 60. Altså har det med al sandsynlighed evnerne til at præstere en IK tæt på 75. Og hvis testsituationen var dårlig har barnet måske evnerne til at præstere endnu bedre. (Situationen hvor de samme resultater er opnået med to forskellige tests er anderledes fordi ikke alle intelligenstests er lige nøjagtige.)

Jeg har desværre set dette gjort i praksis med testresultater meget tæt på eksemplet ovenfor, og det endda selvom begge testsituationer blev beskrevet som dårlige. En tredje test viste ganske rigtig at det pågældende barn havde evner langt inde i normalområdet.

To ting der dog kan gøre det bedste resultat (på samme test) mindre troværdigt, er test-retest-effekten – hvis det bedste resultat er opnået sidst og der har været for kort tid imellem de to testninger, så barnet er trænet i testen – og hvis psykologen har hjulpet barnet for meget i testsituationen. (En anden situation er som nævnt hvis barnet i mellemtiden har fået en hjerneskade. I så fald er det første resultat retvisende for barnets evner før skaden, og det sidste retvisende efter.)

***

En intelligenskvotient angives med et såkaldt konfidensinterval, der antyder hvor sikker man kan være på resultatet. Mere præcist formuleret angiver intervallet et sandsynligt minimum og maksimum for barnets intellektuelle evner. Der er en vis usikkerhed i “målingen,” og meningen er at barnets faktiske evner med en bestemt procentvis sikkerhed skal være inden for dette interval. Man kunne fristes til at tro at konfidensintervaller strider med den logik, jeg har beskrevet ovenfor. For hvordan kan resultatet være behæftet med usikkerhed i nedadgående retning, hvis ethvert testresultat viser et evnemæssigt niveau som barnet som minimum har? Det komplicerer billedet lidt, men der er ingen modsætning.

Når en test opgøres, beregnes intelligenskvotienten reelt ved at sammenligne barnets præstation med jævnaldrende børns resultater, som normmaterialet består af. Man kan forestille sig at normmaterialet bogstaveligt talt er en række af børn – fra dem der har leveret de bedste præstationer til de dårligste. Det antages at normmaterialet svarer til den jævnaldrende befolkning som helhed. Og det barn man har testet bliver placeret ved dem som dets præstation er nøjagtigt på niveau med. Hvis den ene halvdel af normbørnene har klaret sig bedre og den anden dårligere, så tildeles det testede barn en IK på 100. Hvis kun 25 % har klaret sig bedre, tildeles barnet en IK på 110. Og hvis 15 % har klaret sig bedre, er IK 115. Så hvis barnet har præsteret bedre end 50 % af normbørnene, så antages det også at have bedre evner en 50 % af jævnaldrende børn fra det område som normmaterialet repræsenterer.

Man kan sige at denne fremgangsmåde resulterer i måleusikkerhed fordi de præstationer der indgår normmaterialet også et usikre. For eksempel er der svarmuligheder til en del af opgaverne som barnet kan gætte på, og i flere af opgaverne uden svarmuligheder er det også muligt at gætte. I enhver testsituation vil nogle være heldigere end andre. Eksempelvis er der i delprøven Matricer i WISC-IV som regel fem svarmuligheder. Det betyder at et barn der er villig til at gætte, normalt vil få point for 20 % af de opgaver hvor det ikke kan regne det rigtige svar ud. Men nogle vil altså være heldigere end andre. Og når børnene – både dem i normmaterialet og dem der testes – skal sorteres i den førnævnte rækkefølge, betyder det at nogle børn rykker frem og andre tilbage i forhold til den placering deres faktiske evner berettiger til.

Testsituationen for børnene i normmaterialet har naturligvis også varieret. Normbørnene har ikke nødvendigvis præsteret deres absolut bedste, og dermed kan det barn man har testet, “komme foran” i rækkefølgen i forhold til børn som reelt har bedre evner. De normbørn der har nægtet at gætte, vil også rykke tilbage i forhold til dem der har fået lidt ekstra point for heldige gæt. Ret beset bør præstationer fra dårlige testsituationer og umotiverede børn være sorteret fra. På den måde vil man være rimelig sikker på at man sammenligner det testede barn med et normmateriale hvor der er sammenfald mellem normbørnenes præstationer og evner. Men desværre fortæller den tekniske manual til WISC-IV (den mest anvende intelligenstest for skolebørn) ikke nærmere om dette – så vidt jeg har læst. Man må håbe at normmaterialet ikke indeholder for mange præstationer fra dårlige testsituationer. Jo mere renset det er for dårlige testsituationer, des mere vil placeringer i rækkefølgen afhænge udelukkende af evner og ikke andre irrelevante faktorer.

I WISC-IV vil konfidensintervallet (95 %) være ca. +/- 5 IK-point – altså 70-80 for en IK på 75. Dermed har barnet med 95 % sandsynlighed evner der som minimum svarer til en IK på 70. Hvis barnet på et andet tidspunkt har præsteret et testresultat under normalområdet, så er det mindre væsentligt. Begge resultaters konfidensintervaller viser et bundniveau og det højeste bundniveau er alt andet lige mest troværdigt.

Efter min vurdering bør man forholde sig forskelligt til konfidensintervaller for resultater fra henholdsvis gode og dårlige testsituationer. Hvis situationen var god, er konfidensintervallet gyldigt. Men hvis situationen var dårlig er der – som beskrevet ovenfor – meget lidt grund til at tro at resultat kan være misvisende i negativ retning, og omvendt er der mere end almindelig god grund til at tro at intervallet kan være misvisende i positiv retning. Denne pointe afhænger selvfølgelig af at normmaterialet ikke indeholder resultater fra dårlige testsituationer.

Reference:

Smedler, Ann-Charlotte & Eva Tideman (2011). At teste børn og unge: Om testmetoder i den psykologiske undersøgelse. København: Hans Reitzels Forlag.

Reklamer

Skriv et svar

Udfyld dine oplysninger nedenfor eller klik på et ikon for at logge ind:

WordPress.com Logo

Du kommenterer med din WordPress.com konto. Log Out /  Skift )

Google+ photo

Du kommenterer med din Google+ konto. Log Out /  Skift )

Twitter picture

Du kommenterer med din Twitter konto. Log Out /  Skift )

Facebook photo

Du kommenterer med din Facebook konto. Log Out /  Skift )

Connecting to %s