Sector
  • Havo bovenbouw
  • Vwo bovenbouw
  • Gymnasium bovenbouw
Leerplankundig thema
  • Kwaliteitsborging schoolexamens
  • Handreiking
  • Examenprogramma

Criteria voor de kwaliteit van een toets

18-4-2016

​De kwaliteit van toetsen wordt bepaald door de volgende criteria:
• validiteit
• betrouwbaarheid
• specificiteit
• moeilijkheid
• discriminerend vermogen
• transparantie
• beschikbare tijd
• (taal)technische kwaliteit

Uitleg bij de kwaliteitscriteria

Validiteit

Bij validiteit wordt onderscheid gemaakt tussen inhoudsvaliditeit en begripsvaliditeit.
Inhoudsvaliditeit wil zeggen dat de toets de behandelde leerstof op verantwoorde wijze afdekt. Hier is de koppeling tussen het leerdoel van het onderwijs en de toets essentieel. Welke kennis moet een leerling in het voorafgaande onderwijs verworven hebben? Wat moet hij met die kennis kunnen doen? Voorafgaand aan het opstellen van de toets moet dat goed in kaart gebracht worden. De kunst is vervolgens om de toetsvragen evenwichtig over de leerdoelen te verdelen. Dekt de toets de behandelde leerstof? Zijn de vragen evenwichtig over de gehele stof verdeeld? Komen in een opdracht wel alle aspecten van het geleerde aan de orde?
Bij het bepalen van de inhoudsvaliditeit van een toets of opdracht kan het gebruik van een toetsmatrijs behulpzaam zijn. In een toetsmatrijs wordt vastgelegd welke inhoudsaspecten gevraagd worden, in welke verhouding die inhoudsaspecten aan de orde komen en op welk (denk)niveau die inhoudsaspecten aan de orde komen. Bij de vraag op welk (denk)niveau de inhoud beheerst moet worden, kan de gereviseerde taxonomie van Bloom (door Anderson, Krathwohl en Mayer in 2001) van dienst zijn.
Een toetsmatrijs kan ook helpen om toetsen over dezelfde stof (zoals herkansingstoetsen of toetsen die in verschillende schooljaren gegeven worden) met elkaar te vergelijken.
Begripsvaliditeit wil zeggen dat de toets toetst wat hij moet toetsen. Dat lijkt een vanzelfsprekendheid, maar lang niet alle toetsen zijn begripsvalide. Zo kwamen we bij een van de talen een schriftelijke toets tegen waarin een onderdeel 'spreken' was opgenomen. In dat onderdeel moesten leerlingen een aantal Nederlandse zinnen vertalen tot vragen en opmerkingen die in een dialoog met een leeftijdsgenoot gebruikt konden worden. De opmerkingen en antwoorden van de leeftijdsgenoot werden in de doeltaal weergegeven. Een dergelijke manier van toetsen heeft weinig met spreekvaardigheid te maken. Eerder wordt de schrijf- of vertaalvaardigheid getoetst. Als spreekvaardigheidtoets was dit onderdeel dus niet (begrips)valide.

Betrouwbaarheid

Bij het criterium betrouwbaarheid spelen twee belangrijke vragen een rol:

  1. Komen verschillende beoordelaars tot dezelfde beoordeling?
  2. Worden vergelijkbare prestaties hetzelfde beoordeeld?

Veel hangt in dit geval af van de kwaliteit van de vraagstelling en de kwaliteit van het antwoord- of beoordelingsmodel.
Bij een gesloten vraagstelling speelt de betrouwbaarheidsvraag minder dan bij een open vraagstelling, omdat bij een gesloten vraagstelling het gewenste antwoord vaak van tevoren vastgesteld kan worden. Bij een open vraag of opdracht komt het aan op een heldere vraag- of probleemstelling die precies aansluit op de gewenste leerdoelen. Ook is het belangrijk bij een open vraagstelling veel aandacht aan het antwoord- of beoordelingsmodel te schenken.
Als het antwoord- of beoordelingsmodel is opgesteld, kan vervolgens gecontroleerd worden of de vraag of opdracht uitnodigt om het goede antwoord te geven of het gewenste gedrag te vertonen.

Specificiteit

Een toets of opdracht is specifiek als een leerling pas een goede prestatie kan leveren als hij de vastgestelde leerdoelen heeft bereikt. Of met andere woorden: als hij de leerstof beheerst.
Bij veel toetsen worden tegenwoordig bronnen of teksten gegeven waarbij vervolgens vragen worden gesteld. Als die vragen beantwoord kunnen worden door de tekst of de bronnen goed te lezen, zijn die vragen niet specifiek. Want ook als leerlingen de stof niet beheersen, kunnen zij op basis van hun leesvaardigheid de vragen beantwoorden.

Moeilijkheid

Past het niveau van de toets bij het gewenste niveau van de leerling en het gevolgde onderwijs? Dit betekent dat een toets niet moeilijker mag zijn dan de oefeningen die een leerling ter voorbereiding op de toets heeft gemaakt.
Natuurlijk mag er best een vraag in de toets zitten die de betere leerling de kans geeft om zich te bewijzen, maar het niveau van de toets in zijn geheel moet aansluiten bij het niveau van het voorafgaande onderwijs.

Discriminerend vermogen

Discriminerend vermogen betekent dat de toetst het verschil zichtbaar maakt tussen leerlingen die de stof beheersen en leerlingen die de stof niet beheersen. Een toets met een goed discriminerend vermogen laat ook het verschil zien tussen goede en minder goede leerlingen.

Transparantie

In een transparante toets is het de leerling duidelijk wat hij kan verwachten. In het onderwijs dat aan de toets of opdracht voorafgaat, is het de leerling duidelijk geworden wat er verwacht wordt en hoe er getoetst gaat worden. Als de leerling de toets gaat maken, is duidelijk hoe zwaar de verschillende vragen of opdrachten wegen en wat er precies verlangd wordt.

Beschikbare tijd

Dit betekent dat een toets binnen de beschikbare tijd te maken moet zijn.

(Taal)technische kwaliteit

Het is van belang om erop te letten dat de leerlingen bij het maken van een toets of een examen geen fouten maken als gevolg van een voor hen te moeilijk of te vaag taalgebruik. Daarbij is het balanceren op een dun draadje, omdat het taalgebruik wel moet passen bij het niveau dat leerlingen op het moment van de toets zouden moeten hebben.
Het is niet de bedoeling dat het taalgebruik bewust simpel gehouden wordt. Ook op dit punt is een goede voorbereiding van de toets in het voorafgaande onderwijs belangrijk.
Voor de presentatie van de toets kunnen de volgende aanwijzingen gelden:

  • Maak gebruik van een uniforme presentatie (hetzelfde lettertype, een vaste kantlijn en regelafstand en een vaste opbouw van de opgaven);
  • Nummer de vragen en de bladzijden;
  • Druk de opgave op één bladzijde af;
  • Zorg ervoor dat tekeningen en schema's goed leesbaar zijn;
  • Vermeld per vraag het aantal te behalen punten (bij schriftelijke toetsen);
  • Zorg er bij praktische toetsing voor dat het de leerling duidelijk is op welke aspecten hij beoordeeld wordt en hoeveel punten er per aspect verdiend kunnen worden.

(Bron: Hendriks, J. & Pennewaard L., Schoolexamens vmbo. Enschede: SLO)

De criteria validiteit en betrouwbaarheid worden het meest genoemd als kwaliteitscriteria bij toetsing. De andere criteria zijn ook belangrijk, maar als de validiteit en betrouwbaarheid niet goed zijn, valt de basis onder de toets weg. U kunt de kwaliteit van een toets in kaart brengen met behulp van de Checklist kwaliteit toets van SLO.