Kruskal-Wallistoets

De Kruskal-Wallistoets, genoemd naar William Kruskal en Allen Wallis, is een verdelingsvrije toets in de statistiek, waarmee getoetst wordt of er verschil is tussen de verdelingen waaruit twee of meer steekproeven afkomstig zijn. De nulhypothese die getoetst wordt, is eigenlijk dat de steekproeven uit verdelingen (populaties) zijn getrokken met dezelfde "ligging". De toets is gebaseerd op de rangnummers van de data. De Kruskal-Wallistoets is te beschouwen als een eenweg-ANOVA gebaseerd op de rangnummers. De Kruskal-Wallistoets is een uitbreiding van de Mann-Whitney-Wilcoxon rangsomtoets, die enkel geschikt is om twee groepen onderling te vergelijken.

Procedure

Gegeven zijn m onderling onafhankelijke aselecte steekproeven uit continue verdelingen. De -de waarneming in de -de steekproef, die omvang heeft, is . Het rangnummer hiervan in het totaal van de data is . De toets verloopt verder in principe als een variantie-analyse uitgevoerd op deze rangnummers.

De toetsingsgrootheid is:

,

waarin

het totaal aantal waarnemingen is en

het gemiddelde rangnummer in de -de steekproef.

Merk op dat de toetsingsgrootheid ook met kwadratensommen geschreven kan worden als:

,

waaruit de bovenstaande formule volgt door de substituties:

en

.

Als de steekproeven niet te klein van omvang zijn, is onder de nulhypothese bij benadering chi-kwadraatverdeeld met vrijheidsgraden.

Knopen

In principe mogen er geen knopen (gelijke waarnemingen) zijn. Zijn er te veel knopen, dan wordt de toetsingsgrootheid wel gecorrigeerd:

waarin het aantal data is met rangnummer .

Zie ook