Chikwadraattoets

Er zijn twee situaties te onderscheiden waarin de chikwadraattoets gebruikt kan worden:

    http://www.moaweb.nl/portal_css/MOAweb%20Theme/++resource++moaweb.theme.images/list_bullet.png); font-family: Calibri, 'Lucida Grande', Lucida, Arial, Helvetica, sans-serif; font-size: 11.8400001525879px; line-height: 18.9440002441406px;">
  • 1. een frequentierverdeling
  • 2. een kruistabel

In beide situaties is de te gebruiken formule dezelfde. Er zijn echter wel een aantal verschillen in de voorwaarden en de toepassing.

De chikwadraattoets (Chi2-toets) bij een frequentieverdeling
In deze situatie heeft men een rij getallen geobserveerd en deze reeks wil men vergelijken met een verwachte rij getallen. Nu rijst er een probleem. De getallen die men observeert zijn de getallen die men in het onderzoek vindt, maar wat is de te verwachten reeks getallen?
De verwachte reeks getallen mag men geheel vrij en naar eigen inzicht poneren. Stel dat men bij een vraag mag kiezen uit vijf antwoorden: zeer tevreden - tevreden - neutraal - ontevreden - zeer ontevreden. Men kan nu stellen dat 10% zeer tevreden zal zijn, 60% tevreden, 20% neutraal, 8% ontevreden en 2% zeer ontevreden (samen 100%). Voor hetzelfde geld had men ook heel andere percentages kunnen kiezen. Als onderzoeker is men daar helemaal vrij in.


Een rekenvoorbeeld


Stel dat de onderzoeker de volgende reeks getallen vindt zoals in de tabel hieronder. Ook heeft hij - voorafgaand aan het verzamelen van de gegevens - al een verwachte reeks in percentages opgesteld. Deze staan ook in de tabel. Op de onderste rij staan de verwachte aantallen. Het zal zelden voorkomen dat dit mooie ronde getallen zijn, maar voor ons voorbeeld hebben we dat zo bedacht.

 

zeer tevreden

tevreden

neutraal

ontevreden

zeer ontevreden

totaal

Geobserveerde verdeling

60

160

150

90

40

500

Verwachte verdeling in percentages

10%

30%

30%

20%

10%

100%

Verwachte verdeling in aantallen

50

150

150

100

50

500

Chi2 = ((60-50)2 / 50) + ((160-150)2 / 150) + ((150-150)2 / 150) + ((90-100)2 / 100) + ((40-50)/ 50) = 5,67

vrijheidsgraden:  (5-1) =  4;

kritieke Chi2-waarde = 9,49

p = niet significant want de berekende Chi2-waarde is kleiner dan de kritieke Chi2-waarde

In het onderste vak van de tabel staat de berekening van de chikwadraat waarde. Deze uitkomst kan men vergelijken met de chikwadraatwaarde in een tabel zoals er in (vrijwel) ieder statistiekboek wel eentje staat. Het enige wat men nog moet weten is het aantal vrijheidsgraden en dat is per definitie het aantal categorieën minus één (oftewel:  c - 1 ).

De chikwadraattoets bij een kruistabel
Bij een kruistabel worden de waarden van twee kenmerken (gemeten op nominaal niveau) tegen elkaar uitgezet in een kruistabel: op de kolommen-as komen de waarden van de scores op het ene kenmerk en op de rijen-as komen de waarde van de scores op het andere kenmerk. Op deze wijze krijgt men rijen en kolommen en cellen. Per cel kan men de frequentie van voorkomen van iedere combinaties vaststellen.

Een voorbeeld

Stel eens dat er drie basisscholen zijn die leerlingen leveren aan een middelbare school. Vervolgens gaat men na in welke stroom deze leerlingen terecht komen, is dat de vmbo- afdeling, de havo-afdeling, of de vwo-afdeling. Een aantal mogelijke uitkomsten staan in de illustraties hieronder.
      

Met de chikwadraattoets kan men nagaan of de leerlingen van de ene basisschool meer in de ene afdeling terecht komen dan in de andere. Indien dit geen verschil zou uitmaken dan is de verwachting dat in elke cel verhoudingsgewijs evenveel waarnemingen zitten; de leerlingen van de ene school komen net zo vaak terecht in de ene stroom als de andere. Is er echter wel sprake van een verschil, dan zal de ene cel verhoudingsgewijs beter gevuld zijn dan de andere.

Voor het berekenen van de chikwadraatwaarde gebruikt men dezelfde formule als bij een singuliere reeks. Er zijn echter wel twee relevante verschillen:

    http://www.moaweb.nl/portal_css/MOAweb%20Theme/++resource++moaweb.theme.images/list_bullet.png); font-family: Calibri, 'Lucida Grande', Lucida, Arial, Helvetica, sans-serif; font-size: 11.8400001525879px; line-height: 18.9440002441406px;">
  • 1. Bij een kruistabel is de verwachte frequentie per definitie het product van de randtotalen gedeeld door het algehele totaal.
  • 2. het aantal vrijheidsgraden is (aantal rijen min 1)(aantal kolommen min 1). Men schrijft dit ook wel als (r-1)(k-1).
 

vmbo

havo

vwo

totaal

Basisschool A

11

11

11

33

Basisschool B

15

15

15

45

Basisschool C

10

10

10

30

totaal

36

36

36

108

Chi2 = 0;

vrijheidsgraden:  (3-1)(3-1) =  4;

p = niet significant

  

 

vmbo

havo

vwo

totaal

Basisschool A

8

9

16

33

Basisschool B

19

14

12

45

Basisschool C

7

16

7

30

totaal

34

39

35

108

Chi2 = 10,17;

vrijheidsgraden:  (3-1)(3-1) =  4;

p < . 05

 

vmbo

havo

vwo

totaal

Basisschool A

0

0

33

33

Basisschool B

45

0

0

45

Basisschool C

0

30

0

30

totaal

45

30

33

108

Chi2 = 216;

vrijheidsgraden:  (3-1)(3-1) =  4;

p < .001

In bovenstaande illustraties zijn de toetsresultaten in de onderste rij van de tabellen geplaatst. In de eerste tabel valt het op dat als er een precies evenwichtige verdeling is, de Chi2-waarde 0 is. In de laatste tabel is de  Chi2-waarde 216. Dit is tevens de maximum-waarde, maar dat is alleen in dit geval zo. Indien men andere aantallen heeft, dan verandert de maximale Chi2-waarde. In principe loopt de Chi2-waarde van 0 tot plus oneindig. Daardoor is de uitkomst van deze berekening moeilijk te interpreteren en wordt er daarom vooral gelet op de p-waarde. Met de p-waarde geeft men aan of de analyse een significant verschil oplevert, en zo ja hoe sterk. In plaats van het toetsen of er een verschil bestaat, zou men ook een samenhang kunnen berekenen Cramérs V.  Deze is voor gelijke aantallen kolommen en rijen iets gemakkelijker te interpreteren

Als voorbeeld is een 3 x 3 tabel gebruikt. Hoe de tabel er uitziet is niet zo belangrijk: de formule is zowel toepasbaar op een  2 x 2  tabel als een  2 x 5  tabel alsook een 10 x 20 tabel. De enige voorwaarde is dat er wel voldoende waarnemingen moeten zijn om de cellen in de tabel voldoende te kunnen vullen. Is dat niet het geval dan zal de onderzoeker bepaalde rijen en/of kolommen moeten samennemen.

Copyrights

© Foeke van der Zee / BMOOO - Woordenboek onderzoek, methodologie en statistiek

Meer MOA


Kennispartners van Clou

MOA is een

CRKBO Instelling CMYK

Contact

MOA, Expertise Center voor Marketing-insights, Onderzoek & Analytics

Kingsfordweg 151, 1043 GR, Amsterdam
+31 20 5810710
Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.