Tests auf Unabhängigkeit (Chi-Quadrat)

In diesem Beispiel wird die Datendatei survey_sample.sav verwendet. Weitere Informationen finden Sie in Beispieldateien.

Mit dem Chi-Quadrat-Test auf Unabhängigkeit kann ermittelt werden, ob eine Beziehung zwischen zwei kategorialen Variablen vorliegt. So kann beispielsweise ermittelt werden, ob es einen Zusammenhang zwischen Beschäftigungsstatus und Familienstand gibt.

  1. Wählen Sie in den Menüs Folgendes aus:

    Analysieren > Tabellen > Benutzerdefinierte Tabellen

  2. Ziehen Sie die Variable Beschäftigungsstatus aus der Variablenliste des Tabellenerstellungsprogramms in den Bereich für die Zeilen im Erstellungsbereich.
  3. Ziehen Sie die Variable Familienstand aus der Variablenliste und legen Sie sie im Spaltenbereich ab.
  4. Wählen Sie Zeilen als Position für die Auswertungsstatistiken.
  5. Wählen Sie Beschäftigungsstatus aus und klicken Sie im Gruppenfeld "Definieren" auf Auswertungsstatistik.
  6. Wählen Sie in der Liste "Statistik" die Option Anzahl als Spalten% aus und übertragen Sie sie in die Liste "Anzeigen".
  7. Klicken Sie auf Der Auswahl zuweisen.
  8. Klicken Sie im Dialogfeld "Benutzerdefinierte Tabellen" auf die Registerkarte Teststatistiken.
  9. Wählen Sie Tests auf Unabhängigkeit (Chi-Quadrat) aus.
  10. Klicken Sie auf OK, um die Tabelle zu erstellen und den Chi-Quadrat-Test durchzuführen.
Abbildung 1. Beschäftigungsstatus nach Familienstand
Beschäftigungsstatus nach Familienstand

Bei dieser Tabelle handelt es sich um eine Kreuztabelle von Beschäftigungsstatus nach Familienstand, in der die Häufigkeiten und Spaltenanteile als Auswertungsstatistiken angezeigt werden. Die Spaltenanteile werden so berechnet, dass die Summe jeder Spalte 100 % ergibt. Wenn zwischen den beiden Variablen kein Zusammenhang besteht, sollten sich in jeder Zeile ähnliche Anteile in allen Spalten befinden. Bei den Anteilen scheint es Differenzen zu geben. Sie können jedoch den Chi-Quadrat-Test überprüfen, um sich zu vergewissern.

Abbildung 2. Chi-Quadrat-Test nach Pearson
Chi-Quadrat-Test nach Pearson

Beim Test auf Unabhängigkeit wird davon ausgegangen, dass zwischen Beschäftigungsstatus und Familienstand keine Beziehung besteht, also die Spaltenanteile in allen Spalten gleich sind und beobachtete Abweichungen auf zufällige Variation zurückzuführen sind. Bei der Chi-Quadrat-Statistik wird die Gesamtabweichung zwischen den beobachteten Zellenhäufigkeiten und den bei Gleichheit der Spaltenanteile über alle Spalten erwarteten Häufigkeiten gemessen. Eine größere Chi-Quadrat-Statistik zeigt eine größere Abweichung zwischen den beobachteten und den erwarteten Zellenhäufigkeiten an. Dies deutet darauf hin, dass die Spaltenanteile nicht gleich sind, dass die Hypothese der Unabhängigkeit somit falsch ist und dass deshalb ein Zusammenhang zwischen Beschäftigungsstatus und Familienstand besteht.

Die berechnete Chi-Quadrat-Statistik weist den Wert 729,242 auf. Um festzustellen, ob dies ausreicht, um die Hypothese der Unabhängigkeit zu widerlegen, wird der Signifikanzwert der Statistik berechnet. Der Signifikanzwert ist die Wahrscheinlichkeit, dass eine Zufallsvariate aus einer Chi-Quadrat-Verteilung mit 28 Freiheitsgraden größer als 729,242 ist. Da dieser Wert kleiner als das auf der Registerkarte "Teststatistiken" angegebene Alpha-Niveau ist, kann die Hypothese der Unabhängigkeit auf dem Niveau 0,05 widerlegt werden. Somit besteht tatsächlich ein Zusammenhang zwischen Beschäftigungsstatus und Familienstand.