4. Verteilung von Chi-Quadrat

In Übung 1 wurde festgestellt, dass Chi-Quadrat einen Wert zwischen null und einem Vielfachen von N (Zahl der Fälle der Untersuchung) annehmen kann – in Abhängigkeit von N, von der Verteilung der Daten in der Kreuztabelle und der Grösse der Kreuztabelle. In unserem vorherigen Beispiel (Schritt 2 und 4) haben wir für Chi-Quadrat einen Wert von 3.4979 ermittelt. Ist dies ein grosser oder ein kleiner Wert? Was sagt er aus?

katholisch nicht katholisch
CVP-Wähler 16 6
andere 13 15
Chi-Quadrat: 3.4979
  • Bei vollkommen gleichmässiger Verteilung der Fälle in der Kreuztabelle wäre Chi-Quadrat=0.
  • Der ermittelte Wert von Chi-Quadrat in unserem Beispiel ist jedoch 3.4979 und verweist auf eine Abweichung von einer vollkommen gleichmässigen Verteilung der Fälle (offenbar wählen Katholiken mehrheitlich tatsächlich die CVP – nicht-katholische Befragte wählen eher andere Parteien als die CVP).
  • Es stellt sich aber dennoch die Frage, wie bedeutungsvoll die festgestellte Abweichung des berechneten Chi-Quadrat-Wertes von null ist. Können wir die Null-Hypothese "kein Zusammenhang" zurückweisen? Wir formulieren diese Frage nun in einer Weise, auf die uns die Statistik eine Antwort liefern kann:
  • Wie wahrscheinlich ist es, einen Wert von 3.4979 für Chi-Quadrat (in einer 2x2-Kreuztabelle) durch schiere Zufälle bei der Stichprobenauswahl zu erhalten, wenn tatsächlich kein Zusammenhang zwischen den interessierenden Variablen besteht?

Glücklicherweise hat Chi-Quadrat wie andere statistische Kennzahlen auch eine typische sampling distribution, also eine Stichprobenkennwertverteilung. D.h. wir wissen, mit welcher Wahrscheinlichkeit entsprechende Werte von Chi-Quadrat rein zufällig zustande kommen, ohne dass ein Zusammenhang zwischen den interessierenden Variablen besteht.

Für den Fall einer 2x2-Kreuztabelle sieht diese Verteilung wie folgt aus (senkrecht die Wahrscheinlichkeit, waagerecht die entsprechenden Werte von Chi-Quadrat):

Aus dieser Standard-Verteilung für 2x2-Tabellen ist ersichtlich:

  • Zunehmende Werte von Chi-Quadrat werden zunehmend unwahrscheinlicher.
  • Ein Wert von Chi-Quadrat=3.84 tritt mit einer Wahrscheinlichkeit von 5% (p=0.05) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 3.84 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 5%.
  • Ein Wert von Chi-Quadrat=6.63 tritt mit einer Wahrscheinlichkeit von 1% (p=0.01) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 6.63 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 1%.
  • Ein Wert von Chi-Quadrat=7.88 tritt mit einer Wahrscheinlichkeit von 0.5% (p=0.005) auf, auch wenn kein Zusammenhang zwischen den Variablen besteht. 7.88 ist der kritische Wert von Chi-Quadrat auf dem Signifikanzniveau von 0.5%.