2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann
Leo steht vor einer für die Entscheidungsstatistik klassischen Frage. Wir wollen sie so formulieren, dass sie statistisch
bearbeitbar ist.
Aus formaler Sicht repräsentieren die Mädchen- und die Knabengruppe aus Leos Klasse je eine Stichprobe von Schülerinnen resp.
Schülern der dritten Klasse aus der deutschsprachigen Schweiz. In beiden Stichproben wurde ein Merkmal X erhoben, konkret
die Note in ‚Orthographie’. Die beiden Stichprobenmittelwerte und
im erhobenen Merkmal unterscheiden sich.
Hinter den beiden Stichproben steht je eine Population: Die Population aller deutschsprachigen Mädchen der dritten Klasse
resp. die Population aller deutsprachigen Knaben der dritten Klasse. Die Verteilungen des interessierenden Merkmals X in diesen
Populationen und die Verteilungsparameter sind nicht bekannt.
Leos inhaltliche Frage lautete: Darf der zwischen den beiden Stichproben von Mädchen und Knaben festgestellte Leistungsunterschied
auf die Populationen von Schülerinnen und Schülern der dritten Klasse generalisiert werden?
Wir beantworten diese Frage auf einem kleinen Umweg. Statistisch bearbeitbar ist nur folgende Fragestellung:
Stammen die Stichproben von Mädchen und Knaben aus Populationen, in denen das interessierende Merkmal X mit identischen Mittelwerten
und
verteilt sind?
Die folgende Graphik veranschaulicht diese Überlegungen und zeigt, wie Leos inhaltliche Frage beantwortet werden kann.