2. Formulierung der Fragestellung so, dass sie statistisch bearbeitet werden kann

Leo steht vor einer für die Entscheidungsstatistik klassischen Frage. Wir wollen sie so formulieren, dass sie statistisch bearbeitbar ist.

Aus formaler Sicht repräsentieren die Mädchen- und die Knabengruppe aus Leos Klasse je eine Stichprobe von Schülerinnen resp. Schülern der dritten Klasse aus der deutschsprachigen Schweiz. In beiden Stichproben wurde ein Merkmal X erhoben, konkret die Note in ‚Orthographie’. Die beiden Stichprobenmittelwerte und im erhobenen Merkmal unterscheiden sich.

Hinter den beiden Stichproben steht je eine Population: Die Population aller deutschsprachigen Mädchen der dritten Klasse resp. die Population aller deutsprachigen Knaben der dritten Klasse. Die Verteilungen des interessierenden Merkmals X in diesen Populationen und die Verteilungsparameter sind nicht bekannt.

Leos inhaltliche Frage lautete: Darf der zwischen den beiden Stichproben von Mädchen und Knaben festgestellte Leistungsunterschied auf die Populationen von Schülerinnen und Schülern der dritten Klasse generalisiert werden?

Wir beantworten diese Frage auf einem kleinen Umweg. Statistisch bearbeitbar ist nur folgende Fragestellung:

Stammen die Stichproben von Mädchen und Knaben aus Populationen, in denen das interessierende Merkmal X mit identischen Mittelwerten und verteilt sind?

Die folgende Graphik veranschaulicht diese Überlegungen und zeigt, wie Leos inhaltliche Frage beantwortet werden kann.