23. Erreichung von Repräsentativität bei vermuteten Modellverletzungen
Es empfiehlt es sich deshabl, in der Forschungspraxis nicht bloss von der Gegenüberstellung von Grundgesamtheit, die erforschrt werden soll, und Stichprobe auszugehen sondern zumindest von einem dreistufigen Modell:
- Der anvisierten Grundgesamtheit (der target population).
- Der zum Katalog erhobenen Stichprobenbasis (frame population, beispielsweise das Telefonverzeichnis).
- Und letztendlich die Stichprobe, deren Basis nicht die Grundgesamtheit ist, sondern notwendigerweise der indizierte Katalog.
Damit ergeben sich ganz verschiedenartige "Repräsentationsprobleme".
Wie ersichtlich ist, besteht zwischen Target- und Framepopulation ein
wesentlicher analytischer und technischer Unterschied. Die Diskussion der Qualität der
Stichprobe sollte alle drei Ebenen berücksichtigen. Es ist evident, dass ein Rückbezug der
Stichprobe, die Darstellung ihrer "Repräsentativität" und der Ausfallquoten auf bloss die
Frame Population (beispielsweise wie üblich die telefonisch erreichbaren Haushalte) viele
sytematische Fehlerquellen ignoriert. Es handelt sich im übrigen um einen gängigen Trick,
die Qualität der Stichproben zu schönen.
Strategien um registrierte Verzerrungen zu vermeiden
Um (mutmassliche)Verzerrungen zu vermeiden, kennen die Stichprobentechniker zwei hauptsäliche Verfahren. Beide beruhen darauf, dass Stichprobenmerkmale hinsichtlich ihrer Verteilung mit der Verteilung bekannter Merkmale in der Frame-, seltener in der Targetpopulation in Bezug gesetzt werden. Findet sich, dass ein Merkmal oder eine Merkmalskombination zuwenig vertreten ist, dann bieten sich zwei Strategien an:
- Poststratification:
Einheiten mit untervertretenen Merkmalen werden zusätzlich erhoben. Damit werden aber die wahrscheinlichkeitstheoretischen Modellannahmen verletzt und die Errechnung von Stichprobenkennwerte wird problematisch und die Beeinflussung anderer Merkmale ist nicht abzusehen. - Gewichtung:
Die verzerrten Merkmale werden mit einer Gewichtungsfaktor versehen, die mathematisch den untervertretenen Merkmalen mehr Gewicht verleiht und den übervertetenen Merkmalenweniger. Der Einsatz dieser mathematischen Strategie ist umstritten: die Gefahr ist vorhanden, dass der Teufel mit dem Beelzebube ausgetrieben wird. Denn das korrekte Entsprechungsverhältnis von bekannten Merkmalen kann durch eine künstlich hergestellte Verzerrung auf einem unbekannten anderen zur Folge haben.