Varianz s^2 und die Standardabweichung s

Charakterisierung

Mit der Varianz „s2“ bzw. der Standardabweichung „s“ soll die mittlere „Abweichung“ der Ausprägungen eines Merkmals vom arithmetischen Mittelwert aller Merkmalsausprägungen ermittelt werden.

Bemerkung zur Berechnung

Die einzelnen Abweichungen vom Mittelwert können nicht einfach aufaddiert werden, da diese sowohl positive wie negative Vorzeichen aufweisen und ihre Summe deshalb gleich Null wäre.
Deshalb werden die „Abweichungen“ der einzelnen Ausprägungen des Merkmals vom arithmetischen Mittelwert quadriert. Damit haben die quadrierten „Abweichungen“ immer ein positives Vorzeichen und können dann aufsummiert werden.

Formel zur Berechnung der Varianz s^2

Der Varianz entspricht die Summe der quadrierten Abweichungen der Merkmalswerte vom arithmetischen Mittelwert, dividiert durch die Anzahl der Merkmalsträger.

Formel zur Berechnung der Standardabweichung s

Da man bei Angabe der Varianz Ergebnisse mit dem Quadrat der Masseinheit der zugrundeliegenden Daten erhält (z.B. [0.6 Std.]2) und sich aus einem solchen Wert kaum Interpretationen in bezug auf die Realität ableiten lassen, wird an Stelle der Varianz überall dort, wo es um inhaltliche Aussagen geht, die Standardabweichung verwendet. Man erhält die Standardabweichung s, indem man die Quadratwurzel aus der Varianz berechnet.

Voraussetzungen

Das Merkmal muss mindestens intervall-skaliert sein, da die Abstände zwischen den Merkmalsausprägungen und dem arithmetischen Mittelwert zu berechnen sind.

Eignung

Die Varianz s2 bzw. die Standardabweichung s werden als sinnvolles Mass zur Beschreibung der Variabilität angesehen, wenn die Daten eingipflig und näherungsweise symmetrisch sind.

Hinweise und zusätzliche Erklärungen

Welche Bedeutung haben s^2 und s?

In der beschreibenden Statistik haben diese Masse wegen ihrer kleinen Anschaulichkeit und der Schwierigkeit, diese Masszahlen zu interpretieren, keine so grosse Bedeutung. In der schliessenden Statistik (prüf- und entscheidungsstatistische Verfahren) haben sie als rechentechnische Grösse eine herausragende Bedeutung.
Wie später unter „Wahrscheinlichkeits-Verteilungen“ belegt wird, liegen bei normalverteilten Daten zwischen den Grenzen „“ und „“ 68,3 % aller Beobachtungen; zwischen den Grenzen „“ und „“ 95.5 % aller Beobachtungen.

Unterschiedliche Bezeichnungen der Varianz und der Standardabweichung

Mit s2 und s wird die Varianz und die Standardabweichung für Daten bezeichnet, die aus einer Stichprobe stammen. Man spricht dabei von Verteilungskennwerten.
Werden die Daten an einer Population erhoben, so wird die Varianz mit (sigma Quadrat) und die Standardabweichung mit (sigma) bezeichnet, und man spricht von Verteilungsparametern.

Berechnung der Varianz aus einer Häufigkeitsverteilung

Wie schon unter „Berechnung des arithmetischen Mittelwertes aus einer Häufigkeitsverteilung“ erwähnt, gehen durch die Kategorisierung der Daten Informationen verloren, so dass die Masszahl nur näherungsweise bestimmt werden kann. Dies gilt auch für die Varianz. Nach Möglichkeit soll sich die Varianz deshalb auf die Rohdaten beziehen.