Standardisierung (Statistik)

Dichten einer standardisierten (blau) und zweier nicht standardisierter Normalverteilungen (rot und violett)

Unter Standardisierung (in einführenden Statistikkursen wird sie manchmal als z-Transformation bezeichnet[1]) versteht man in der mathematischen Statistik eine Transformation einer Zufallsvariablen, so dass die resultierende Zufallsvariable den Erwartungswert null und die Varianz eins besitzt. Die Standardabweichung entspricht der Wurzel der Varianz und ist somit auch gleich eins. Die standardisierte Zufallsvariable wird häufig z-Score, z-Statistik oder z-Wert genannt und bildet ein Fundament zur Konstruktion statistischer Tests.

Standardisierte Zufallsvariable

Eine standardisierte Zufallsvariable ist eine Zufallsvariable, deren Erwartungswert 0 und deren Varianz 1 beträgt.

Einsatzzweck

Standardisierung ist z. B. notwendig, um unterschiedlich verteilte Zufallsvariablen miteinander vergleichen zu können. Außerdem sind für einige statistische Verfahren, wie beispielsweise die Faktorenanalyse, standardisierte Zufallsvariablen notwendig.

Herleitung der mathematischen Formel

Sei eine Zufallsvariable mit Erwartungswert und Varianz (und dementsprechend Standardabweichung ), so erhält man die zugehörige standardisierte Zufallsvariable durch Zentrierung und anschließende Division durch die Standardabweichung[2]

.

Für die so erhaltene Zufallsvariable gilt:

Ist normalverteilt mit Erwartungswert und Varianz , so ist standardnormalverteilt, d. h. .

Abgrenzung zur Studentisierung

In vielen Statistikprogrammen wie SPSS und Statistica ist die Möglichkeit einer Standardisierung der Messergebnisse bereits eingebaut. Genau genommen sollte hier aber von einer Studentisierung gesprochen werden, da die genaue Verteilung der zugrundeliegenden Zufallsvariablen nicht bekannt ist und somit statt des Erwartungswerts das arithmetische Mittel und statt der Varianz die empirische Varianz verwendet werden muss. Oftmals werden allerdings die Begriffe des Studentisierens und des Standardisierens fälschlich synonym verwendet.

Wortherkunft

Die z-Schreibweise wurde historisch für unterschiedliche Zwecke verwendet. Heute steht sie meistens für eine standardnormalverteilte Zufallsvariable. Die Variable und der Begriff z-Verteilung wurden 1924 durch R. A. Fisher in seinem Werk On a Distribution Yielding the Error Functions of Several Well Known Statistics eingeführt.[3]

Literatur

  • Bortz, Schuster: Statistik für Human- und Sozialwissenschaftler. 7. Auflage. Springer, 2001.
  • Falk u. a.: Foundations of statistical analyses and applications with SAS. Birkhäuser, 2002.

Einzelnachweise

  1. Jeffrey Wooldridge: Introductory econometrics: A modern approach. 5. Auflage. Nelson Education, S. 736.
  2. Jeffrey Wooldridge: Introductory econometrics: A modern approach. 4. Auflage. Nelson Education, 2015, S. 728.
  3. John Aldrich: Earliest Uses of Symbols in Probability and Statistics

Auf dieser Seite verwendete Medien

Normalverteilungen verschiedene Parameterwerte.svg
Autor/Urheber:

Benutzer:Sewenz

, Lizenz: PD-Schöpfungshöhe

Normalverteilung: (Wahrscheinlichkeits-)Dichtefunktionen normalverteilter Zufallsgrößen mit unterschiedlichen Werten für die Parameter μ und σ2 (Mittelwert und Varianz). Notation hier: N~X(μ, σ2).