Hotellingsche T-Quadrat-Verteilung Dichtefunktion Verteilungsfunktion Parameter p – Dimension der Zufallsvariablen m – verknüpft mit der StichprobengrößeTräger x ∈ ( 0 , + ∞ ) {\displaystyle x\in (0,+\infty )\;} if p = 1 {\displaystyle p=1} x ∈ [ 0 , + ∞ ) {\displaystyle x\in [0,+\infty )\;} otherwise.
Die Hotellingsche T -Quadrat-Verteilung [1] ist eine Wahrscheinlichkeitsverteilung , die 1931 von Harold Hotelling erstmals beschrieben wurde.[2] Sie ist eine Verallgemeinerung der Studentschen t-Verteilung .
Definition Hotellings T-Quadrat-Verteilung ist definiert als
t 2 = n ( x − μ ) ′ W − 1 ( x − μ ) {\displaystyle t^{2}=n({\mathbf {x} }-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\mathbf {x} }-{\mathbf {\mu } })} mit
n {\displaystyle n} einer Anzahl von Punktenx {\displaystyle {\mathbf {x} }} ist ein Spaltenvektor mit p {\displaystyle p} ElementenW {\displaystyle {\mathbf {W} }} ist eine p × p {\displaystyle p\times p} -Kovarianzmatrix .Eigenschaften Es sei x ∼ N p ( μ , V ) {\displaystyle x\sim N_{p}(\mu ,{\mathbf {V} })} eine Zufallsvariable mit einer multivariaten Normalverteilung und W ∼ W p ( m , V ) {\displaystyle {\mathbf {W} }\sim W_{p}(m,{\mathbf {V} })} (unabhängig von x {\displaystyle x} ) habe eine Wishart-Verteilung mit einer nicht-singulären Kovarianzmatrix V {\displaystyle \mathbf {V} } und mit m = n − 1 {\displaystyle m=n-1} . Dann ist die Verteilung von t 2 {\displaystyle t^{2}} : T 2 ( p , m ) {\displaystyle T^{2}(p,m)} , Hotellingsche T -Quadrat-Verteilung mit Parametern p {\displaystyle p} und m {\displaystyle m} .
F {\displaystyle F} sei die F-Verteilung . Dann kann gezeigt werden, dass gilt:
m − p + 1 p m T 2 ∼ F p , m − p + 1 {\displaystyle {\frac {m-p+1}{pm}}T^{2}\sim F_{p,m-p+1}} .Unter der Annahme, dass
x 1 , … , x n {\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}} p × 1 {\displaystyle p\times 1} -Spaltenvektoren mit reellen Zahlen sind.
x ¯ = ( x 1 + ⋯ + x n ) / n {\displaystyle {\overline {\mathbf {x} }}=(\mathbf {x} _{1}+\cdots +\mathbf {x} _{n})/n} sei der Mittelwert. Die positiv definite p × p {\displaystyle p\times p} -Matrix
W = ∑ i = 1 n ( x i − x ¯ ) ( x i − x ¯ ) ′ / ( n − 1 ) {\displaystyle {\mathbf {W} }=\sum _{i=1}^{n}(\mathbf {x} _{i}-{\overline {\mathbf {x} }})(\mathbf {x} _{i}-{\overline {\mathbf {x} }})'/(n-1)} sei ihre Stichproben-Kovarianzmatrix . (Die Transponierte einer Matrix M {\displaystyle M} sei mit M ′ {\displaystyle M'} bezeichnet). μ {\displaystyle \mu } sei ein p × 1 {\displaystyle p\times 1} -Spaltenvektor (bei Anwendung ein Schätzer des Mittelwertes). Dann ist die Hotellingsche T -Quadrat-Verteilung
t 2 = n ( x ¯ − μ ) ′ W − 1 ( x ¯ − μ ) . {\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } }).} t 2 {\displaystyle t^{2}} hat eine enge Beziehung zum quadrierten Mahalanobis-Abstand .
Insbesondere kann gezeigt werden[3] , dass, wenn x 1 , … , x n ∼ N p ( μ , V ) {\displaystyle {\mathbf {x} }_{1},\dots ,{\mathbf {x} }_{n}\sim N_{p}(\mu ,{\mathbf {V} })} unabhängig sind und x ¯ {\displaystyle {\overline {\mathbf {x} }}} und W {\displaystyle {\mathbf {W} }} wie oben definiert sind, dann hat W {\displaystyle {\mathbf {W} }} eine Wishart-Verteilung mit n − 1 {\displaystyle n-1} Freiheitsgraden , so dass
W ∼ W p ( V , n − 1 ) {\displaystyle \mathbf {W} \sim W_{p}(V,n-1)} und ist unabhängig von x ¯ {\displaystyle {\overline {\mathbf {x} }}} und
x ¯ ∼ N p ( μ , V / n ) {\displaystyle {\overline {\mathbf {x} }}\sim {\mathcal {N}}_{p}(\mu ,V/n)} .Daraus folgt
t 2 = n ( x ¯ − μ ) ′ W − 1 ( x ¯ − μ ) ∼ T 2 ( p , n − 1 ) . {\displaystyle t^{2}=n({\overline {\mathbf {x} }}-{\mathbf {\mu } })'{\mathbf {W} }^{-1}({\overline {\mathbf {x} }}-{\mathbf {\mu } })\sim T^{2}(p,n-1).} Einzelnachweise ↑ Hotelling's T². Glossary of statistical terms. In: International Statistical Institute . 1. Juni 2011, abgerufen am 25. September 2020 (englisch). ↑ H. Hotelling (1931). The generalization of Student’s ratio, Ann. Math. Statist., 2 (3), S. 360–378, doi :10.1214/aoms/1177732979 JSTOR 2957535 . ↑ K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis , Academic Press, ISBN 0-12-471250-9 . Multivariate Verteilungen
Diskrete multivariate Verteilungen: Dirichlet compound multinomial | Ewens | gemischt Multinomial | multinomial | multivariat hypergeometrisch | multivariat Poisson | negativmultinomial | Pólya/Eggenberger | polyhypergeometrisch
Kontinuierliche multivariate Verteilungen: Dirichlet | GEM | generalized Dirichlet | multivariat normal | multivariat Student | normalskaliert invers Gamma | Normal-Gamma | Poisson-Dirichlet
Multivariate Matrixverteilungen: Invers Wishart | Matrix Beta | Matrix Gamma | Matrix invers Beta | Matrix invers Gamma | Matrix Normal | Matrix Student-t | Normal-invers-Wishart | Normal-Wishart | Wishart