t検定,プールした分散
対応がない場合のt検定
参考文献は以下、
http://www012.upp.so-net.ne.jp/doi/biostat/CT39/ttest.pdf
二つのグループをt検定する。
まず前提として、二つのグループ等分散、母分散は不明であるとする。
等分散じゃないと、t検定が使えない。
二つのグループのそれぞれの偏差平方和(s1,s2)から、プールした不偏分散を作る。
等分散なんだから、
二つのグループのデータを使って分散を求めた方が精度が良くね、
っていうモチベーションでプールする。
二つのグループをまとめた偏差平方和s = s1+s2
自由度はn = (n_1-1)+(n_2-1)
よって、プールした分散はs = (s1+s2) / {(n_1-1)+(n_2-1)}
となる。
これを使ってt検定する。
なお、等分散じゃない場合はウェルチの検定となる。
等分散じゃなくてかつ母分散も不明の場合、
厳密に従う統計量は存在しない。
→近似的にはウェルチの検定でいける、
このへんは、
永田本「統計的方法の仕組み」p.185に記載している。