検定の原理
検定の概念
仮説が正しいと仮定した上で、それに従う母集団から、実際に観察された標本が抽出される確率を求め、その値により判断を行う。
その確率が十分に(予め決めておいた値より)小さければ、「仮説は成り立ちそうもない」と判断できる。

検定の原理
検定の原理は反証法(背理法)に当たる。
「差がある事」を証明するために、「差がないとすると矛盾する事」を証明する。
すなわち、「差がある」という仮説を証明するために、「差がない」という仮説を調べる。

A群、B群の比較において
  ① 「差がない」という仮説:A=B・・・・帰無仮説 H0 (Null hypothesis)
  ② 「差がある」という仮説:A≠B・・・・対立仮説 H (Alternative hypothesis)・・(本当はこれが言いたい)
  ③ 帰無仮説を調べて、そうである確率が低いことを証明する。
  ④ その仮説を棄却し、対立仮説を採用する

帰無仮説の検定

棄却

対立仮説が真
帰無仮説の検定

採択

帰無仮説が真



検定の種類(パラメトリック、ノンパラメトリック)
パラメトリック検定
間隔尺度による検定。
母集団の分布型に対して一定の過程をおき、それに基づいて仮説仮定を行う。
  1標本・・・・・・・・平均値の検定、比率の検定
  関連2標本・・・・t検定
  独立2標本・・・・t検定 など

ノンパラメトリック検定
順序尺度、分類尺度による検定。
母集団の分布型に関して特別の過程をおく必要がない仮説検定。
  Wilcoxon検定 (順位付符号和検定)
  Mann-WhitneyのU検定
  カイ二乗検定 など


片側検定と両側検定
両側検定
片側検定と両側検定は、言葉通り片側のみを検定するか両側を検定するかということである。
仮説が「平均が等しい」と主張するタイプであれば、すなわち「AとBには差があるかというような"差の違いを調べる"場合」には分布関数の裾として左右両側を用いる。

片側検定
「・・・の方が平均が大きい(小さい)ということはない」と主張するタイプであれば、片側の裾だけを用いる。
検定の種類によっては両側検定または片側検定のみということもある。


A群とB群の血圧を二標本 t 検定で比較する場合、どちらが高いかはわからない。
よって両側検定する必要がある。
しかし、高血圧の患者に降圧剤を使用する場合に有意に血圧が下がるかどうかを検定する場合には、血圧が下がることしか仮定しないのである。
しかし、絶対に降圧剤で血圧が上がらないという保証はない。ほとんどの検定では両側検定が使用されている。
実際上、片側検定と両側検定ではどう違うかというと、両側検定におけるP値0.05は、片側0.025になるが、片側検定では片側のみで0.05なので、当然片側検定の方が有意差が出やすくなる。
通常は両側検定をしておけば間違いない。



検定の手順
検定法の選択
尺度の観察
  計量尺度(比例尺度、間隔尺度)・・・・・・・パラメトリック・・・・・・・二項検定、t検定、平均値の検定など
  順序尺度、順序分類尺度、名義尺度・・・・ノンパラメトリック・・・・Wilcoxon検定、U検定、カイ二乗検定など 


仮説の設定
帰無仮説の設定
例:「薬に対する反応の平均がプラセボに対する反応の平均と等しい
   どちらの反応も正規分布に従うがその標準偏差は両者で等しく、平均を問題とする」
対立仮説の設定
  「薬に対する反応の平均がプラセボに対するそれと差がある


統計量の算出
標本データから、仮説に関係した情報を一つの数値に要約する。
このような統計量を検定統計量または十分統計量という。

母数に対応する十分統計量は、母集団の確率分布が指数型分布族である場合、かつその場合にのみ存在する。
例で言えば、2つの標本平均の差m1 − m2は十分統計量である。


確率の計算
帰無仮説から、統計量X(平均値の差)の期待値は0である。
しかし、実際には有る値を持っている。
統計数値表から統計量Xの確率が求まる。


危険域の設定
危険域
可能な全ての値の集合の中で、仮説に反する極端な範囲(分布関数をグラフ表示した場合には、裾に当たる部分)を選ぶ。
これは検定統計量の危険域(Critical region)と呼ばれる。

危険率(有意水準、ふつうαと表す)
仮説が正しい場合に検定統計量が危険域内に入る確率を検定の危険率と言う。
危険率として具体的には0.05(5%)、0.01(1%)などを用いることが多い。

両側検定
仮説が例のように「平均が等しい」と主張するタイプであれば、分布関数の裾として左右両側を用いる。

片側検定
「・・・の方が平均が大きい(小さい)ということはない」と主張するタイプであれば、片側の裾だけを用いる(片側検定)。
検定の種類によっては両側検定または片側検定のみということもある。


判定
統計量Xの生じる確率P(これをp値という)を求め、これとαとを比較し、p < αならば危険域の内部にあると判断する。

P <α
検定統計量が危険域内にある。
仮説は正しくない。
従って帰無仮説を棄却する
(これから危険域のことを棄却域Rejection regionともいい、それ以外の範囲は採択域Acceptance regionという)
α水準で統計学的に有意であるという。

P>α
検定統計量が危険域の外側にある。
仮説を棄却するに足る証拠はないというのがただ1つの結論となる。
従って、対立仮説を採用する。



参考資料
「統計学要論」 (共立出版 1975)
「バイオサイエンスの統計学」 (南江堂 1994)
「医学・公衆衛生学のための統計学入門」 (南江堂 1988)
「図解 確率・統計の仕組みがわかる本」 (技術評論社 2008 長谷川勝也)
「Excelでここまでできる統計解析」 (日本規格協会 2007 今里健一郎 森田浩)


 「ファンタジ-米子・山陰の古代史」は、よなごキッズ.COMの姉妹サイトです
   ファンタジ-米子・山陰の古代史   







統計学的仮説検定  (Statistical hypothesis testing)
統計学的仮説検定
ある仮説が正しいといってよいかどうかを統計学的・確率論的に判断するためのアルゴリズム(問題を解くための効率的手順を定式化した形で表現したもの)である。