z検定(平均値の検定)
概念
Z検定
正規分布を用いる統計学的検定法で、標本の平均と母集団の平均とが統計学的にみて有意に異なるかどうかを検定する方法である。
すなわち、母集団と標本集団の平均値を検定し、両者に差がある(あるいは無い)事を確かめる事。

Z検定を用いるための必要条件
最も重要なのは、Z検定は母集団の平均と標準偏差(母数)を用いるものであるから、これらがわかっていなければならない、ということである。
標本は母集団から抽出された単純ランダム標本でなければならない。

また母集団は正規分布に従うことがわかっていなければならない。
ただし母集団が正規分布に従うかどうか判然としない場合でも、用いる標本のサイズが十分大きければ(一般に30から40以上ならば)よい。

母数が不明の場合
母数を正確に知るのが不可能な場合には、スチューデントのt検定(t分布を用いるので母数を扱う必要がない)を用いるのが現実的である。

Z検定の種類
①標準偏差既知の母集団の平均がある値xに等しいかどうかを検定する場合。
   帰無仮説は「母集団の平均値はある値xに等しい」とする。
   Z値を求める。
   Z値が棄却限界値より大の場合は帰無仮説を棄却し、母集団の平均値はある値xに等しくないと判断する。

②2標本X、Yの母集団の平均値がある値に等しいかどうかを検定する場合。ただし、母集団の標準偏差は既知とする。     帰無仮説は「2つの母集団の平均値は等しい」である。
   Z値を求める。
   Z値が棄却限界値より大の場合は帰無仮説を棄却し、母集団の平均値はある値xに等しくないと判断する。


検定方法
(1)仮説の設定
H:母集団の平均値(μ)と標本集団の平均(Xbar)に差がない。(H:Xbar=μ

(2)統計量の計算
データを要約して標本の平均値Xbarを求める

(3)確率の計算
 母分散が既知の場合
   母平均をμ,母分散をσ ,標本平均をXbar、標本数はnとする。
       
   これは平均0,分散1の標準正規分布に従うことを利用して検定する.
   帰無仮説はH0:Xbar= μである。

 母分散が未知の場合
   大抵の場合,母分散は分からない。
   ここでは,母集団が正規分布に従っていることが仮定されている
   母集団が正規分布である場合、次式は自由度n-1のt分布に従うことを利用して検定する。
   ここでも帰無仮説はH0:Xbar= μである。
           sは標本標準偏差

(4)判定
   P値<α ならば、H0を棄却する。


エクセルを用いた実施方法
平均値の検定には「ztest」を用いる

ZTEST 関数
仮説の母集団平均μ0 について、配列で指定されたデータの観測値平均 (観測された標本平均) よりも標本平均が大きくなる確率を返す。

書式 ZTEST(配列,μ0)
  配列  μ0 の検定対象となるデータを含む数値配列またはセル範囲を指定します。
  μ0  検定する値を指定します。
  σ    母集団全体に基づく標準偏差を指定します。省略すると、標本に基づく標準偏差が使用されます。



t検定(ティーけんてい)
t検定の概念
t検定とは
t検定
帰無仮説が正しいと仮定した場合に、統計量がt分布に従うことを利用する統計学的検定法の総称である。
母集団が正規分布に従うと仮定するパラメトリック検定法であり、t分布が直接もとの平均や標準偏差にはよらない(ただし自由度による)ことを利用している。

利用方法
2組の標本について平均に有意差があるかどうかの検定などに用いられる。


t検定の種類
(1)2つの母集団がいずれも正規分布に従うと仮定した上での、平均が等しいかどうかの検定。
  ①標本が対になっている。
     つまり1組の標本のメンバー各々ともう1組の特定のメンバーとの間に特別な関係がある。
     (たとえば、同じ人に前後2回調査する場合、夫と妻とで比較する場合など)。
 
  ②標本が独立で、比較する2つの群の分散が等しいと仮定できる場合(等分散性の仮定)。

  ③標本が独立で、等分散性が仮定できない(異分散)場合。
   これは正確にはウェルチのt検定と呼ばれる。

(2)正規分布に従う母集団の平均が、特定の値に等しいかどうかの検定。

(3)回帰直線の勾配が0と有意に異なるかどうかの検定



t検定の方法
前準備
t検定を行う前段階として、標本に関して次のような検定が必要な場合もある。

標本が正規分布に従うかどうか
コルモゴロフ-スミルノフ検定やシャピロ-ウィルク検定などの正規性検定によって判断できる。

標本の分散が等しいかどうか
F検定やバートレット検定などにより判断できる。
統計パッケージではこの判断を自動的に行ってt検定の種類を選択するものもある。


等分散の場合の平均の検定(one sample t-tes)t
比較する両群をX1, ..., XmおよびY1, ..., Yn(標本サイズはmおよびn)とする。
両群から標本平均XbarおよびYbar、ならびに不偏分散UxおよびUyを求める。
両群を合わせた分散の推定値Ueを次式から算出する。
 
     

これから検定統計量t0 を次式により算出
  
     

両群の平均が等しい場合には「統計量T は自由度ν = m + n – 2 のt分布に従う」ので、これを帰無仮説として両側検定を行う。
このt分布におけるt0の上側のp値を求め、有意水準αと比較する(あるいは数表で比較を行う)。
p < α ならば帰無仮説は棄却され、「両群の平均には有意差がある」といえる。


異分散の場合の平均の検定(ウェルチのt検定)
比較する両群をX1, ..., XmおよびY1, ..., Yn(標本サイズはmおよびn)とする。
両群から標本平均XbarおよびYbar、ならびに不偏分散UxおよびUyを求める。
検定統計量t0 を次式より算出する。

      

t分布の自由度νは次式より算出される。

      

これは整数になるとは限らないので、10未満の場合は小数自由度のt分布表を利用する。
10以上ならば小数部を切り捨て整数部のみを使用してよいとされる。


対応のある場合のt検定(Paired t-test)
n 対のデータがあるとし、対応する2変数をXiYi 、両者の差をdi = Xi - Yi とする(i = 1, 2, ... , n)。
di の平均をd barとする。
検定統計量 t0 を次式より算出する。
      

t分布の自由度はν = n -1となる。


t検定に対応するノンパラメトリック検定
t検定は正規分布を仮定するパラメトリック検定である。
この条件が満たされない場合には、対応するノンパラメトリック検定を使う。

  標本が独立ならば→→→→マン・ホイットニーのU検定
  対になる標本ならば →→→二項検定、またはウィルコクソンの符号順位検定



t検定の実際-1 「1標本t検定」 (one sample t-test)
概念
目的
1標本の母平均がある基準値と等しいかどうかを調べる手法
すなわち、A群の平均値μに対して、μという値が等しいか否かを検定する。


同じ人で薬を飲む前と後で血糖値を測定した場合。


検定方法
(1)仮説の設定
帰無仮説 H0:μ=μ (2群間に差がないと仮定する)
対立仮説 H1:μ≠μ (2群間に差があると仮定する)

(2)統計量の計算
各組の差dを求め、この平均値d-barを統計量とする。
その後、下の式でt値を出す。
         Sdは差dの標準偏差で、nはデータ数である。

(3)確率の計算
このとき、tαは自由度df = n-1のt分布に従い、t分布表からtαの値を探す。

(4)判定
|t|≦tαのとき、P≧αとなり帰無仮説を棄却できない。
|t|>tαのとき、P<αとなり帰無仮説を棄却する。有意差あり。


t検定の実際-2 「関連2標本t検定」 (Paired t-test)
概念
目的
対応するデータの差の平均値が0からどの程度偏っているかを検定する方法である。
対応のある2標本のデータは、普通は差や比を求めて1標本に還元して扱う。
「平均値の差」ではなく、「差の平均値」=変化量が同じかどうかを検定する。
すなわち、差をデータとした1標本t検定に他ならない。
したがってこの手法の計算法は、1標本t検定におけるデータxを前後の差dで置きかえたものになる。


慢性肝炎患者に薬剤Aを投与することによって、投与前後でGOTが低下するかどうか

補足
nが多いときには、「対応するデータの差が正規分布」でなくても、使うことができる。
極端な値や離散値であり、明らかに前提条件(正規分布に従う連続変数)から離れている場合を除いて、問題が生じることは少ない。


検定方法
(1)仮説の設定
帰無仮説 H0:2群間に差がない、と仮定する。 (H0:μa=μb  またはH0:δ=μab=0)
対立仮説 H1:2群間に差がある、と仮定する。

(2)統計量の計算
2群データの差diと差の平均d-barを計算する。
      di=XAi-XBi dbar=∑di/n
そして,次にデータの差の分散Vを計算する。
      V=∑(di-dbar)^2/(n-1)    (n=データの個数 , XAi=A群のデータ , XBi=B群のデータ)
ここでの差の平均と,差の分散を用いて検定統計量t0を計算する。

(3)確率の計算
      t0=|d-bar|/(V/n)

(4)判定
両側検定のとき]
   t0<t(n-1,α) ならは、「危険率100α%で有意な差がない」
   t0≧t(n-1,α) ならは、「危険率100α%で有意な差がある」

片側検定のとき]
   t0≧t(n-1,2α)ならは、「危険率100α%で大きい(小さい)」


t検定の実際-3 「独立2標本t検定」 (Student's t-test)
概念
目的
平均値を比較して検定する。
対応のない2標本のデータは差や比を求めて1標本に還元することができないので、データをそのまま用いて「2標本t検定(two sample t-test)」または「対応のないt検定」と呼ばれる検定と、それに伴う推定を適用する。


正常人と糖尿病患者の血糖値の値に差があるかどうか。

補足:関連2群と独立2群の違い
「同じ個体」で調べるのが関連2群。
「違う個体」で調べるが独立2群。


検定方法
(1)仮説の設定
帰無仮説 H0:2群間に差がない、と仮定する。 (H0:μNH  またはH0:δ=μHN=0)
対立仮説 H1:2群間に差がある、と仮定する

(2)統計量の計算
正規分布しており、等分散していると分かったとする。
平均値x、分散s2を求める。

(3)確率の計算
t値を下の式より求める。
      

このときのsは両群の分散s12,s22から合成した分散であり、下の式から求めることができる。
      
また、このときの自由度dfは n1+n2-2のt分布に従う。
自由度dfを求めたらt分布表からtαを求めて、計算したt値と比較する。

(4)判定
|t|≦tαのとき、P≧αとなり帰無仮説を棄却できない。
|t|>tαのとき、P<αとなり帰無仮説を棄却する。有意差あり。



F検定
F検定の概念
F検定とは
F検定とは、正規分布に従う母集団から得られる2つの標本の分散が等しいかどうか判断する検定手法で、等分散性の検定や、分散分析で用いらる。
2標本を使った分散の検定。
一般に統計量Fとは、2つの群の標準偏差の比であって、両群とも正規分布に従う場合にはFはF分布に従う。
これを用い、Fの計算値が片側有意水準内に入るかどうかを検定するのがF検定である。


F検定の目的
独立2群の差の検定の場合、二標本t検定には「正規分布である」、「等分散である」の二つの条件が必要である。
そのため、たとえ正規分布していても等分散でなければ二標本t検定を使ってはいけない。

この等分散かどうかを調べるためにF検定がある。
二標本t検定をする前にF検定をして等分散であることを確認する必要がある。

もし、F検定で「等分散でない」と検定されたなら二標本t検定ではなくてWelch法やMann-Whitney検定で検定しなくてはならない。


正規分布に従う2つの群の「標準偏差が等しい」という帰無仮説の検定。
これはt検定の前段階の「等分散性検定」として用いられる。


正規分布に従う複数の群(標準偏差は等しいと仮定する)で、「平均が等しい」(つまり同じ母集団に由来する)という帰無仮説の検定。
この方法は分散分析に用いられる。


F検定の方法
検定方法
(1)仮説の設定
  帰無仮説H0:「2標本の分散は等しい」
  対立仮説H1:「2標本の分散は等しくない」

(2)統計量の計算
最初にそれぞれの群のデータ数n、標準偏差、分散s12,s22を求める。

(3)確率の計算
各群の分散を求めることができたなら、下の式によってF値を出す。
ただし、分子に大きい数値の方をとる。
        
このとき、自由度は分子の自由度df1=n1-1、分母の自由度df2=n2-1のF分布に従う。自由度が求まったらF分布表からFαを求めることができる。

(4)判定
1≦F≦Fαのとき、P>0.05となる→帰無仮説を棄却できない→等分散である。
F>Fαのとき、P<0.05となる→帰無仮説を棄却する→不等分散である。



参考資料
「統計学要論」 (共立出版 1975)
「バイオサイエンスの統計学」 (南江堂 1994)
「医学・公衆衛生学のための統計学入門」 (南江堂 1988)
「図解 確率・統計の仕組みがわかる本」 (技術評論社 2008 長谷川勝也)
「Excelでここまでできる統計解析」 (日本規格協会 2007 今里健一郎 森田浩)


 「ファンタジ-米子・山陰の古代史」は、よなごキッズ.COMの姉妹サイトです
   ファンタジ-米子・山陰の古代史   







パラメトリック検定
計量尺度(比例尺度、間隔尺度)

  1標本・・・・・・・・・・・平均値の検定、1標本t検定
  2標本
     関連2標本・・・・1標本t検定、平均値の検定、t検定、F検定など
     独立2標本・・・・2標本t検定、F検定(等分散の検定)
  多標本
     関連多標本・・・二元配置分散分析、Bartlett検定
     独立多標本・・・一元配置分散分析、Bartlett検定