確率論に関する法則
大数の法則(law of large numbers
十分に大きい標本数(サンプル数)の無作為抽出実験を行ったときに、その標本比率が母集団の確率に等しくなっていく(収束する)性質。
例えば、全ての面の出現率が等しいさいころを、十分に大きな回数だけ振ったときに、各面の出る回数の割り合い(標本比率)は(1/6)に近づいていく。


中心極限定理

標本平均と真の平均との誤差を論ずるものであり、多くの場合、母集団の分布がどんな分布であっても、その誤差はサンプルのサイズを大きくしたとき近似的に正規分布に従う。
すなわち、元の集団が正規分布ではなくても、標本数が多くなるにつれ、その標本の平均の分布は正規分布に近くなる。
   この平均の分布の平均値・・・元の集団と同じ
   分散・・・1/標本数(N)
   標準偏差・・・1/ルート(N))



確率変数と確率分布
確率変数
その数によってある確率が定まる変数のことを確率変数という。
例えばある変数Xに対して,X=xiになる(事象の)確率piが与えられているとき,そのXのことを確率変数という。

 ①離散確率変数
    確率変数Xのとる値が離散的である場合
    例:サイコロを投げた時に出る目の数字など

 ②連続確率変数
    確率変数Xのとる値が連続的である場合
    例:ある競技における参加者の体重など

確率分布
確率変数Xがとる値と、その値に関する確率をまとめて表したもの。

確率分布には以下のものがある。
 ①離散的分布
    二項分布 幾何分布 負の二項分布 ポアソン分布 超幾何分布
 ②連続的分布
    正規分布 標準正規分布  t分布  カイ2乗分布  ガンマ分布  ベータ分布  F分布など



各種の確率分布
正規分布
正規分布とは
平均値の付近に集積するようなデータの分布を表した連続的な変数に関する確率分布。

正規分布の特徴
自然界(特殊な要因がない集団)には正規分布に従う分布が非常に多く、たとえば誤差の分布、身長の分布、など正規分布に従う。

分布の標準偏差(σ)が小さいと、中心が高く細長い形となり、逆に大きいと、中心が低く平べったい形となる。
これは、平均値に近づくほど頻度(確率)が大きくなり、平均値から離れるほど(分布の左右に離れるほど)、頻度(確率)が小さくなることを意味している。

元々正規分布ではない分布でも、そこから得られるサンプルの平均の分布は正規分布に近づくという性質がある。これはこれ中心極限定理で説明することがでる。

正規分布の統計的意味
確率変数 XN(μ, σ2) に従う時、平均 μ からのずれが ±1σ 以下の範囲に X が含まれる確率は 68.26%, ±2σ 以下だと 95.44%, さらに ±3σ だと 99.74% となる。

正規分布は、t分布やF分布といった種々の分布の考え方の基礎になっているだけでなく、実際の統計的推測においても、仮説検定、区間推定など、様々な場面で利用される。

実際に検定などにおいて正規分布を用いる時は、確率変数 x を標準化した変数 z = (x − μ)/σ が標準正規分布に従うことを利用する場合がほとんどである。

不連続値をとる確率変数についての検定の場合でも、連続変数と同様の考え方で正規分布を近似的に用いることがある。
これは標本の大きさ n が大きく、かつデータの階級幅が狭いほど、近似の精度が高い。

確率密度関数から実際に値を求める場合は少なく、標準正規分布表とよばれる、変量に対応した確率をあらわす一覧表から値を算出する場合がほとんどである。

正規分布の適用
大標本の平均値の統計には、正規分布が仮定されることが非常に多い。

自然界"の事象(無機的なそれ)の中には、正規分布に従う数量の分布をとるものがあることが知られている。

社会現象、生物集団の現象等々、種別から言えば、正規分布に従うものはむしろ少数派であることが確認されている。
人間は自然界の事象とはちがって自分の意思をもっているため、たとえば、子供の成績などは決して正規分布にはならない

正規分布の確率密度関数
      


標準正規分布
標準正規分布とは
平均が0、標準偏差が1の正規分布を標準正規分布という。

標準正規分布の特徴
正規分布を標準正規分布に変換すると、標準正規分布表を使ってある区間の確率を求めることができる。

t分布
t-分布とは
標本値から母集団の平均値を統計的に推定する区間推定や、母集団の平均値の仮説検定に利用できる分布。

特徴
正規分布と同様ベル型の分布で、正規分布よりも頂点が高くすそが厚い形状をしている。
正規分布が平均と標準偏差によって分布が決定するのに対し、t分布は標本の自由度(n-1)によって分布が決定する。

自由度(n-1)が大きくなると(標本数nが大きくなると)、t分布は正規分布に近づく性質がある。
t分布は、t検定で用いられる。

t-分布の確率密度関数
      
        
       Γはガンマ関数を表し、次式で定義される     

                            期待値       

                            分散       
      



参考資料
「統計学要論」 (共立出版 1975)
「バイオサイエンスの統計学」 (南江堂 1994)
「医学・公衆衛生学のための統計学入門」 (南江堂 1988)
「図解 確率・統計の仕組みがわかる本」 (技術評論社 2008 長谷川勝也)
「Excelでここまでできる統計解析」 (日本規格協会 2007 今里健一郎 森田浩)
「エビデンス主義 統計数値から常識のウソを見抜く」 (角川SSコミュニケーションズ 2009 和田秀樹)


 「ファンタジ-米子・山陰の古代史」は、よなごキッズ.COMの姉妹サイトです
   ファンタジ-米子・山陰の古代史   







確率論(Probability theory)
確率論とは
「ある現象の次の状態は、部分的には前の状態から決定されるが、完全に前の状態には依存しておらず、確率的な予言しかできない偶然現象に対して数学的なモデルを与え、解析する数学の一分野である」、と定義されている。