誤差論と最小二乗法

第3回 – いろいろな確率分布

今回は、前回紹介した確率分布の実際の例をいくつか見ていきたいと思います。

 

1.離散型の確率分布

1.1 二項分布

成功か失敗かの二つの結果が出る実験を考えます。成功の確率をImage_001とすれば、失敗の確率はImage_002となります。この実験を独立に(つまり、前後に関連性はなく) Image_004回繰りかえした時,Image_005回成功する確率分布が二項分布です(図1)。

 

     Image_003_1

ここで、Image_003_2は、Image_004個からImage_005個を選ぶ組み合わせの数です。

 

     Image_003_3

 

と展開してみると、Image_005回成功すればのこりのImage_007回は失敗ですからすべての場合の確率を足すと1となり、(1)が確率分布を与えることがわかります。

 

Image_008

図1. 二項分布の例(左:n=6,p=0.2、右:n=6,p=0.5)

 

 

 

二項分布の平均、分散は、

 

     Image_011

 

です。

 

1.2 一様分布

サイコロを振った時に出る目の確率はどの目でも同じです。このような確率分布を離散一様分布といいます(図2)。

 

     Image_012

 

サイコロの場合は、N=6です。

指数分布の平均と分散は、それぞれ

 

     Image_013

 

となります。

 

Image_014

図2. 一様分布

 

2.連続型の確率分布

2.1 正規分布

正規分布は、統計学において最も重要な分布関数です。ガウスが導いた誤差関数に由来するのでガウス分布とも呼ばれ、測量の分野では最も多く使われています。

正規分布の密度関数は、

 

     Image_015

 

と書かれます。ここでexpは指数関数で、Image_017です。

この密度関数から、平均と分散を計算すると、

 

     Image_016

 

となるので、正規分布(3)は平均値と分散で決まり、Image_018と表します。グラフを書くと、平均値のときが最大で左右対称となるおなじみの釣り鐘型の形をしています(図3)。また、平均値が0、分散が1の正規分布を標準正規分布といいImage_019と書きます(図4)。

 

図3. 正規分布

図3. 正規分布

 

図4.いろいろな正規分布

図4.いろいろな正規分布

 

 

正規分布の場合、基本的な区間確率がよく使われます。確率変数Image_022Image_023に入る確率をImage_024とすれば、

 

     2019-09-06_10h28_17

 

となり、値が標準偏差Image_026内に落ちる確率は約68.3%、Image_027内に落ちる確率は約95.4%、Image_028内に落ちる確率は約99.7%です。Image_028範囲を外れることは極めて起こりえないと判断されます(図5)

 

図5. 正規分布の基本的な区間

図5. 正規分布の基本的な区間

 

 

正規分布は、統計学において他の分布の近似や統計的推定など多くの場合に利用されています。その正当化の大きな理由が次の中心極限定理です。

 

中心極限定理:ある適当な確率分布を持ったn個の独立な確率変数があるとき、それらの和は(一般的な条件の下で)、nが大きくなれば正規分布に従うようになる。

 

この定理により1.1で述べた二項分布は、nが大きい時正規分布に近づきます。また、実験や計測におけるランダム誤差は、独立で小さな誤差が多数集まって生じると考えてよい場合、正規分布(及びその多次元分布(次回))を仮定することが多いのです。

 

ただし、実際の分布でそのまま正規分布となるものは、測定誤差や生物測定(身長・体重など)などを除けばそれほど多くはありません。

 

 

2.2 指数分布

 確率密度関数

 

     Image_031 

 

を持つ分布を指数分布といい、寿命や故障までの時間など待ち時間を表す時によく使われます(図6)。

平均、分散はそれぞれ、

 

  Image_032

 

となります。

 

 図6. 指数分布

図6. 指数分布

 

 

次回は、多次元の確率分布についてです。

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page