誤差論と最小二乗法

第2回 その2 – 確率変数と確率分布

3. 確率分布

確率分布は、確率変数の値とその値が出現する確率の関係を表したものです。

 

分布関数の定義:確率変数の値がimage031以下となる確率を

 

image032

 

と定義して、(累積)分布関数といいます。

 

分布関数の性質として、

 

image033

image034

 

が成り立ちます(図4及び図5参照)。

 

離散型の確率変数

確率変数が離散的な場合は、取り得る個々の値の確率が決まりますから、

 

image035

 

を確率(密度)関数といいます。

 

例1のコイン投げの分布関数と確率関数を図4に示しました。

 

image036図4.累積分布関数image037と確率関数image038

 

連続型の確率変数

確率変数image039の累積分布関数が、関数image040によって次のように書けるとき

 

image041

 

確率変数は連続であるといいます。image042は確率密度関数と呼ばれます(図5)。その時、確率変数がimage043image044の間の値をとる確率は、

 

image045

 

と計算できます。これは、image043からimage044までの間でimage042の下の面積となります(図6)。

 もちろん、

 

image046

 

なので、全区間におけるimage042の下の面積は1となります。

 

image047図5.累積分布関数image037と確率密度関数image042

 

 

image048
図6. image049:影を付けた面積

 

4. 確率分布の指標

確率分布の特徴を表す指標として、特に重要なものが期待値と分散です。

 

期待値

期待値は英語のExpectationの頭文字image050で表示し、確率変数の値の(重み付き)平均として、次のように定義されます。

 

image051

image052

 

image053は、Xの取りうる値にその確率(重み)をかけて足したものです。一般にXの平均値とも呼ばれ、よくimage054(ミュー)と書かれています。

 

分散

分散(Variance)は、確率変数の値のばらつきの度合いを示すものです。平均値image055とおいて、分散Vは

 

image056

 

と定義されます。平均からのずれの二乗の平均です。和の形で表すと、

 

image057

image058

 

となります。計算には次の式が便利です。

 

image059

 

また、分散の正の平方根を標準偏差と呼びます。多くの場合、標準偏差の値をimage060(シグマ)、分散の値をimage061と書きます。ただし、昔、標準偏差が独語の中等誤差(mittleren Fehler)の名称で使われていたことから、現在でも日本の公共測量作業規程の準則など多くの文献で、その頭文字であるmの記号を使っている場合があります。

参考文献

1. Koch, K-R., Parameter Estimation and Hypothesis Testing in Linear Models, Springer, 1999.

2. 東京大学教養学部統計学教室編: 統計学入門, 東京大学出版会, 2018.

 

次回は、いろいろな確率分布と計算例についてです。

 

(第3回 いろいろな確率分布 につづく)

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page

目次へ戻る