誤差論と最小二乗法
第2回 その2 – 確率変数と確率分布
2019年08月05日
3. 確率分布
確率分布は、確率変数の値とその値が出現する確率の関係を表したものです。
と定義して、(累積)分布関数といいます。
分布関数の性質として、
が成り立ちます(図4及び図5参照)。
離散型の確率変数
確率変数が離散的な場合は、取り得る個々の値の確率が決まりますから、
を確率(密度)関数といいます。
例1のコイン投げの分布関数と確率関数を図4に示しました。
連続型の確率変数
確率変数は連続であるといいます。は確率密度関数と呼ばれます(図5)。その時、確率変数が
と
の間の値をとる確率は、
と計算できます。これは、から
までの間で
の下の面積となります(図6)。
もちろん、
4. 確率分布の指標
確率分布の特徴を表す指標として、特に重要なものが期待値と分散です。
期待値
期待値は英語のExpectationの頭文字で表示し、確率変数の値の(重み付き)平均として、次のように定義されます。
は、Xの取りうる値にその確率(重み)をかけて足したものです。一般にXの平均値とも呼ばれ、よく
(ミュー)と書かれています。
分散
分散(Variance)は、確率変数の値のばらつきの度合いを示すものです。平均値とおいて、分散Vは
と定義されます。平均からのずれの二乗の平均です。和の形で表すと、
となります。計算には次の式が便利です。
また、分散の正の平方根を標準偏差と呼びます。多くの場合、標準偏差の値を(シグマ)、分散の値を
と書きます。ただし、昔、標準偏差が独語の中等誤差(mittleren Fehler)の名称で使われていたことから、現在でも日本の公共測量作業規程の準則など多くの文献で、その頭文字であるmの記号を使っている場合があります。
参考文献
1. Koch, K-R., Parameter Estimation and Hypothesis Testing in Linear Models, Springer, 1999.
2. 東京大学教養学部統計学教室編: 統計学入門, 東京大学出版会, 2018.
次回は、いろいろな確率分布と計算例についてです。