G空間データソリューションセンター

最近の記事

バックナンバー

タグ

新機能の紹介

G空間データソリューションセンター

誤差論と最小二乗法

第2回その2 – 確率変数と確率分布

2019年08月05日

3. 確率分布

確率分布は、確率変数の値とその値が出現する確率の関係を表したものです。

分布関数の定義：確率変数の値が以下となる確率を

と定義して、(累積)分布関数といいます。

分布関数の性質として、

が成り立ちます（図4及び図5参照）。

離散型の確率変数

確率変数が離散的な場合は、取り得る個々の値の確率が決まりますから、

を確率(密度)関数といいます。

例1のコイン投げの分布関数と確率関数を図4に示しました。

図4．累積分布関数と確率関数

連続型の確率変数

確率変数の累積分布関数が、関数によって次のように書けるとき

確率変数は連続であるといいます。は確率密度関数と呼ばれます(図5)。その時、確率変数がとの間の値をとる確率は、

と計算できます。これは、からまでの間での下の面積となります(図6)。

　もちろん、

なので、全区間におけるの下の面積は１となります。

図5．累積分布関数と確率密度関数

図6．：影を付けた面積

4. 確率分布の指標

確率分布の特徴を表す指標として、特に重要なものが期待値と分散です。

期待値

期待値は英語のExpectationの頭文字で表示し、確率変数の値の(重み付き)平均として、次のように定義されます。

は、Xの取りうる値にその確率（重み）をかけて足したものです。一般にXの平均値とも呼ばれ、よく(ミュー)と書かれています。

分散

分散（Variance）は、確率変数の値のばらつきの度合いを示すものです。平均値とおいて、分散Vは

と定義されます。平均からのずれの二乗の平均です。和の形で表すと、

となります。計算には次の式が便利です。

また、分散の正の平方根を標準偏差と呼びます。多くの場合、標準偏差の値を(シグマ)、分散の値をと書きます。ただし、昔、標準偏差が独語の中等誤差(mittleren Fehler)の名称で使われていたことから、現在でも日本の公共測量作業規程の準則など多くの文献で、その頭文字であるmの記号を使っている場合があります。

参考文献

1． Koch, K-R., Parameter Estimation and Hypothesis Testing in Linear Models, Springer, 1999.

2．東京大学教養学部統計学教室編: 統計学入門, 東京大学出版会, 2018.

次回は、いろいろな確率分布と計算例についてです。

（第3回いろいろな確率分布につづく）

Share on Facebook

Tweet about this on Twitter

Share on LinkedIn

Email this to someone

Print this page