誤差論と最小二乗法

第2回 その1 – 確率変数と確率分布

1.確率変数

前回お話したように、私たちが扱うデータは何らかの観測や測定をして得られたものです。

 

ただし、それらの値は厳密に求めることはできません。測定器の誤差や限界もあり、また、むやみに桁数を上げても意味のない場合がほとんどです。

 

測量でも普通、距離はmmまで測れば十分でしょう。体重でしたらg以下の値は様々な原因で変動するので意味がありません。

 

他方、私たちが知りたいものが平均的な値や傾向の場合もあります。例えば、物の値段や学力テストの結果などは、平均的な値が知りたいので、一つ一つの測定値は知りたい値の周りをばらつくこととなります。

 

従って、数値データにはつねに何らかの要因で変動、ばらつきが加わっています。

 

そのような偶然(ランダム)な変動を確率論の法則にしたがうとみなすことによって数学的な取り扱いを可能とし、得られたデータの分析や合理的な判断を下すための理論が統計学といえましょう。

 

ある変数の値が事前にわからずある確率で現れるとき、そのような変数のことを確率変数と呼びます。

 

確率変数には、サイコロの目のように離散的な値をとる場合もあれば、長さや重さのようにある範囲にわたって連続的な値をとることもあります。

 

2.確率とは

ここで、確率について基礎的なことをまとめておきます。少し数学的(抽象的)になりますが、現代の確率論は、幾何学や代数学と同じように公理(証明なしで成り立つものとする仮定)から出発して組み立てられます(注および参考文献1参照)。

 

確率の定義:

何かの実験を行うとして、起こりうるすべての結果の集合を標本空間S

標本空間の部分集合を事象Aとして

確率とは、各事象Aに対して数image001を与える関数image002

確率の3公理

1. image003

2. image004

3. image005ならimage006

を満たすもの。

 

(標本空間は標本という言葉を使っていますが、サンプリングの意味の標本とは異なりますので注意。またimage007は要素がない集合(空集合)です。)

 

集合を絵で表すとわかりやすくなります。

 

Sはすべての結果、事象は部分的な結果の集まりです(図1)。image008はAまたはBに含まれる結果、image009はAとBどちらにも含まれる結果、image010はAに含まれるがBには含まれない結果を示しています(図2)。

 

従って、image011はAまたはBの結果が起きる確率、image012はAとBが同時に起きる確率を示します。  image004は、得られた結果は必ずSの中にあるということを示します。

 

image013

図1.標本空間とその部分集合の事象の例

 

image014

図2.集合の和(image008)、積(交わり)(image009)、差(image010)

 

ただし、事象を表す集合は「大きさ」が定義できるような集合であることが必要です。

 

確率は事象の「大きさ」を表すもので、それが定義できなければならないからです。事象はなんらかの結果を含んだものですが、他の結果との和や交わり、差もまた事象となります。

 

そのような操作を繰り返して作られた集合のあつまりとして事象が定義されています。

 

確率の公理から、いくつかの結果を導くことができます。

AとBを任意の事象として、

 

image015

image016

(1)は当然ですし、(2)は図2と公理3を使って証明できます。

 

条件付き確率と独立事象

ある事象Aの確率を考えるとき、他の事象Bが起きたか起きなかったかでその確率が影響されるときがあります。B が起こった時にAが起きる確率を条件付確率image017といい、つぎのように定義されます。

 

image018

変形すると      image019

 

となります。

 

また、AとBがお互いに影響を及ぼさない場合、二つの事象は独立といい、image020ですから二つが同時に起きる確率は(4)より次のようになります。

 

image021

 

確率変数の定義

1.で述べた確率変数を数学的に定義すると、確率変数とは標本空間Sの要素である結果に実数値を対応させる関数image022です(図3)。

 

例えば、コインを投げた時、表を1、裏を0とすれば結果は0と1で表せますし、サイコロでしたら、出た目の数を確率変数とすれば、結果は1から6の数字で表せます。

 

長さや重さの場合は、測定値をそのまま確率変数と考えることができます。

 

また、確率はもともと事象に対して定義されているので、確率変数の値の集合はもとの事象と対応づけられていることが必要です。

 

文献では、確率変数は大文字で、実現値は小文字で書かれることが多いようです。

 

image023

図3.確率変数:結果を数値で表す

 

例1.コイン投げの確率

2枚のコインを投げた時、表の出る確率を考えましょう。

 

標本空間は起こりうるすべての結果ですから、image024となります。コインに偏りがなければ、1/2の確率で表か裏が出ますから、

 

image025

 

です。

 

確率変数を出た表の数と定義しましょう。すると、

 

image026

 

確率変数がおのおのの値となる確率は、

 

image027

 

となります。

 

なお、測量における確率変数は、観測値である基線ベクトル、距離、水平方向、水平角、高低角及び水準比高などです。

 

最近では、ネットワーク型RTK及び精密単独測位による座標値が確率変数として扱われています。

 

(注) 確率の定義は歴史的に、

(古典的定義) 同程度に確からしいn個の可能性があって、そのうちm個が事象Aを支持する結果だったとすれば、事象Aの確率は、

 

image028

 

及び

 

(頻度による定義) 実験をn回繰り返して、ある事象Aに属する結果が出た頻度をimage029とするとき、nを無限に大きくしていった時の相対頻度の極限をAの確率とする:

 

image030

 

がありましたが、どちらも理論的には完全でない概念を含んでいるため(例えば、「同程度に確からしい」、極限の存在等)、現在は上で述べた公理的な確率の定義が採用されています。

 

(第2回 その2 確率変数と確率分布 につづく)

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page