誤差論と最小二乗法

第4回 その1 – 多次元の確率変数と確率分布

 

私たちが実際に取り扱う現象は、一つの確率変数で記述できるとは限りません。例えば、衛星測位の場合、3次元位置の場合は3つ、水平位置なら2つの変数になります。多次元の場合、相関や共分散など一次元ではなかった概念が出てきます。以下、簡単のため2つの確率変数の場合で説明したいと思います。一般の場合に拡張するのはそれほど難しくありません。

 

1.同時確率分布と周辺確率分布

2つの確率変数image001を考えましょう。これらが同時にimage002となる確率:image003を同時確率分布といいます。image004は2変数の関数image005:同時確率密度関数で表されます。image005は一次元の時と同様に確率分布の条件である、

 

 image006

image007

 

を満たす必要があります。ここでSはimage008の取り得る範囲(一般に2次元平面)です。

 

周辺確率分布

image001のうち一つだけに注目した時の確率分布を周辺確率分布といいます。密度関数は、

 

image009

image010

 

が得られ、これらを周辺確率密度関数といいます。例えば、image001の離散同時確率分布image005が表1のように与えられていたとしましょう(image011)。周辺確率分布は文字通り周辺にあり、image012のようになります。さらにグラフ化したものが図1です。

 

 表1.同時確率分布と周辺確率分布の例

表1.同時確率分布と周辺確率分布の例

 

図1.表1のグラフ

図1.表1のグラフ

 

条件付確率分布

条件付確率は第2回で出てきました。ある事象Bが起こった時に他の事象Aが起こる確率でした。そこでBをimage015、Aをimage016とすると、その確率は、

 

image017

 

となります。これからimage018およびimage019の条件付確率密度関数が周辺確率分布を使って、それぞれ次のように定義されます。

 

image020

 

 

例えば、image021image022が与えられた時のimage018の確率分布となります。上の例でimage023として計算してみると、

 

image024

 

となります。

 

周辺確率密度関数も条件付確率密度関数も確率分布としての条件(負にならないこと、すべての値における確率の和が1)を満足しています。

 

2.期待値、共分散、相関係数

確率変数の期待値は周辺確率分布から1変数と同様に計算できます。例えば、Xを連続型とすれば期待値及び分散は、

 

image025

 

となります。

 

次にX+Yの分散を計算してみましょう。

 

image026

image027

 

となり、一般に

 

image028

 

です。これは二つに変数の間に関連があるためです。そこで、次のように共分散と相関係数が定義されます。

 

 共分散:

image029

 

 相関係数:

image030

 

相関係数は、2変数が関連して変化する傾向の度合いを示します。共分散の定義式からわかるように、Xの小さい値がYの小さい値と関連し、Xの大きい値もYの大きい値に関連する傾向があれば共分散は正となり、相関係数も正です。逆に、Xの小さい(大きい)値とYの大きい(小さい)値が関連していると、共分散と相関係数は負となります。そのような関係が認められないと共分散と相関係数は0に近くなります(図2)。

 

image031

図2. 2変数の関係(左:相関なしimage032、右:相関ありimage033

 

2変数が独立〈次項参照〉の場合は定義から共分散は0になります。ただし、逆に共分散が0でも変数が独立とは限りません。共分散は確率的に平均的な傾向を示すものだからです。

 

(第4回 その2 多次元の確率変数と確率分布 につづく)

 

 

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page