誤差論と最小二乗法
第4回 その1 – 多次元の確率変数と確率分布
2019年10月07日
私たちが実際に取り扱う現象は、一つの確率変数で記述できるとは限りません。例えば、衛星測位の場合、3次元位置の場合は3つ、水平位置なら2つの変数になります。多次元の場合、相関や共分散など一次元ではなかった概念が出てきます。以下、簡単のため2つの確率変数の場合で説明したいと思います。一般の場合に拡張するのはそれほど難しくありません。
1.同時確率分布と周辺確率分布
2つの確率変数を考えましょう。これらが同時にとなる確率:を同時確率分布といいます。は2変数の関数:同時確率密度関数で表されます。は一次元の時と同様に確率分布の条件である、
を満たす必要があります。ここでSはの取り得る範囲(一般に2次元平面)です。
周辺確率分布
のうち一つだけに注目した時の確率分布を周辺確率分布といいます。密度関数は、
が得られ、これらを周辺確率密度関数といいます。例えば、の離散同時確率分布が表1のように与えられていたとしましょう()。周辺確率分布は文字通り周辺にあり、のようになります。さらにグラフ化したものが図1です。
表1.同時確率分布と周辺確率分布の例
条件付確率分布
条件付確率は第2回で出てきました。ある事象Bが起こった時に他の事象Aが起こる確率でした。そこでBを、Aをとすると、その確率は、
となります。これからおよびの条件付確率密度関数が周辺確率分布を使って、それぞれ次のように定義されます。
例えば、はが与えられた時のの確率分布となります。上の例でとして計算してみると、
となります。
周辺確率密度関数も条件付確率密度関数も確率分布としての条件(負にならないこと、すべての値における確率の和が1)を満足しています。
2.期待値、共分散、相関係数
確率変数の期待値は周辺確率分布から1変数と同様に計算できます。例えば、Xを連続型とすれば期待値及び分散は、
となります。
次にX+Yの分散を計算してみましょう。
となり、一般に
です。これは二つに変数の間に関連があるためです。そこで、次のように共分散と相関係数が定義されます。
共分散:
相関係数:
相関係数は、2変数が関連して変化する傾向の度合いを示します。共分散の定義式からわかるように、Xの小さい値がYの小さい値と関連し、Xの大きい値もYの大きい値に関連する傾向があれば共分散は正となり、相関係数も正です。逆に、Xの小さい(大きい)値とYの大きい(小さい)値が関連していると、共分散と相関係数は負となります。そのような関係が認められないと共分散と相関係数は0に近くなります(図2)。
2変数が独立〈次項参照〉の場合は定義から共分散は0になります。ただし、逆に共分散が0でも変数が独立とは限りません。共分散は確率的に平均的な傾向を示すものだからです。
(第4回 その2 多次元の確率変数と確率分布 につづく)