誤差論と最小二乗法

第4回 その1 多次元の確率変数と確率分布

 

私たちが実際に取り扱う現象は、一つの確率変数で記述できるとは限りません。例えば、衛星測位の場合、3次元位置の場合は3つ、水平位置なら2つの変数になります。多次元の場合、相関や共分散など一次元ではなかった概念が出てきます。以下、簡単のため2つの確率変数の場合で説明したいと思います。一般の場合に拡張するのはそれほど難しくありません。

 

1.同時確率分布と周辺確率分布

2つの確率変数image001を考えましょう。これらが同時にimage002となる確率:image003を同時確率分布といいます。image004は2変数の関数image005:同時確率密度関数で表されます。image005は一次元の時と同様に確率分布の条件である、

 

 image006

image007

 

を満たす必要があります。ここでSはimage008の取り得る範囲(一般に2次元平面)です。

 

周辺確率分布

image001のうち一つだけに注目した時の確率分布を周辺確率分布といいます。密度関数は、

 

image009

image010

 

が得られ、これらを周辺確率密度関数といいます。例えば、image001の離散同時確率分布image005が表1のように与えられていたとしましょう(image011)。周辺確率分布は文字通り周辺にあり、image012のようになります。さらにグラフ化したものが図1です。

 

 表1.同時確率分布と周辺確率分布の例

表1.同時確率分布と周辺確率分布の例

 

図1.表1のグラフ

図1.表1のグラフ

 

条件付確率分布

条件付確率は第2回で出てきました。ある事象Bが起こった時に他の事象Aが起こる確率でした。そこでBをimage015、Aをimage016とすると、その確率は、

 

image017

 

となります。これからimage018およびimage019の条件付確率密度関数が周辺確率分布を使って、それぞれ次のように定義されます。

 

image020

 

 

例えば、image021image022が与えられた時のimage018の確率分布となります。上の例でimage023として計算してみると、

 

image024

 

となります。

 

周辺確率密度関数も条件付確率密度関数も確率分布としての条件(負にならないこと、すべての値における確率の和が1)を満足しています。

 

2.期待値、共分散、相関係数

確率変数の期待値は周辺確率分布から1変数と同様に計算できます。例えば、Xを連続型とすれば期待値及び分散は、

 

image025

 

となります。

 

次にX+Yの分散を計算してみましょう。

 

image026

image027

 

となり、一般に

 

image028

 

です。これは二つに変数の間に関連があるためです。そこで、次のように共分散と相関係数が定義されます。

 

 共分散:

image029

 

 相関係数:

image030

 

相関係数は、2変数が関連して変化する傾向の度合いを示します。共分散の定義式からわかるように、Xの小さい値がYの小さい値と関連し、Xの大きい値もYの大きい値に関連する傾向があれば共分散は正となり、相関係数も正です。逆に、Xの小さい(大きい)値とYの大きい(小さい)値が関連していると、共分散と相関係数は負となります。そのような関係が認められないと共分散と相関係数は0に近くなります(図2)。

 

image031

図2. 2変数の関係(左:相関なしimage032、右:相関ありimage033

 

2変数が独立〈次項参照〉の場合は定義から共分散は0になります。ただし、逆に共分散が0でも変数が独立とは限りません。共分散は確率的に平均的な傾向を示すものだからです。

 

(第4回 その2 多次元の確率変数と確率分布 につづく)

 

 

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page

誤差論と最小二乗法

第4回 その2 多次元の確率変数と確率分布

3.独立な確率変数

二つの事象がお互いに影響を及ぼさない場合を互いに独立といって、二つが同時に起こる確率は各々の確率の積になることを第2回に紹介しました。同様に、確率変数が互いに独立とは、同時確率分布がそれぞれの周辺確率分布の積になることを言います。式で書けば、

 

image034

 

です。この場合、期待値や分散は各変数のものを独立に求めればよいので、計算が簡単になります。独立な確率変数の和などに関する結果は、以下のとおりです。

 

期待値

image035

image036

 

分散

image037

 

特にn個の確率変数が同じ確率分布(平均値:image038、分散:image039)に従うときは、

 

image040

image041

 

標準偏差は、

 

image042

 

となります。

 

測量では、各観測値は独立であると考えて処理するのが一般的です。

 

4.2次元の正規分布

ここで、よく使われる確率分布として2次元の正規分布について紹介しておきましょう。導出は統計の教科書(例えば、第2回参考文献2)に譲るとして、image008の同時確率密度関数は以下のような式になります。

 

image043

 

ここで、

 

image044

 

image045,image046は、それぞれimage069の平均値と分散、image048は相関係数

です。

 

image049は楕円の式ですから、等確率image050を結んだ等高線は楕円となり(図3)、楕円内で確率密度関数を積分するとimage051の値が楕円内に入る確率となります。

 

2次元正規分布は、衛星測位での水平位置の誤差や基準点測量で誤差楕円を求める時の基礎になっています(参考文献1、2)。

 

図3. 2次元正規分布

図3. 2次元正規分布

 

 

特に、2変数に相関がない場合image053の2次元正規分布を考えましょう。この場合、(10)式から、

 

image054

image055

 

ですから同時確率分布は1次元正規分布の積になり、2変数は独立であることがわかります(これは正規分布だけの性質です)。この場合、等高線は、

 

image056

 

となり、中心がimage057、2軸の径がimage058image059となる楕円です(図4)。image008がその楕円内に入る確率image060は、

 

image061

 

と計算されます(計算の詳細は略)。いくつかのimage062に対する確率を表2にあげておきます。

 

image063

図4.image064の楕円

 

 

表2.楕円内に入る確率とimage065

表2

 

1次元の正規分布では、値がimage066に入る確率は約68%、image067に入る確率は約95%でした(第3回参照)。多次元になると標準偏差内に入る確率が違うことがわかります。測量では、特にimage068の時に誤差を表す楕円を誤差楕円と呼んでいます。

 

なお、image069に相関がある一般の場合は、楕円は細くなり傾きます(図5)。

 

image070

図5.相関がある場合の誤差楕円(image071

 

 

参考文献

1.センチメータ級測位補強サービスの利用とその品質の解説(2019)、アイサンテクノロジー株式会社 技術情報.(http://g-spatial.com/knowledge/tech_info/clas_use_and_quality/)

2.中根勝見、横井貴史(2015):衛星測位時代における測地学・ISO・測量法に基づく地球上の位置を表す理論とその仕組み、アイサンテクノロジー株式会社.

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page