誤差論と最小二乗法

第9回 最小二乗解の誤差と検定

 最小二乗解が計算できると、残差、基準分散の推定値、解の誤差行列も得られますので、それらによりモデルも含めた最小二乗問題の評価をすることができます。ただし、具体的な計算をするためにデータの誤差は正規分布に従うと仮定します。

image_te_0901

 今回は考え方と式を導き、具体的な計算例については次回ご紹介したいと思います。

1.残差と残差二乗和

 残差とその(重み付き)二乗和(第7,8回参照)

 

image_te_0902_03

 

は、測定値と計算値の対応の良さを見る一つの目安となります。

 基準分散image_te_090_aが既知の場合image_te_090_b は、残差二乗和を基準分散で割った量が自由度image_te_090_cimage_te_090_d分布(第5回)に従うことがわかっています。

 

image_te_0904_2

 

この時、image_te_090_d検定を行うことができます(付録B2)。

 最小二乗法によるあてはめに問題なければ、image_te_090_fあるいはimage_te_090_gとなるはずなので、ここでは、帰無仮説image_te_090_h

 

image_te_09_h0_2

 

対立仮説image_te_090_j を

 

image_te_09_h1_2

 

として有意水準αで両側検定を行うことにしましょう。image_te_090_mを計算し、

 

image_te_0905_2

 

ならば、仮説は棄却されません。もし、棄却すべきとの結果になれば、測定値あるいはモデルに問題があるとして再検討しなければなりません。

 検定の例として、技術顧問中根勝見による以下の論文を挙げておきます:

 

日本の測地測量における統計検定の有用性についての数値的検証

(測地学会誌 第63 巻 第2 号 Journal of the Geodetic Society of Japan (2018), 117-122 頁 Vol.63 , No 2, (2018), pp.117 -122)

2. 解の分散と誤差楕円

 最小二乗解とその共分散(誤差)行列は、次のように求められました(第7、8回)。

 

image_te_0906_07_2

 

 

2.1 パラメータの検定と信頼区間

2.1.1 1つのパラメータの検定と信頼区間

 検定

 パラメータの一つ に注目し、帰無仮説 と対立仮説image_te_090_hと対立仮説image_te_090_j

 

image_te_090_n

 

と設定して検定(image_te_090_oimage_te_090_pに等しいか否か)を行うことにします。このとき、統計量

 

image_te_0908_2

 

は、自由度image_te_090_ct分布に従うことが分かっています。ここで、image_te_090_qは基準分散の推定値、image_te_090_r

image_te_090_simage_te_090_t成分で、image_te_090_uは解image_te_090_vの分散の推定値となります。従って、平均値の検定(B2)と同じように行うことができます。

 

 信頼区間

image_te_090_oの信頼区間は、image_te_090_w(真値)として

 

image_te_09_p1a_2

 

から

 

image_te_0909_2

 

となります。

 

 2.1.2 複数のパラメータ

 F検定

 複数のパラメータimage_te_090_aaを同時に検定する場合は、F検定を用います。帰無仮説は、

 

image_te_090_ab

 

対立仮説は、

 

image_te_090_ac

 

となります。帰無仮説は、image_te_090_ad パラメータをある値に固定することに相当し、固定しない対立仮説との差をみるには、残差二乗和を比べ、次の統計量を計算します。

 

image_te_0910_2

 

ここで、image_te_090_afは最小二乗解の残差二乗和、image_te_090_agγに対応するimage_te_090_aiの部分行列()で、分子はγの推定値と検定値との差の二乗和になっています。帰無仮説が正しいときに、Fは自由度image_te_090_akF分布image_te_090_akに従うので、F検定を行うことができます。有意水準αとしてパーセント点を求め、

 

image_te_09_ffa_2

 

なら、仮説は棄却されます。対立仮説が正しいとすると、Fは差の二乗和で必ずある正数以上ですから、片側検定となります。

 

()image_te_090_amと書け、Bは第j列から第k列までが単位行列をなし、他は0なのでランクはpとなり、image_te_090_agは正定値で逆を持ちます(第8A2参照)

例えば、image_te_090_apとすると

 

image_te_09_B_2

 

 

image_te_09_qr_2

 

です。

 

信頼領域と誤差楕円

 (10)において、image_te_090_as有意水準をαとすれば、

 

image_te_0911_2

 

この式はパラメータの信頼領域を表しており、パラメータの二次式ですから、image_te_090_auを中心とした楕円体の形をしていることが分かります。

 楕円体の標準的な方程式は、

 

image_te_0912_2

 

 なので、(11)をこの形に変換すれば楕円の大きさや軸の向きが分かります。そのためにimage_te_090_ag を直交行列Cで対角化(付録A3参照):

 

image_te_090_aw

 

して

 

image_te_090_ax

 

とおくと、

 

image_te_09_rQr_2

 

となります。対角要素はimage_te_090_agの固有値、Cの列ベクトルは、各固有値に対応する固有ベクトルになります。

 従って、(11)は

 

image_te_0913_2

 

を各軸の半径とする楕円体となります。Cの列ベクトルの方向が楕円体の軸の方向になります。

 特に、image_te_090_baのとき、誤差楕円(体)と呼びます。従って、誤差楕円の各軸の長さは、image_te_090_bbです。

 

例.2次元の基準点測量

 未知パラメータは未知点image_te_090_bcの座標image_te_090_bdです。点image_te_090_be の誤差楕円を求めてみましょう。解の誤差行列を

 

image_te_09_covb_2

 

と書くと、誤差楕円はimage_te_090_bgに対応する行と列を取り出したimage_te_090_aiの部分行列

image_te_09_QP2_2

から計算できます。計算の詳細は省略しますが、固有多項式を解いて(A3参照)、

image_te_090_bi の固有値は、

 

image_te_090_bj

 

また、image_te_090_bkに対応する固有ベクトルをimage_te_090_bl とし、image_te_090_bmx軸との角度をθとすると、

 

image_te_090_bn

 

です。誤差楕円は図1のようになります。

 

image_te_090_zu01

1.誤差楕円

 

 

 

 

 

 

 

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page