誤差論と最小二乗法

第10回 様々な条件が付いた最小二乗法

実際に問題を解く場合には基本の線形モデルに条件を付加したり、先験的な情報を与える場合があります。例えば、観測値がある未知パラメータについてあまり敏感でないようなとき(パラメータが変化しても観測値がほとんど変化しない)、計画行列がランク落ちの状態に近くなり、正規方程式が解けないか、あるいは解けても解の誤差が非常に大きくなってしまいます。そのような場合は、パラメータを先験的に既知の値に拘束したり、新しい観測値を追加して正規方程式を解けるようにします。今回は、パラメータに拘束条件が付く場合と、混合モデルについて解説します。また、前回の内容も含めた具体例をいくつか紹介したいと思います。

 

1.観測の追加

パラメータが共通で別の観測方法で得られたデータがある場合、そのデータを追加することによって新しい情報を得られることがあります。もともとの観測方程式

20200727-1

にもう1セットの観測、

20200727-2

を加えれば、観測方程式は

20200727-3

となります。

ただし、モデルが異種の観測値に対し理論的に矛盾がないか、測定誤差の正しい見積もりにより重みが適切に表されているかなど注意する必要があります。測量でも、測地網平均において、距離観測、角観測、衛星観測などを統合して解析する場合があります。

 

2.  パラメータに拘束条件があるモデル

未知パラメータの間に線形関係がある場合を考えます(線形でない場合は線形化しておきます)。

20200727-4

ここで、20200727-Hは既知の20200727-(rxp)行列でランクは20200727-r(r p)20200727-Z20200727-(rx1)定数ベクトル、20200727-Pzは拘束条件20200727-Zの重畳行列です。モデルは次のような形になります。

20200727-5

上の式を(3)と比べて見ると、20200727-Zを仮想の追加観測値として取り扱えばよいことが分かります。その結果、正規方程式は、次のように元の式に新しい情報が追加された形となります。

20200727-6

いくつかの代表的な場合を以下に示します(参考文献1参照)。

2.1 絶対値拘束条件

パラメータの値を初期値として先験的に与え、その値に拘束するものです;

20200727-7

 

この場合、先験的な初期値20200727-βi0を観測値として扱うことになります。網平均計算では、ある基準点の座標を(ある重みをつけて)先験値に拘束することに相当します。

 

2.2 相対値拘束条件

パラメータ間の関係を導入

20200727-8

 

一般には、

20200727-9

 

基準点の座標の場合、2点の相対位置を拘束することに相当します。

 

 グローバルな宇宙測地観測による局位置と速度を求めるときに出てくるNNT(No-Net-Translation)

やNNR(No-Net-Rotation)などは拘束条件の例です。

 

拘束条件を強くしていくと、パラメータの値やパラメータ間の関係を完全に固定することになります。その場合、パラメータを消去して少ないパラメータの式を解いたり、ラグランジュの未定係数法(付録C3参照) を用いて正規方程式を解く方法があります。

 

3.混合モデル

標準の線形モデルにおいて、観測値の誤差20200727-εが未知パラメータの線形式で表されると仮定すると、混合モデルが得られます。式で書くと、

20200727-10

となります。ここで、20200727-γは未知パラメータですが確率変数です。元のモデルを書き換えると

20200727-11

 

となります(20200727-Y20200727-(nx1)ベクトル、20200727-Xは既知の20200727-(nxp)行列、20200727-β20200727-(px1)未知数ベクトル、20200727-γ20200727-(rx1)未知誤差ベクトル確率変数)、20200727-Zは既知の20200727-(nxr)行列でランクは20200727-n)。これが混合モデルの観測方程式です。

混合モデルは、観測値のベクトルがもともと他の観測値の線形結合、

20200727-11-2

 

の場合、と考えることができます。20200727-γを観測値20200727-Y_の誤差クトルと考えると式(10)が得られます。

未知パラメータ20200727-γを最小二乗法で求めるには、重み付き残差二乗和

20200727-12

を最小にすればよいのですが、20200727-γは完全に自由に動けず最終的な観測値20200727-Yと未知変数20200727-βによる20200727-n個の条件

20200727-13

 

を満たさなければなりません。そこで、ラグランジュの未定係数法を使います。ラグランジュ関数は、20200727-k20200727-(nx1)ベクトルとして

20200727-13-1

 

と書けます。これを20200727-β20200727-γで微分(付録C4参照)して、

20200727-13-2

 

より、

20200727-14

 

となり、(13)と組み合わせると、20200727-kβに関する正規方程式、

20200727-15

 

が得られます。左辺の行列は正則なので解くことができ(詳細略)、

20200727-16

 

そして、

20200727-17

 

となります。

 

条件方程式による解法

混合モデルの式(11)において20200727-X=0とすると、

20200727-18

 

が得られます。

この時の解は

20200727-19

 

です。

もし、基本の線形モデルにおいて、20200727-ZX=0という関係があれば、モデルを条件方程式に変形させることができます。

20200727-Y=Xβ+ε において20200727-Y-Y0(20200727-Y0の回りで20200727-Y_を線形化したもの)と考えましょう。20200727-Zをかけると、

20200727-19-1

 

の形になります。また、20200727-Cov(γ)=Cov(Y)です。

(18)式には20200727-βががありませんから、混合モデルの解法において式の数が 20200727-p個少なくなり、未知数は20200727-n-p個となります。20200727-n-p_pならば、

元のモデルより未知数が減り計算量が少なくてすみます。そのため、コンピュータ時代以前の測地網平均では、多くがこのような形にして解かれていました。

例題:水準測量

第8回の例1と同じ問題です(下図)。既知点スクリーンショット 2020-07-28 14.25.51の標高がスクリーンショット 2020-07-28 14.26.18、未知点スクリーンショット 2020-07-28 14.26.33の標高が道パラメータスクリーンショット 2020-07-28 14.27.02、測定値は比高スクリーンショット 2020-07-28 14.27.22です。線形モデルは、

スクリーンショット 2020-07-28 14.30.07

 

でした。

スクリーンショット 2020-07-28 14.43.33

水準路線は一周していますから、標高差の総和(環閉合差)は0になるはずです。ただし誤差がありますから、

スクリーンショット 2020-07-28 14.40.01

 

これを

スクリーンショット 2020-07-28 14.40.56

 

として行列で書くと、

スクリーンショット 2020-07-28 14.49.23

 

また、

スクリーンショット 2020-07-28 14.41.46

 

となり、(11)の条件方程式の形となります。

解は(19)より、

スクリーンショット 2020-07-28 14.42.27

従って、

スクリーンショット 2020-07-28 14.42.58

 

となって、当然ですが一般の最小二乗解と同じになります。この場合、条件方程式は1つだけなので、最小二乗解法よりも未知数の数が減っています。

 基準点網の平均計算でも、座標の閉合差や方向角の閉合差を考えると、条件方程式を立てることができます。

4.具体例の紹介

当社顧問中根勝見による資料(場所は?)を紹介しますので、参照してください。いくつか注意点を述べましょう。統計的仮説検定では、何を検定するかによって採用する統計量が異なります(第9回の付録も見てください)。

 

  1. 平均値の検定(資料の2.4)では、スクリーンショット 2020-07-28 14.59.13を計算して、スクリーンショット 2020-07-28 15.01.23分布の限界値と比べています。スクリーンショット 2020-07-28 14.59.59に対応するスクリーンショット 2020-07-28 15.00.26パーセント点はスクリーンショット 2020-07-28 15.00.48(スクリーンショット 2020-07-28 15.01.23分布表あるいはエクセルから)です。スクリーンショット 2020-07-28 15.01.54ならば、統計的にはスタティックの値と差がないということです。
  2. 平均値の差の検定(2.5)は、9回では述べていませんが、2つの標本を統合した分散(2.5) とそれに対応するスクリーンショット 2020-07-28 15.01.23 検定量(2.6)を比べます。スクリーンショット 2020-07-28 15.14.58です。
  3. スクリーンショット 2020-07-28 15.15.29検定(資料の4)では最小二乗法による網平均結果の検定を行っています(第9回1.参照)。どのような条件を付けるかで5つの場合が示されています。既知点座標を固定せず、観測値として扱う方法は今回の2.1で述べました。採択の範囲は、スクリーンショット 2020-07-28 15.15.49で、例えば、スクリーンショット 2020-07-28 15.16.25とすると、スクリーンショット 2020-07-28 15.16.43となります。 最小二乗法ではスクリーンショット 2020-07-28 15.16.56(ここでは1)、あるいはスクリーンショット 2020-07-28 15.17.25( 自由度)ならば問題ないとみなせますが、この例のように適切な重量や固定点の選び方が大事ということが分かります。
  4. 分散を比べるにはF分布を使います(資料の5スクリーンショット 2020-07-28 15.27.55で、、母分散が等しいスクリーンショット 2020-07-28 15.28.07と仮定すれば、スクリーンショット 2020-07-28 15.28.17となります。資料では分散の比を計算し、スクリーンショット 2020-07-28 15.28.32よりも小さければ採択(統計的に分散の差はない)です。

参考文献

  1. Dach, S. Lutz, P. Walser, P. Fridez, Bernese GNSS Software Version 5.2, Springer, University of Bern, Bern Open Publishing, 2015. http://www.bernese.unibe.ch
  2. Koch, K-R., Parameter Estimation and Hypothesis Testing in Linear Models, Springer, 1999.
  3. 中根勝見、統計的仮説検定の計算例

 

 

 

Share on FacebookTweet about this on TwitterShare on LinkedInEmail this to someonePrint this page