空間データの品質
第7回 論理一貫性検査の課題と提案
2011年01月18日
論理一貫性の検査は、JPGISでは書式一貫性、概念一貫性、定義一貫性、位相一貫性を行うことになっています。書式一貫性、概念一貫性、定義一貫性は、完全一致ですから問題がなく、実施されているように思われます。しかし、位相一貫性については、多少問題があるように思います。そこで、ここでは、位相一貫性の検査の現状と課題を提起させていただきます。
位相一貫性の誤差とは
空間データを作成すると、空間データの地物自身と地物相互の関係において、重複取得、データの取得方向(時計回り、反時計回り)、同一地物の複数線分構成、交差、アンダーシュート、自己交差、微少線分、トゲ、建物等の鍵廻り等が起こります。
図1誤差の種類
重複取得とは、図1の重複で示すように同じ地物を複数回取得していることを言います。重複取得は必ずしも形状が同一とはかぎりません。また、交差がない場合もあります。
データの取得方向とは、地物の座標を取得する場合に、始点から時計方向に回るように取得することを言います。一般的にポリゴンの場合は、時計方向を取得し、ホールを反時計方向に取得することを指定しています。この方向がばらばらになると、形状の認識が異なることになりますので大きな影響を与えます。
同一地物の複数線分とは、1つの地物を示すのに、複数の線分で始点と終点を同じくして、地物を表すことを言います。線で取得した空間データを利用者がポリゴン化する場合に影響があります。また、1つの地物を複数の地物で取得すると、空間上で数を検索する場合に誤った個数となってしまいます。
交差とは、地物と地物が重なり又はオーバーシュートしていることを言います。
アンダーシュートとは、本来交わるものが交わらないで手前でストップしていることを言います。線分がアンダーシュートしているとポリゴン化できませんし、ネットワークを作りたい場合には、ネットワークができなくなります。
自己交差とは、線分またはポリゴンがねじれて線分自身が交差を持つことを言います。
微少線分とは、地物を短い線分で構成することです。筆者の経験で等高線を現地寸法で20〜30cmの線分が多数存在して、このため空間データの容量が1.5倍にもなってしまった納品物に出くわしたことがあります。また、道路を取得時にアンダーシュートが発生したため、それを計算処理でアンダーシュートを解消したのは良いのですが、最後の座標(p1)を交差する道路に移動せずに、最後の座標の後に交点(p2)の座標を追加しているため、P1−P2の距離が微少線分となっている例等があります。これらは、いずれも、精度に影響のない無意味な座標が多数存在して、GISを活用する場合に、レスポンスに影響を与えています。 トゲとは、連続線分にトゲ状の突起があることを言います。この突起は、地物としての形状に不自然な印象を与えます。この原因は、突起の前後の座標取得の誤りの場合と、突起の位置の取得が間違っている場合におきます。
建物における鍵廻りですが、最近は建物のコーナーが直角でないケースもあるのですが、多くの場合、直角で建てられています。鍵廻りの角度が鋭角の場合、コーナーの取得ミス等が考えられます。もし、コーナーの取得ミスであれば、精度的にも問題となります。
これらとは別にDMデータのように図郭単位に空間データを作成する場合には、図郭を跨る地物の線分が図郭線上の同一座標で取得されているかを検査する必要があります。
筆者が2005年に岐阜県の24市町村のDMデータの24図郭(地物総数668,470)を調査した。また、このデータは7社の作業機関が携わっています。但し、調査したDMデータは、第三者機関の検査で合格したものですが、この図郭を検査しているか不明です。
品質検査した際の誤差の定義は次のとおりです。
同一地物の複数線分は、同一座標に同じ種類の地物の始点と終点があるもの。線交差、面交差は重なりが10cm(以下寸法値は、現地寸法で表す)以上あるもの。自己交差は、自分自身に交差があるもの。微少線分は、座標列間の距離が10cm以下のものがあるもの。トゲは、αが15cm以下でβが20°以下のものを誤差としました。
図2誤差の閾値
誤差タイプ | 平均誤率 | 最小誤率 | 最大誤率 |
同一地物の複数線分 | 0.53% | 0.10% | 44.79% |
始終点不一致 | 5.40% | 0.00% | 24.44% |
線交差 | 2.40% | 0.07% | 25.46% |
面交差 | 0.62% | 0.00% | 5.08% |
自己交差 | 0.03% | 0.00% | 0.24% |
微小線分 | 0.24% | 0.01% | 1.56% |
トゲ | 0.01% | 0.00% | 0.09% |
この結果を見ると、最大誤差と最少誤差のばらつきが、いかに大きいかということがご理解いただけると思います。このばらつきの原因は、次のことが考えられます
(1) 検査を行っていない。あるいは地物を限定して行っている。
(2) 誤差の定義が明確でないため、検査を行っているが、誤差とする数値が異なる。
JPGISでは、交差やねじれ(自己交差、微少線分、トゲ等)については記載がありますが、その誤差の値の表示がありません。また、検定の段階において、第5回の「測量検定の現状と課題」で示したように、検査する項目と検査していない項目があるというところが課題であると思います。検査を行わないということは、少なくとも、品質を保証しない又は、誤差と見なさないということですから、品質に大きな差ができることを意味しています。従って、位相一貫性の誤差とする種類と、その形状がどのようなものをとし、値を幾つにするかの定義の必要性を提起する理由があります。
位相一貫性の検査地物の範囲
DMデータの製品仕様書が作成されていない現状から、位相一貫性の検査の地物は、一部の地物に限定して行われている現状があります。第三者機関の調査結果から見ても、従来のDM検査方法と、JPGISに基づいた方法の2つの方法が並行して行われています。そして、従来方法のDMデータの位相一貫性の検査は、必ずしも全地物を対象としていないところに課題があります。 多くの計画機関は、まず、DMデータを作成し、そのデータを元にGISデータを作成しています。DMデータを作成する作業機関と、GISデータを作成する作業機関は必ずしも同じとは限りません。必ず両者の間にトラブルが発生することは否めないでしょう。品質要求は一本化すべきであると考えていますが、皆様いかがでしょうか。
社内の検査ツールは交差の閾値が設定できますか
最近、筆者がある自治体のコンサルタントを行っていて起きた出来事です。
3年前に地形図を新規整備して、今回、その更新を行う大手の作業機関が中間検査の席で、“新規整備データの交差の品質要件を満たしていません”と発言しました。筆者は、この受入検査も担当していますから、懸命に調査をして、間違いがないことを確かめました。そこで、作業機関に“先日、交差の品質要件を満たしていないと言いましたが、閾値は何cmにしましたか”と言いましたところ、“0cmです。”と答えましたので、“品質手順書は、その新規整備時、20cm、今回は10cmと規定していますが、あなたは、手順書を見ていますか”と問いかけてみたところ、“見ていません。”とのことでした。
課題は次のところにあります。
(1) 製品仕様書及び品質検査手順書をよく読んでいない。
(2) 閾値そのものの概念を知らない。
(3) 社内品質検査ツールは、閾値の設定が出来ない。
閾値の問題は、第4回の「計画機関の発注時における「品質要件」の記載状況と課題」の「閾値0は適切か」について述べました。そもそも、地物が重なった場合、境界を共有する場合、地物の途中から分岐する場合に、空間データは、数学的な交差を発生する環境にあります。閾値0又は0より大きい値を誤差として抽出した場合には、その誤差を目視で、一々判別しなければならず、この作業が大変であろうと思います。
品質的に5cmや10cmの重なりや突抜けが精度的、経路的に問題となるのでしょうか。むしろ、精度の面で言うならば、位置正確度が情報レベル2500で1.75mの方が問題ではないでしょうか。
筆者は、デジタル情報の性格上、交差することが悪いのではなく、突き抜ける量が問題だと思っています。皆様はいかがお考えでしょうか。ある交差の許容量=閾値を持って、数学的には交差しているが、空間データの誤差としては誤差としない。というのが筆者の考えであり、この考え方は、最近の基盤図情報の考え方にも採用されています。
筆者の研究では、閾値と誤率の関係は次のようになっています。
図3閾値と誤率の関係
作業機関がDMデータの要素が線と面を社内検査で交差を未検査又は目視検査、プログラム検査をしているデータにおける誤率を閾値と誤率の関係で示したものです。閾値が10cmの場合と1cmの誤率は2倍〜8倍多いことがわかります。従って、閾値0とすれば、誤率が何十倍にもなる可能性があります。
交差は交差後1点とは限らない
多くの閾値の説明では、1回交差同一辺交差で交差後の座標が1点のみの場合しか説明しておりません。しかし、交差は、交差後の座標が1点とは限りません。むしろ、交差後の座標列が複数ある場合の方が多くあります。 筆者は、線分の交差のパターンを次の6種類に分類しています。
図4線交差のパターン
同一辺に交差する場合は、おわかりでしょうが、異辺交差の場合の閾値のある誤差の判定はどのように考えれば良いでしょうか。筆者は次のように考えています。
図5閾値の考え方
線分K(黒線)の座標列に半径を交差閾値の円を描き、線分Kと平行な円の頂点間を結ぶ線を引くと、Kの閾値が赤線で示されます。赤線の上端線をKi(緑線)、下端線をKp(青線)とします。
他の線分が線分Kに左下より右上に交差する例をとると、交差とは、線分KpとKに交わり、kiと交わらない場合には、誤差ではないと判定し、線分KpとKとKiと交わった場合に誤差であると判定します。このようにすれば、交差後の異辺に何回交差しても判定できます。なお、当社の品質検査プログラムは、このような考え方に基づいて作られています。
おわりに
論理一貫性の検査で課題となるのは、位相一貫性です。位相一貫性の課題には次のものがあります。
(1) 誤差の種類が統一されていない。
(2) 誤差の閾値の概念が認知されていない。
(3) 作業機関に閾値を設定できる検査ツールが少ない。
特に閾値については、閾値の概念が認知されていないので、作業機関が行う社内検査のツールに閾値を設定できるものは少ないのが実情です。社内検査は、閾値0で処理をして、そのエラーリストから、目視で誤差を抽出しています。このため、作業量の増大と、あいまいさが生じています。
これまで、空間データは、整備主体である計画機関が誤差に対する定義を独自に定めても問題は起きなかったのですが、県域にまたがる整備、基盤図情報等の状況を考慮すると、誤差に対する共通の仕様が必要ではないかと考えます。従って、空間データの品質表示の信頼性と、作業時間の効率化のためにも、誤差の定義、閾値を設定できる検査ツールの普及と、誤差とする閾値の数値の統一化を望むものです。