2015-07-05

データセットの再編成 - 水系域別河川データセットの作成

都道府県別ファイルで提供されている河川データセットを水系域別に再編成するワークスペースの例です。
FME 2015.1.0.3 build 15485

=====
国土数値情報で提供されている河川データセット: 都道府県別の河川流路(ライン)、流路端点(ポイント)データ(Shapefile 形式)を再編成し、次のようなフォルダ階層で水系域別のデータファイル(Shapefile 形式)を格納したデータセットを作成する。

<水系域別河川データセットルートフォルダ>
  + 端点
    + <サブフォルダ: 水系域コードの先頭2桁>
  + 流路
    + <サブフォルダ: 水系域コードの先頭2桁>

出力先のファイル名は次のように水系域コード(6桁の数字)に流路か端点かを表すサフィクスをつけた名前とし、その先頭2桁が一致するサブフォルダに格納する。
端点ファイル名: "<水系域コード>_N.shp"
流路ファイル名: "<水系域コード>_S.shp"

留意事項
国土数値情報(河川)データは都道府県別ファイルで提供されており、県境付近の流路、端点が複数のファイル間で重複しているところがあるため、水系域別に再編成する際には重複データを削除する。
=====

FMEワークスペース例











[SHAPE] リーダー: ソースデータセット(国土数値情報 河川データ)から流路(ライン)、端点(ポイント)を読み込む
TestFilter: 入力ファイル名のサフィクスに基づいてデータフローを流路と端点に分岐
DuplicateRemover: 重複データを削除(流路については流路始点/終点の端点ID、端点についてはIDによる)
AttributeCreator: 水系域コードに基づいて出力先のサブフォルダ名とファイル名を作成
[SHAPE] ライター: Fanout Dataset 機能によりサブフォルダに振り分け、水系域別ファイルに出力

国土数値情報サイトより47都道府県の「河川」データ(zip)をダウンロードし、それらを一括して [SHAPE] リーダーのソースデータセットとして指定して実行することにより、全国の水系域別河川データセットが作成されます。
# zipファイルを解凍する必要はありません。「複数のデータファイルの一括読込」参照

結果: Esri ArcCatalog によるディスクシステムの表示















結果: FME Data Inspector による水系域別河川流路の表示("<ルート>/流路/83"フォルダ内のデータ)





















FMEワークベンチの操作に慣れてくれば、このワークスペースを作成するのに30分もかかりません。ただし、元データの仕様の調査、ダウンロード、内容確認に要する時間を除きます。
ワークスペースの実行時間 = 全国分のデータ処理時間は数分です。
データセットの仕様(フォルダ階層やフォルダ名・ファイル名など)に変更があったとしても、ワークスペースの該当部分の修正・再実行によって比較的低コストで対応できます。

0 件のコメント:

コメントを投稿