マスターデータを基本入力ファイルにしてみる (3)

前へ 次へ

前回記事の都道府県別総人口データ(CSVデータ)から、xoBlos でデータ部分を抽出してみましょう。Excel表から抽出」手順では、Excelファイル(ブック)と同じように、CSVファイルを指定することができます。

デザイナの [2.入力設定] には、[a. ファイル名] に入力CSVファイルのパス名、[b. シート名] ?1 を指定します。CSVファイルにはシートがないため、第1シート扱いとして指定しています。

都道府県別総人口データ(CSVデータ)

出典:都道府県・市区町村のすがた(社会・人口統計体系)
https://www.e-stat.go.jp/regional-statistics/ssdsview

Excelで開くと

メモ帳で開くと(データ部分)

"調査年 コード","調査年","地域 コード","地域","/項目","A1101_総人口【人】","注釈"
"2019100000","2019年度","00000","全国","","126,167,000",""
"2019100000","2019年度","01000","北海道","","5,250,000",""
"2019100000","2019年度","02000","青森県","","1,246,000",""
"2019100000","2019年度","03000","岩手県","","1,227,000",""
"2019100000","2019年度","04000","宮城県","","2,306,000",""
"2019100000","2019年度","05000","秋田県","","966,000",""
"2019100000","2019年度","06000","山形県","","1,078,000",""
"2019100000","2019年度","07000","福島県","","1,846,000",""
"2019100000","2019年度","08000","茨城県","","2,860,000",""
"2019100000","2019年度","09000","栃木県","","1,934,000",""
"2019100000","2019年度","10000","群馬県","","1,942,000",""
"2019100000","2019年度","11000","埼玉県","","7,350,000",""
(略)

Excel表から抽出」手順でCSVファイルから抽出する場合、項目の前ゼロはExcelで開いたときの表示のままでデータが抽出されます。また、数字区切り用のカンマは取られて抽出されます。「総人口」の区切り用カンマはない状態で抽出されます。

この場合、何も指定がなければ、「地域コード」(前ゼロ付き5桁の数字)は前ゼロが取られて抽出されます。

xoBlos 抽出制御シート

前ゼロ付加桁数」キーワードで「5」を指定することにより、前ゼロも抽出しています。

実行後の抽出データ(XMLデータ)

前記出典の e-Stat 社会・人口統計体系のダウンロードデータをもとに、xoBlos でデータ抽出した結果です(e-Stat の利用規約に準じています)。

次回記事では、都道府県マスターからこの統計データを「変換入力」でマッチング参照してみます。

前へ 次へ