マスターデータを基本入力ファイルにしてみる (1)

  次へ

データ処理において、トランザクションデータマスターデータという区分はよく使われますが、 一般的には入力データ(トランザクションデータ)を基本入力にして、マスターデータを参照・照合して 処理をするのが普通かと思います。

マスターデータを基本入力ファイルにすると効果的なケースに関して考えてみます。 例題としては、前回記事で使用した都道府県マスターを基本入力ファイルにしてみます。

基本入力ファイルとする都道府県マスター

都道府県マスター.xslx

都道府県
コード
都道府県名 地方区分名
01 北海道 北海道地方
02 青森県 東北地方
03 岩手県 東北地方
04 宮城県 東北地方
05 秋田県 東北地方
06 山形県 東北地方
07 福島県 東北地方
08 茨城県 関東地方
09 栃木県 関東地方
10 群馬県 関東地方
11 埼玉県 関東地方
12 千葉県 関東地方
13 東京都 関東地方
14 神奈川県 関東地方
15 新潟県 中部地方
16 富山県 中部地方
17 石川県 中部地方
18 福井県 中部地方
19 山梨県 中部地方
20 長野県 中部地方
21 岐阜県 中部地方
22 静岡県 中部地方
23 愛知県 中部地方
24 三重県 近畿地方
25 滋賀県 近畿地方
26 京都府 近畿地方
27 大阪府 近畿地方
28 兵庫県 近畿地方
29 奈良県 近畿地方
30 和歌山県 近畿地方
31 鳥取県 中国・四国地方
32 島根県 中国・四国地方
33 岡山県 中国・四国地方
34 広島県 中国・四国地方
35 山口県 中国・四国地方
36 徳島県 中国・四国地方
37 香川県 中国・四国地方
38 愛媛県 中国・四国地方
39 高知県 中国・四国地方
40 福岡県 九州地方
41 佐賀県 九州地方
42 長崎県 九州地方
43 熊本県 九州地方
44 大分県 九州地方
45 宮崎県 九州地方
46 鹿児島県 九州地方
47 沖縄県 九州地方

計画のあらまし

  • 日本の統計が閲覧できる政府統計ポータルサイト(e-Stat)から、都道府県別の総人口をダウンロードする。
  • なるべく最近の統計データと、数十年前の統計データから、都道府県別の総人口の増減を計算する。
  • この数十年間で、人口が増えた地域と人口が減った地域のランキング表を作成する。
  次へ

Designer:「変換入力」の簡単な例題

日本の都道府県の分類には、都道府県コード七地方区分(北海道、東北、関東、中部、近畿、中国・四国、九州)の組合せがよく使用されます。

この例題では、マスターデータのマッチング参照の定番手法である「変換入力」にスポットを当て、入力データにはない「地方区分名」をマスターから参照する方法について例示します。

フォルダ構成と業務手順

入力CSVファイルと都道府県マスター

INPUT\input.csv

都道府県コード,都道府県名
04,宮城県
13,東京都
14,神奈川県
27,大阪府
38,愛媛県
38,愛知県
96,テキサス州

MASTER\都道府県マスター.xlsx

都道府県
コード
都道府県名 地方区分名
01 北海道 北海道地方
02 青森県 東北地方
03 岩手県 東北地方
04 宮城県 東北地方
05 秋田県 東北地方
06 山形県 東北地方
07 福島県 東北地方
08 茨城県 関東地方
09 栃木県 関東地方
10 群馬県 関東地方
11 埼玉県 関東地方
12 千葉県 関東地方
13 東京都 関東地方
14 神奈川県 関東地方
15 新潟県 中部地方
16 富山県 中部地方
17 石川県 中部地方
18 福井県 中部地方
19 山梨県 中部地方
20 長野県 中部地方
21 岐阜県 中部地方
22 静岡県 中部地方
23 愛知県 中部地方
24 三重県 近畿地方
25 滋賀県 近畿地方
26 京都府 近畿地方
27 大阪府 近畿地方
28 兵庫県 近畿地方
29 奈良県 近畿地方
30 和歌山県 近畿地方
31 鳥取県 中国・四国地方
32 島根県 中国・四国地方
33 岡山県 中国・四国地方
34 広島県 中国・四国地方
35 山口県 中国・四国地方
36 徳島県 中国・四国地方
37 香川県 中国・四国地方
38 愛媛県 中国・四国地方
39 高知県 中国・四国地方
40 福岡県 九州地方
41 佐賀県 九州地方
42 長崎県 九州地方
43 熊本県 九州地方
44 大分県 九州地方
45 宮崎県 九州地方
46 鹿児島県 九州地方
47 沖縄県 九州地方

生成制御シートとひな形シート

例題データと制御シート・ひな形シートのポイント

  • 都道府県コード」は前ゼロ付きの2桁の数字です。
  • 入力データの「38,愛知県」「96,テキサス州」は、エラーデータの例として入れています。
  • ひな形シートの「都道府県コード」は、セル書式を「文字列」にして、前ゼロが表示できるようにします。必要に応じて中央寄せなどを指定してください。
  • 制御シート「入力項目名」キーワードの「#地方区分名」は、入力データにはない項目なので、項目名の先頭に "#" を付けます。
  • 注意点:制御シート [変換入力]-[ファイル] キーワードですが、制御ブック(CTL\データ生成.xlsx)のあるフォルダからの相対パス指定となります。この例題の場合は、CTLの親(..)フォルダの下のWORKフォルダの下を指定しています。 ..\WORK\都道府県マスター.xml

これまでの設定での実行結果

OUTPUT\output.xlsx

都道府県コード 都道府県名 地方区分名
04 宮城県 東北地方
13 東京都 関東地方
14 神奈川県 関東地方
27 大阪府 近畿地方
38 愛媛県 中国・四国地方
38 愛知県 中国・四国地方
96 テキサス州  

変換入力でマッチングに失敗すると「地方区分名」は空になります。この例では、エラーデータの「38,愛知県」も「都道府県コード」でマッチしてしまい、「中国・四国地方」がセットされてしまっています。

「マッチキー」の追加

これを改善するために、制御シートの「マッチキー」に「都道府県名」も加えてみましょう。マッチキーを横に並べると、AND条件(かつ)での参照判定となります。

都道府県コード 都道府県名 地方区分名
04 宮城県 東北地方
13 東京都 関東地方
14 神奈川県 関東地方
27 大阪府 近畿地方
38 愛媛県 中国・四国地方
38 愛知県  
96 テキサス州  

「固定値」キーで参照エラーを明示する

参照エラーを明示的に表示したい場合は、「固定値」キーに「ERROR」「未登録」「★エラー★」 などの任意の文字列を指定します。

都道府県コード 都道府県名 地方区分名
04 宮城県 東北地方
13 東京都 関東地方
14 神奈川県 関東地方
27 大阪府 近畿地方
38 愛媛県 中国・四国地方
38 愛知県 ERROR
96 テキサス州 ERROR

参照エラーデータをスキップしたいとき

マッチングに失敗した参照エラーデータを出力からスキップさせたいときは、「スキップ条件」キーワードに、「固定値」で設定した値を指定します。

都道府県コード 都道府県名 地方区分名
04 宮城県 東北地方
13 東京都 関東地方
14 神奈川県 関東地方
27 大阪府 近畿地方
38 愛媛県 中国・四国地方

バックオフィス DXPO「経理・財務DX展」で xoBlos を展示しました

8月23日・24日のバックオフィス DXPO(東京ビッグサイト経理・財務DX展」のブースで、xoBlos(ゾブロス)を展示しました。

財務管理は、企業における経営管理の一環をなし、財務計画の設定に始まり、日々の経理記録が続き、実施結果に対する期間ごとの財務統制で一旦終了する、大切で終わりなき業務です。「財務・経理部門」でのxoBlos適用例をまとめた資料がありますので、参考にしてください。

部門別業務例「財務・経理部門」
https://xoblos.hatenablog.jp/entry/2020/02/28/165131

復刻版チラシ(2012年):エコでスマートなコンセプトは現在のSDGsやメタバースにもつながる

今から10年前、2012年~2013年ぐらいに配布していたチラシのオモテ面画像です。

スマートフォンが社会に浸透し、スマートハウスやスマートシティがキーワードとして流行っていた時代のチラシです。

その後、SDGsが叫ばれ始め、テレワークが広がり、リアルオフィスとバーチャルオフィスを融合したメタバースオフィスも出てくるであろう現在。。。

xoBlos(ゾブロス)は変わらないようでいて、変わりながら持続しています。

制御シートキーワード ◆INDEX◆

◆あ◆

◆か◆

◆さ◆

◆た◆

◆な◆

◆は◆

◆ま◆

◆ら◆

◆A~Z◆

Designer:正規表現でファイルを選択コピーする

目標(GOAL)

[INPUT] フォルダに1月から12月の販売データが入っているとします。

この中から1月から3月までの3個のファイルを対象に [SELECTED] フォルダにコピーしたい場合、[コピー元ファイル名]ワイルドカード指定(* や ?)ではできなさそうですね。

こんなときのために、「ファイルのコピー」手順には「正規表現」指定による絞り込み機能が用意されています。

Designer での手順設定

[2.コピー元の詳細設定] で、[a.パターンに該当するもののみに絞り込む] または [b.パターンに該当するものは除外する] のどちらかに、正規表現で指定できます。 

上図の設定例では、

販売データ[1|2|3]月\.xlsx

という正規表現で、1~3の数字に絞り込んでいます。

実行結果

同じ正規表現を、[b.パターンに該当するものは除外する] の方に指定すると、ファイル名が 1~3以外の、この例では4~12月のファイルを対象にしてコピーします。

ヘルプより抜粋「コピー元の絞込設定」

コピー元の絞込設定

コピー元での指定の結果、複数のコピー候補が決まりますが、これをさらに正規表現をつかって絞り込むことができます。

正規表現」は、ワイルドカードよりも細かくパターン指定ができるものですが、すべてをここで解説できないため、「.NET 正規表現」などで検索していただくとよいでしょう。例えば、「文字列中に A, B, C のいずれかの文字を含む」や、「数字のみで構成される」、「3桁の数字の後に英字が1文字以上ある」、などの指定ができます。

正規表現」指定のサンプル

文字列中に A, B, C のいずれかの文字を含む

    [A|B|C]+

数字のみで構成される拡張子が .csv のファイル

    ^[0-9]+\.csv$

3桁の数字の後にアルファベットが連続して1文字以上ある

    [0-9][0-9][0-9][a-zA-Z]+

 

(この指定サンプルは、追々増やしていく予定です)

属性(Attribute)という便利な言葉

商品名 用途 大きさ 形態 対象者 材質 値段
シューズ1              
シューズ2              
シューズ3              
シューズ4              
シューズ5              
シューズ6              

靴(シューズ)の販売分析、マーケティングブランディング、データベース設計などを行うとしたら、まず手軽に始められるのは、Excelを使って商品の持っている観点を洗い出すことです。この観点は、カテゴリー、分類、属性などとも呼ばれます。

特に属性(attribute)という言葉は、IT用語、データベース用語ではお馴染みですが、マーケティングブランディングでも多用される便利な魔法の言葉なのです。

 

属性(Attribute)

どのような商品も、色、形、大きさ、重さ、素材、価格などそれぞれ異なる範疇に属して区別、分類することができる。この質的に区別できる、それぞれの範疇を「属性」という。

例えば、歯磨きの効能・効果の属性としては、「口臭予防」「歯周病予防」「虫歯予防」「美白効果」などの属性が存在し、この属性・区分にしたがって、持つべき製品特徴やブランド展開が考えられている。

歯磨きには、このような効能・効果の属性だけでなく、色、容量、原料、形態、価格などの属性も存在する。

引用文献: 「売れるもマーケ当たるもマーケ マーケティング22の法則」共著:アル・ライズ/ジャック・トラウト 訳:新井喜美夫 発行:東急エージェンシー

-----

関係(relation)
関係(relation)は普通、表(table)として表す。属性(attribute)は表の列に対する見出しであり、表の行が組を表す。したがって表と関係とを区別せずに用いる。

属性(attribute)

関係(relation)の属性とは、関係を表した表の列に対する名前であり、属性値は列の内容のことである。

引用文献: 「PROLOG データベース・システム」発行:近代科学社 原著者:D. リー 翻訳者:阿部憲広