CSV ファイルの Excel 抽出時の注意点

CSV の正式な確認方法

xoBlos の業務で、入力データとして登場するファイル形式の一つ、CSV。Office を入れられている方からすれば、「Excel の一種!」というご意見が挙げられることもあるでしょう。

しかし Excel と思われてしまうのは、『アプリケーションの関連付けが Office(Excel)にされている』、或いは『CSV ファイルを開くのに Office(Excel)が推奨されている』等の面に縁るのです。

f:id:xoblos:20180605134734p:plain

CSV は上図、上部のようにメモ帳やテキストエディタで、開くこと/開いた見た目 = 正式/正確です。確認するだけでなく、編集するなら尚更です。Excel で開くと上図、下部の「No」のように Excel ならではの表現に書き換えられてしまうものもあるので、確かな情報が得られませんし‥‥このまま編集すると、誤った情報で更新しかねません。これは、xoBlos を通しても同じことが言えます。

CSV に対する制御シートでの抽出

xoBlos では、CSVExcel として見て抽出することができます。前節のような注意点はありますが、「CSV のヘッダ行に、XML に使用できない項目名がある!(前回記事」や、「形式は CSV であるけれど、レコードによって列の量が変動する!(前回記事」等の場合に、制御シートを用いる抽出方法が活躍します。

Excelから抽出』の手順が使えるということは、『高速抽出エンジン』が使用できる?‥‥とも思われるかもしれませんが、CSV に対しての高速エンジンの使用は推奨しません。以下の仕様を、理解しておきましょう。

CSVExcel として取り扱う上で、一回の処理に 3回ファイルは開かれている。

「C:\Users\ユーザ名\AppData\Local\Temp」に出来上がる一時ファイルは、
上記のとおり「3つ」出来上がる。
→文字コードの認識や、同容量の Excel を一時的に作り上げる分等によるもの。
⇒高速エンジン使用すると、一時ファイルは消えない為、
 C ドライブの容量が増えていく