はじめに
2020年12月、総務省が「統計表における機械判読可能なデータの表記方法の統一ルールの策定」(以下「資料」と書きます)を発表しました。
資料の内容を短く言うと「Excel ちゃんと使ってね」ということです。
Microsoft Excel は広く使われているアプリケーションなので、資料の内容も良かったことから
【必読】総務省直伝のExcelマニュアルが目から鱗が落ちるものだった - Togetter
「ちゃんと」って?
では「ちゃんと使う」って何でしょうか。
上記資料のタイトルには「機械判読可能な」と書かれています。「Excel だって機械ではないか」と思うかもしれません。これはちょっと抽象的に過ぎる書き方ですね。もうすこし噛み砕いて言うと、次のようになります。
- 「機械」的な単純な手順で、連続したデータ(のみ)を拾い上げることができるようなドキュメントの作り方
「機械で判読可能」とは「機械的な単純な手順で判読可能」と読み替えていただいて構いません。「機械に読ませる」指示を出すのは人間です。「機械に読ませる手順」を考えるのも人間です。「機械がデータを集計する方法」を指示するのも人間です。その一つ一つを省力化したいというのが資料の目的です。
情報社会の進む方向
世の中にはいろいろな「情報」あるいは「データ」がありますが、人間が目にする場合、たいていは人間にとってわかりやすいように修飾・加工されます。
そしてこの「『データ』自体と、『修飾』は分けましょう」という方向に、社会は進んでいます(これは Excel に限りません)。
たとえば「表に書かれた数値というデータ」と「それを修飾したグラフ」。あるいは「テキストというデータ」と「フォントという修飾」。
「データ」はそれ自体で価値があり、なおかつ増えたり編集したり変化します。「修飾」はデータとはまた別に、時と場合によってさまざまに変化します。
それぞれを入力・加工・編集する「人」と「時間(タイミング)」は別々なので、別々に入力・加工・編集できるように(後々もしやすいように)、情報社会ではいろいろな方法が考案されてきました。普段作る書類も、その方向でデータ入力していきましょうというのが資料の趣旨です。
資料には、そういったデータ入力の「悪い例」と改善後の「良い例」が書かれています。
どうすればいいの?
ルールの内容の中には「これはやめてね」ということは書いてあるのですが「代わりにこうしてね」という内容が少ないと感じました。「修正後」という例示がありますが「もう少し、他にもやりようがあるな」と感じました。明日以降の記事では、それを書いていきます。
目次
(順次公開します)
- チェック項⽬1-1 ファイル形式は Excel か CSV となっているか
- チェック項⽬1-2 1セル1データとなっているか
- チェック項⽬1-3 数値データは数値属性とし、⽂字列を含まないこと
- チェック項⽬1-4 セルの結合をしていないか
- チェック項⽬1-5 スペースや改⾏等で体裁を整えていないか
- チェック項⽬1-6 項⽬名等を省略していないか
- チェック項⽬1-7 数式を使⽤している場合は、数値データに修正しているか
- チェック項⽬1-8 オブジェクトを使⽤していないか
- チェック項⽬1-9 データの単位を記載しているか
- チェック項⽬1-10 機種依存⽂字を使⽤していないか。
- チェック項⽬1-11 e-Stat の時間軸コードの表記、⻄暦表記⼜は和暦に⻄暦の併記がされているか
- チェック項⽬1-12 地域コード⼜は地域名称が表記されているか
- チェック項⽬2-1 データが分断されていないか
- チェック項⽬2-2 1シートに複数の表が掲載されていないか