データコンサルYブログ:(第2回)「はじめてのメタデータ」~データマネジメントのすべては分からないが基本的なことはよく分かるブログ

2020-08-14

 

 

このブログは、人当たりの良さとマニアックな知識で、世間の荒波を漂流しリアライズに流れ着いた「流浪のデータコンサルY」が、データマネジメントについて控えめに語るブログです。仕事の合間の息抜きにご利用ください。

 

前回の振り返り

データマネジメントを学ぶなら、”データ”を知ることから始めよう

●データとは世の中の”何か”を文字や記号で表したもの

●データを”説明するデータ”を正しく定義することがデータマネジメントの第一歩

 

はじめに

皆さんいかがお過ごしですか!梅雨明けした途端に猛烈な暑さがやってきました。嬉しくはないけど、暑いからこそ夏らしいとも言えますよね。例年なら『おっととっと夏だぜ!』とビアガーデンにいっちゃうところですが、今年はコロナ禍ということもあり『何も出来なくて・・・夏』になりそうな予感・・・せめて一日でも過ごしやすい夏であって欲しいものです。

 

さて今回は、前回のブログの最後でお伝えした「データを”説明するデータ”を正しく定義する」ことについて、もう少し詳しくみていくことにしましょう。

 

題材は前回と同じく”商品価格(税抜)”です。

 

Y02_01.PNG

 

データを説明するための基本のキ

データは世の中の”何か”を文字や記号で表したものなので、それを説明するためには”何か”の正体を明らかにしなければなりません。言うなれば、説明をする人と説明を受ける人の間に、”何か”に対する共通の認識を作ればOKということです。難しい事と思うことなかれ、古今東西人間は物事に名前を与えることでこれを実現しているんです。

 

 

Y02_02.PNG

題材をみると、データ「100」に”商品価格(税抜)”と名前が付けられていることで、データ「100」に対する共通認識が作られることが分かりますよね。

ここで重要なことは、名前が正しいことです。仮に、データ「100」が”商品価格(税込)”と名付けられていたら、データに対する認識が実体と異なってしまいますよね。正しい命名はデータに命を吹き込みます「ま、これでいいか」と安易に妥協してデータに名前を付けると・・・後々手痛いしっぺ返しをくらいますからご注意を。

 

他にデータを説明する方法を考える

名前がデータを説明するために大切であるとはいえ、名前だけでデータのすべてが説明されたというのはさすがに言い過ぎです。もう少し説明をリッチにするためにデータの特徴を探ってみましょう。”商品価格(税抜)”が「100」であることから、次のような事が読み取れませんか!?

 

●データは数値である

●数値は正の整数である

●その桁数は3である

 

これに加え、5W1Hを意識して、データの目的や用途を文章化できればバッチリです。例えば、データ「100」は”商品を店頭で顧客に販売する際の税抜価格である。”といった感じです。文章化の際には、そのデータを発生させる現場に日々係っている人に尋ねてみると良いでしょう。日頃その人と良い人間関係を構築できていれば、比較的簡単にデータの概要を明らかにすることができるはず・・・とまぁこんな感じで、名前以外にデータを説明する方法を考えていきましょう。

 

「説明するデータ」をメタデータと呼ぶ

題材にならい、ここまでの話を整理すると以下の表のようにまとめることができます。

データマネジメントの世界では、データを説明するデータを「メタデータ」と呼びます。ホントによく使われる言葉なので、この機会にぜひとも覚えてしまいましょう!

 

Y02_03.PNG

 

前回のブログで”データマネジメントの第一歩”と書いたのは、メタデータを正しく定義することなのです。上の5つは代表的なメタデータ項目なので、いざ一歩目を踏み出そう!という方は、これらを整理するところからデータマネジメントに取り組み始めてみてはいかがでしょうか。

 

※少し補足すると、今回はデータ「100」だけを題材にしたので、取り得る範囲=正の整数、桁=3としました。ただ、実際のビジネスの現場では桁が3桁とは限らないし、負の整数が含まれるケースも十分考えられます。業務ルール次第でその内容は変化するので、メタデータは業務を映す鏡のようなものだと覚えておきましょう。

 

メタデータを整理する視点

最後に、メタデータを整理する視点について少しだけ触れておきます。「名前」を例に、データを整理する視点との違いを以下に示します。

 

Y02_04.PNG

メタデータを整理するには、「メタデータを説明するデータ」をしっかりとおさえる、すなわち、”商品価格(税抜)”がデータの「名前」であることを理解する必要があります。そのためには、通常データを認識する視点(視点①)より上位の視点(視点②)を持つ、言い換えれば抽象度を一段上げて物事を視ることが肝要です。先に示した5つの代表的なメタデータ項目を振り返って、それらが視点②で整理されていることを確認してみましょう。

 

おわりに

メタデータをインターネットで検索すると「データについてのデータ」とか「データを説明するためのデータ」といった記述が多くみられます。それがどういうことなのか腹落ちする前に何となく理解した気になり、『今さら聞けない状態』に陥っている人が結構いるんじゃないかな~と思い、少しでも多くの人に理解を深めてもらえるように書いたつもりです。(実は私自身が若い頃そうでした^^;)

 

最近よく耳にするデータカタログも、基本的にはこのメタデータがベースになっていますし、データマネジメントに携わる以上はメタデータからは逃れられません(笑)メタデータの世界はまだまだ奥が深くマニアックです。このブログでも今後何度も登場するでしょうから、適宜触れていくつもりです。Hasta la vista, baby!

 

次回予告

第1回、第2回は”商品価格(税抜)”を例に、1つの「データ項目」に着目してきました。しかし、ある1つの「データ項目」のメタデータが分かったからといって何かに利活用できるのでしょうか? 次回は、データを利活用するために必要な管理単位について触れたいと思います。

 

 

※記載内容は執筆当時のものです。株式会社リアライズは2023年1月1日に株式会社NTTデータ バリュー・エンジニアに社名変更しました。

 

 

 

次回のデータコンサルYブログ

データは活用してこそ意味がある!?データを利活用するための管理単位とは!?

(第3回)データは一人では生きられない

 

   

前回のデータコンサルYブログ

初めての人にもわかりやすくデータマネジメントを解説。ゼロから学ぶ、データマネジメントの世界。

(第1回)データって何だろう?

 

 

 

他の人気ブログ

 
 

関連ブログ