DIKWとは? データマネジメント用語をわかりやすく解説
近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。
DIKWとは
DIKWとは、人間の知の分類を意味します。
一般に、Dataを底とし、Wisdomを頂点としたピラミッド階層で表されます。
それぞれの意味は次の通りです。
①Data(データ):文字、数字、記号などで表現した値を意味します。
例えば[山田さん、身長:180cm、趣味:サッカー]、[田中さん、身長:160cm、趣味:読書]などです。
ここでは単に値だけが記述されていると考えてください。
②Information(情報):データに人間が解釈を加え意味を与えたものを意味します。
例えば、
「山田さんはサッカーをやっていて身長は高い。田中さんは読書が趣味で身長は中くらい。」
など、取得したデータから人間が解釈した結果を表します。
③Knowledge(知識):体系立てられた情報の集まりを意味します。
例えば情報をもとに得た
「スポーツをやっている人の身長は高い。」
という結論が知識に相当します。
④Wisdom(知恵):知識を利用した応用力を意味します。
例えば「うちの息子はチビだからスポーツをやらせよう」などです。
これらのうち持ち運び(通信)ができてコンピュータで取り扱うことができるのはデータだけです。
情報以降は人間の解釈が介在するため、情報→知識→知恵となるにしたがって人から人に伝達させることが難しくなります。
例えば、知識には文章などに表された形式知と職人技のような言葉では表しきれない暗黙知があると言われていますが、特に暗黙知は簡単に人から人に伝えることはできません。
そのため、師匠と弟子のような関係の中で時間をかけて知識を伝承していく必要があります。
NTTデータ バリュー・エンジニアが考えるデータマネジメント
上述の通り、データは文字や数字、記号などで表現した値を意味します。
ビジネスシーンにおいてデータの利活用を推進とよく言われていますが、正確には“データ”ではなく、そのデータが何かを定義した“情報”の利活用と言えます。
例えば、複数のデータベースで管理しているお客様情報を統合してデータ分析を行う場合、あるデータベースの性別欄には「男性」「女性」「その他」という値が入っているとします。
しかし別のデータベースには「1」「2」「3」という値が入っていて、仕様書を見ると「1:男性」「2:女性」「3:未回答」と定義がされています。
また別のデータベースには「男」「女」といった値が入っているとします。
同じ性別の項目でも実際に入力されている値は、データベース毎に全く異なることが多いものですし、これらのデータをそのまま統合しても正確なデータ分析は行なえません。
そのため、まずはそれぞれのデータが持つ意味や定義を調べて統合前にデータプレパレーションの工程を入れる必要があります。
さて、この“データが持つ意味や定義”を説明するデータをメタデータと呼びます。
このメタデータをデータの利用目的に応じて収集、管理、公開、維持する取組を「メタデータ管理」と言い、データ活用の推進には欠かせない活動となります。
NTTデータ バリュー・エンジニアは、このメタデータ管理や、メタデータを公開する仕組みであるデータカタログ導入において、いかにメタデータを収集・統合し、組織に公開をしていくか、またメタデータ自体の品質維持の運用づくりという側面でご支援をしています。
メタデータ、データカタログについては、以下の情報もご参照ください。
> 3つの『NTTデータ バリュー・エンジニア流』がデータガバナンスを徹底的に支援する メタデータやデータカタログなどによるデータの可視化から継続的なデータ活用環境の運用までをトータルにサポートします。 > セミナー動画視聴「データカタログ構築失敗の原因と回避策を解説!」 動画の続きはこちらからご覧ください。
|