オントロジーとは? データマネジメント用語をわかりやすく解説
近年、多くの企業ではデータを軸にしたビジネス推進を行っています。
データを活用する上で、特に重要視されているのがデータ品質の向上と維持運用を行うデータマネジメントです。
この用語集では、データマネジメントやデータ活用に関する用語を解説しています。
また、データマネジメントの専門家として活動するNTTデータ バリュー・エンジニアが、データ活用のヒントもご紹介しています。
オントロジーとは
オントロジー(ontology)とは、元々は哲学の世界で言う「存在論(存在とは何かを研究する学問)」を示す単語ですが、ITの世界では知識の共有化や再利用の方法として研究開発が進み「対象世界をどの様に捉えた(概念化した)かを記述するもの」という意味で使われています。
例えば「『カレー』は『料理』という上位概念に含まれ、『作る手順』は『切る』、『焼く』、『煮る』という順になり、『切る』とは…」などと概念を整理すると正確に伝達することができ知識の共有化に繋がります。
また、人工知能(AI)の分野では「人がどの様に情報の意味を理解しているか」を、コンピュータに分かるようにするためにはどうすれば良いかが研究されており、情報システム開発の分野では「システムの利用者が、どの様に業務を捉えているか」を、設計者や開発者が共通理解や情報共有をするためにはどうすれば良いかが研究されています。
いずれにせよ、記述する人によって記述の方法や記述の粒度がまちまちになると、そもそもの知識の共有化や再利用が難しくなるため、記述ルールの標準化が必要になります。
NTTデータ バリュー・エンジニアが考えるデータマネジメント
データクレンジング・名寄せを行う際、単純な表記ゆれは機械処理で、ある程度補正することが可能です。
しかし、概ね半数以上のデータは単純な機械処理では捕捉ができないような表記のゆれ方をしているので、機械的な対応だけでは十分な結果が得られないというのが今までの実態でした。
しかしながら、AIの進化により、今まで人の目を介して初めて捉えていたような事実を、オントロジー(概念)レベルで機械的に紐づけ、マッチングをさせていくような技術研究が各所で進んでいます。
これらのテクノロジーを使いこなすためには、機械にインプットする「教師データ」が必要になります。この「教師データ」を構築し、学習方向を補正し、機械が判断する際の誤り率を減らす舵取りは、やはり人間の手を介さざるを得ません。
NTTデータ バリュー・エンジニアはこうした、AIをはじめとする最新技術に対するインプットデータの構築についても、ご支援をしています。
詳細は以下をご覧ください。
> データマネジメントを成功させるポイント NTTデータ バリュー・エンジニアが考えるデータマネジメントを成功させる3つのポイントを紹介しています。 > NTTデータ バリュー・エンジニアの名寄せ 一見簡単そうに見える「名寄せ」ですが、やみくもに実施すると連携している別システムに影響が出たり、名寄せ後のデータ活用で品質の問題が出てきます。品質の良い名寄せのポイントを紹介しています。 > NTTデータ バリュー・エンジニアのデータクレンジング 単なる作業としてではなく、お客様の利用目的や実際のデータ状態を確認した上で最適なデータクレンジングの設計をします。
|