データクレンジング

システムで保有しているデータを活用しようとする際に、データの半角/全角、空白や区切り文字、法人格や住所、電話番号の表記方法が異なることにより、十分に活用しきれないケースが多々あります。このような場合、データの表記ルールの統一、正規化を行い、活用に足る状態にデータ品質を整える必要があります。NTTデータ バリュー・エンジニアではデータ整備の基本手法として、データクレンジングを実施しています。 ​

お客様固有のデータ項目やルールを踏まえた、高品質なアウトプット ​

NTTデータ バリュー・エンジニアでは、単なる作業としてのデータクレンジングではなく、お客様の利用目的や実際のデータ状態を確認した上で、最適なデータクレンジングの設計をします。「半角/全角」「大文字/小文字」「法人格や住所表記の統一」といった基本クレンジングに加え、お客様独自のデータ項目や管理ルール、活用方法を踏まえた上で、個別的なデータクレンジングも対応が可能です。

3つの「NTTデータ バリュー・エンジニア流」で、データクレンジングを徹底的に支援する

  1. 1.「ツール+人間の目」だからできる、データの意味を捉えた深いクレンジングの実施

    data-cleansing_work.jpg

    機械処理やツールだけでは対応しきれない“汚れたデータ”に対しては、“深いクレンジング”が必要です。カテゴリごとに、「どのレベルまでのクレンジングを行うか」を定義する必要があります。NTTデータ バリュー・エンジニアでは、画一的な機械処理に留まらず、フリー入力テキストからの値切り出し、空欄の穴埋め・補完、正規表現への置き換えといった対応まで可能です。

  2. 2.あらゆる種類のマスタ、トランザクションデータが対象

    data-cleansing_description.jpg

    企業で活用したいデータの種類は、多岐に渡ります。NTTデータ バリュー・エンジニアでは顧客・法人マスタのみならず、商品データや調達品などの品目マスタ、また保守やカスタマーサポート情報などのトランザクションデータに対しても対応が可能です。

  3. 3.手順化されたデータクレンジング設計・運用で精度の高いデータをスピーディに

    data-cleansing_logic.jpg

    NTTデータ バリュー・エンジニアではデータクレンジングに関する手順やノウハウが確立されています。この手順・ノウハウに基づき設計・運用を行うため、抑えるべきポイントを踏まえた精度の高いデータを、比較的スピーディに提供することができます。

データクレンジング(顧客情報の場合)進め方例

データクレンジング(顧客情報の場合)進め方例

データクレンジングを使った事例

  • 某製造メーカ様

    有効な顧客データは約2割 顧客データ整備により大幅な業務効率化を達成

  • 某情報通信企業様

    コスト削減効果は5~7億 調達データ整備で最安値企業が明確に

関連ブログ