データアナリティクスソリューション開発秘話 ~リアライズがデータアナリティクスソリューションを提供する理由~
2022年6月に新たに「データアナリティクスソリューション」ページを公開しました。
データマネジメント専門会社であるリアライズが、なぜアナリティクス領域のソリューションを提供するのか。リアライズが提供できる価値は何かを、本ソリューションの企画者である平田にインタビューしました。
まずは、データアナリティクスソリューションの概要を教えてください。
お客様のデータ活用を推進するためのデータ可視化を行うソリューションです。
具体的には、お客様のデータ活用を通して叶えたい、ビジネス目的の明確化から、必要なデータの検討と収集、データプレパレーションの実施、目的にあわせて見やすいビジュアルに可視化するまでを含めたソリューションです。
BIツールを導入すれば、最近のツールには標準で多数のチャートやグラフが搭載されているので、簡単に実現できるのではないでしょうか?
もちろん、BIツールを導入すれば簡単にダッシュボードが構築できますし、搭載された様々なビジュアライゼーションを使用して手軽に可視化ができるようになっています。
しかし、データ活用の目的はデータをビジュアル良く魅せることではなく、その可視化されたデータを人が見て、正確に状況を把握して判断したり、新たな気付きを得たりすることが目的ですよね。
それを実現するには、どのデータをどのような表現で可視化するかを入念に検討する必要があるのです。
また、BIツール導入の前に、利用するデータの特定と、データの粒度を揃える工程も重要です。
例えば、需要予測に基づいた在庫管理や適切な人員配置を検討する場合、製造業の場合は日別の売上データを利用しますが、これが外食業界になるとピーク時間による人員配置も視野に入れるため、日別ではなく時間軸の売上データが必要となります。
このようにお客様のビジネス特性やデータ活用目的にあわせて、適切なデータの収集とデータの粒度を揃えるデータプレパレーションを行うことが重要となります。
これらを含めて支援するのがリアライズのデータアナリティクスソリューションの特徴です。
データマネジメントの専門会社であるリアライズが、なぜデータアナリティクスのソリューションを提供するのでしょうか?
一般的に、データがその価値を発揮するのは活用の領域となりますが、リアライズが専門として支援していたのは活用の一歩手前のデータマネジメントの領域が中心でした。
データマネジメントを企業に根付かせ、データ中心のビジネス推進を行う基礎作りができても、その先のデータ活用が進まなくてはビジネス価値の発揮には至りません。
だからこそ、お客様のデータ活用もトータルに支援ができるよう、データアナリティクスソリューションをラインナップに追加したのです。
また、私たちは以前よりお客様のご要望でTableauを使ったデータ可視化支援を行っていました。
その際に、データ可視化で重要となるポイントは、「目的の明確化に重点を置くこと」と「データアセスメントを入念に行うこと」だと改めて確認することができたのです。
これらは私たちが長年データマネジメントPJで培った高いスキルを保有している領域ですので、それを活かせると考えたのが、もう1つの理由です。
他社でも同様のサービスを見かけますが、リアライズならではの価値はありますか?
上述しましたが、私たちは長年データマネジメントPJを通してデータを見続けてきたので、データアセスメントやデータプレパレーションなど、他社には真似の出来ない価値を提供できると自負しています。
具体例を挙げると、調査会社から購入した過去10年分の調査結果データを元に、市場傾向の推移を経年で分析したいといった要望の事例がありました。
調査会社からは毎年同じ設問で市場に調査依頼し、結果を取得していると説明を受けていましたが、実際のデータを見てみると下記のように年度によって差異があり、経年比較することが難しい状態でした。
・設問のNo.が同じであっても年度によって順番が異なり、設問のキーとならない
・調査の設問記述(テキスト)が同じことを意味する設問であるにも関わらず記述が異なるケースが存在する。
例えば、一部の単語の表記違い、語尾や句読点の違い、余分なスペースが入っている
・回答の選択肢が少し変化して「1.現金 2.クレジットカード 3.電子マネー」が、ある年から「1.現金 2.クレジットカード 3.電子マネー/バーコード決済」に変わっている
・5段階評価の回答で「満足・やや満足・普通・やや不満・不満」だったのが、「とても満足・満足・普通・不満・とても不満」と異なる評価に変わっていた
このようなデータは人の目で見れば気づけるのですが、そのままBIツールに入れると文字列が違うことによって集計単位が異なってしまいます。そのため意図通りに集計ができず、結果として経年で比較することができなくなります。
また、社内で蓄積されたデータを例に挙げると、データが格納されているシステム設計書にデータの定義が書かれていても、実データが完璧にデータ定義書通りに入っていることはほぼありません。
データ定義書通りの区分値でないことや、外れ値だらけというケースはデータマネジメントを専業にしている私たちには当たり前といえるほど必ず遭遇します。
これらのデータを他社では、外れ値として分析対象のデータから除外してしまうケースもありますが、分析結果にバイアスがかかってしまいます。
リアライズは事前のデータアセスメントとデータプレパレーションで少しでも多くのデータを救い上げるので、よりリアルな分析結果を導きビジネスに活かすことができます。
これも、データマネジメントを20年やっていたリアライズならではの価値だと考えています。
今後、データ活用領域で展開するサービスはありますか?
2022年2月に発表した「飲食店向けデータ分析のオールインワンサービスを提供へ~データ前処理×データ分析×AIでPOSデータの波形からAI需要予測~」の通り、飲食店向けデータ分析サービスを提供に向けて開発中です。
これは、飲食店のPOSデータだけで需要予測ができるサービスとなりますので、手軽に利用いただけます。
具体的なサービス内容は、発表できる時期が来たら紹介しますので、どうぞお楽しみに。
ブログを始めると聞きました。どのような内容か教えてください。
データ分析を進めるにあたって、皆さんがどこで困っているのか、どのようにして解決できるのかを体験記のように書いていこうと考えています。データアナリティクスソリューションに携わるチームメンバーで書いていきますので、それぞれの視点でのアドバイスを紹介したいと思います。
最後にメッセージはありますか?
以前よりデータ活用の問い合わせはありましたが、昨年から「データカタログを構築したい」「データガバナンスを進めたい」といった種類の問い合わせが多くなっています。
データカタログの導入や、データガバナンス推進の背景には、データ活用を企業全体で行いたいという考えが見えます。一部の限られたデータサイエンティストがデータ分析するだけなら、データカタログやデータガバナンスの必要性は少ないですからね。
データを活用した競争力のあるビジネス推進を目指すなら、データ品質を軽んじてはいけませんので一度リアライズに相談してみてください。(※お問い合わせはこちら)
※記載内容は取材当時のものです。株式会社リアライズは2023年1月1日に株式会社NTTデータ バリュー・エンジニアに社名変更しました。