2017年10月17日火曜日

分析結果の活用にあたっての注意点

今回は、データ分析結果の「業務での活用」や「システム化」を行う際に見落としがちな注意点のお話です。

分析結果を活用しよう


データ分析プロジェクトの成果として、有用な分析結果が得られたとします。
これまでの取り組みよりも遥かに良い成果が導けそうです。
当然、さっそく業務に組み込んで活用していこう、さらにはPDCAをまわして継続的に分析を業務に反映していこう、ということになります。

そうなると、システム構築を行って、活用を支える「仕組み」を作りたい、と考えるのは自然なことです。
データ加工や分析実行、さらには分析結果の可視化を自動化し、見たい結果が手間なく出せて、手間なく見られるようなシステム。たいへん魅力的です。

しかしながら、分析結果の活用、システム化にあたっては、いくつか注意すべき観点があります。
大きくまとめると、「データ」「ロジック」「活用方法」です。


データ


データ分析プロジェクトでは、有意義な結果を得るために、基本的には“使えるデータは可能な限り使う”というポリシーで臨むことが多くなります。どのデータが有用かは、分析の裏付けをもって証明されるはずだからです。
また、分析上必要なデータ処理、たとえば欠損値補完や形式変換、散在しているデータの結合なども、必要とあらば行います。

しかし、これらはあくまで良い分析結果を導くために行われる作業であり、必ずしも業務での活用を見据えているとは限りません。というより、どのような分析結果が出るかによって活用の仕方も変わってきますので、見据えることはできないといった方が正しいでしょう。

そのため、分析の活用にあたっては、分析フェーズでは想定していなかった問題が生じることがあります。
例えば、分析で使用したデータ項目をそのまま用いることはできない、という場合。
実際の日々のデータの中には、分析プロジェクトで使用したデータでは登場しなかったパターンの異常値が入っているかもしれません。欠損のなかったデータ項目にも欠損値が入ることがあるかもしれません。
それらによって、分析結果が算出できなかったり、あてにならない分析結果が導き出されてしまったりします。
このような場合、それら異常値や欠損値をどのように扱うのかを検討・対処しなくてはなりません。

また、データの取得自体、分析プロジェクトでは担当者や他部署にスポット対応をお願いして集めている場合も多く、これらを定期的に集める、もしくは必要な際に取得できる仕組み、体制や業務フローを構築しなければならない場合があります。

ロジック


データ分析プロジェクトでは、分析ロジックの構築にあたって業務上起こり得るレアケースは考慮されていないことも多いです。
レアケースは「レア」ゆえに意識されづらく、また、分析プロジェクトでの興味・関心は、一般的に想定される「王道」ケースで有意義な結果が出るかどうかだからです。

しかしながら、業務での運用、特にシステムによる自動化にあたっては、(一般的なシステム同様)レアケースへの対処を定義して実装しなければなりません。なんらかの例外処理で対処できれば良いですが、ときには分析ロジック自体を修正・変更しなければならなくなる場合もあります。

なお、分析ロジックの修正・変更は、前述したデータの取得の仕組みが構築できない際に行われることもあります。
そこでは、データ分析プロジェクトでの結果には及ばずとも、現実的に運用で利用できるデータで良い結果を導き出すことが目的となります。

活用方法


分析プロジェクト終了時点では、分析により業務で役立ちそうな知見が得られることはわかりますが、その結果をどう業務に活かしていくのか、施策への落とし方は分析結果とは別に検討しなければなりません。
そもそもの話になりますが、分析結果自体は価値ある知見であっても、どう活用していくかは分析結果自身は示してはいません。業務設計の領域といえます。

また、業務での活用の仕方を決めていくなかで、費用対効果を鑑み、どこまでをシステムで担うのかを検討することになります。
分析結果の可視化までを行い、施策立案を支援するシステムを作るのか、分析結果から具体的な施策を組み、各スタッフが利用する業務システムを構築するのか。
そこでは、組織、業務フロー、さきに言及したデータ管理など、さまざまな要素が絡みます。システムはあくまで「分析を活用する仕組み」の一要素なのです。

お気づきの方もいらっしゃるでしょうが、この業務分析とシステム化範囲の検討は、一般のシステム開発でも行われているもので、分析システムの開発に特化した話ではありません。
しかしながら、データ分析の業務への活用という領域は歴史が浅いこともあり、分析担当者・業務担当者・開発担当者(またはベンダー)の誰もが、進め方のイメージがなくどう扱ってよいかわからなかったり、お互いに“相手がやってくれるもの”と思い込んで、結局場当たり的な活用やシステム化を行うことになってしまい、せっかくの価値ある知見を活かしきれない、といったケースが残念ながらままあります。

分析結果を活用するには


データ分析プロジェクトの実施やその分析結果の活用にあたっては、上述の3つの観点を念頭に入れ、分析自体だけでなくその周囲・前後も含めて考慮・把握することが重要になります。
データサイエンティストが単なるデータ分析のアナリストと異なるのは、この3つの観点をふまえ、分析結果の活用までの支援を担うことにあります。

分析自体についてのみならず、分析をいかに業務に活用すべきか、どのように分析PDCAサイクルを構築するか、などについても、ぜひデータサイエンティストにご相談ください。

アイズファクトリー