2017年1月5日木曜日

ビジネスの理解の大切さ

データ解析プロジェクトが成功するカギは「ビジネスの理解」

弊社ではこれまで300以上のデータ解析プロジェクトを行ってきましたが、その中で日々つよく意識していることがあります。それは「お客様のビジネスを理解すること」の重要性です。データ解析を行う際に、データがあれば
すぐに解析作業にとりかかれるというイメージがあるかもしれません。しかしこれは、我々データサイエンティストにとっても解析プロジェクトを依頼してきたお客様にとっても、アクションに結びつかない解析結果の導出や、解析作業自体のミスなどが起きる、典型的な失敗プロジェクトになります。最大の理由は、「ビジネスの理解」ができていないためです。

「ビジネスの理解」とは、CRISP-DM(※注1)における6つあるステップの中でもファーストステップの部分であり、データ解析プロジェクトの目標、ビジネスにおいて果たす役割、およびその効果を明確にすることを言います。もう少しわかりやすく言うと、ビジネスモデル(収益を上げるための仕組み)の理解、業務フローの理解、お客様が持っている肌感覚の理解などを行い、データ解析で解決できる課題へのブレイクダウンなどを行う作業をいいます。

(※注1)
CRISP-DM(CRoss-Industry Standard Process for Data Mining)は、SPSS、NCR、ダイムラークライスラー、OHRAがメンバーとなっているコンソーシアムで開発されたデータマイニングのための方法論を規定したものです。業界横断的に展開可能なデータマイニングのプロセスモデルとなっています。


データ解析プロジェクトが成功するカギは「ビジネスの理解」にあるといっても過言ではありません。今回は「ビジネスの理解」をしっかり行うことで、どんなメリットがあるのか見ていきたいと思います。

「ビジネスの理解」のメリット ―価値のある解析が可能になる―

解析作業を行う前にビジネスの理解を行うことで、大きく2つのメリットがあります。1つ目のメリットは、「価値のある解析=アクションに結びつく解析」が可能となることです。

たとえば最新の解析手法で、とても高度なアルゴリズムを使用して解析結果を出したとします。しかし出てきた結果が、お客様が活用できない結果であればなんの意味もありません。解析結果は、お客様のアクション(施策など)に結びつかなければ意味がありません。たとえばお客様の顧客像を構築する際に、データ上は10個の顧客像に分けることが最適なグルーピングだとしても、実際に解析結果を活用して運用していく際(DMのクリエイティブの打ち分けなど)には10個のグループは過多であったりします。その場合、お客様が解析結果を活用できるようにデータの観点とビジネスの観点の両方で最適な顧客像の数を設定する必要があります。

この問題を解決するためには、解析作業を行う前にお客様の「ビジネスの理解」をしっかりと行い、どんな解析結果を出すことでお客様が活用できるのかを、データサイエンティストとお客様がきちんとディスカッションを行う必要があります。解析結果を活用したアクション(施策など)を見据えたうえで解析作業を行うことで、解析結果がお客様のアクション(施策など)に結びつかないというような「典型的な失敗プロジェクト」を回避することができます。

「ビジネスの理解」のメリット ―解析作業の質の向上―

2つ目のメリットは、「解析作業のミスを防ぐ」ことが可能となり、解析作業の質の向上が図れることです。私たちデータサイエンティストが扱うデータは、時に数億行(数年間にわたるPOSデータなど)という大きなデータになることがあります。数億行にもなるデータの場合、数万行のデータとは違い中身を目視ですべて確認したり、集計結果の妥当性を確認することは難しくなります。そこで役に立つのが「ビジネスの理解」です。

たとえば数億行のPOSデータから顧客ごとに1年間の平均購買金額(Monetary)を集計したケースを考えてみます。その結果、顧客1人当たりの年間平均購買金額(Monetary)が10,000円という結果が出たとします。POSデータの集計に用いたプログラムについてもスモールセットデータを用いて集計結果の妥当性は確認済みであり、解析作業自体に間違いはないようでした。しかし算出された年間平均購買金額(Monetary)は間違いだったのです。それは何故でしょう。

このケースでは、集計結果を確認した解析担当者がミスを発見できたのですが、ミスを発見できた要因は「ビジネスの理解」ができていたからです。POSデータを集計する前に、お客様とディスカッションをしながらお客様の顧客の購買傾向、たとえば商品単価やお客様が肌感覚として持っている顧客の年間での購買行動などを把握していたことから、多くの顧客は3,000円程度の購買を年間約2回行っていることを理解できていたために、年間平均購買金額が10,000円という集計結果はその肌感覚に照らすと高すぎることに気づくことができたのです。

このようにビジネスの理解をしっかりと行うことで、解析作業のミスを防ぐことができ、解析の質の向上が図れるのです。

繰り返しになりますが、解析プロジェクトを行う際、データがあればなんらかの解析結果が出て、なにか施策に活用できるものが出てくるのではないかという漠然としたイメージを持たれている方がまだまだ多いのが現状だと思います。

しかしそれは「失敗プロジェクト」の典型的なケースになります。上述のように、解析を始める前にしっかりと「ビジネスの理解」に時間を使うことで、アクションに結びつく解析結果を導き出すことで解析の価値が向上し、さらには解析作業のミスを防ぐこともでき、解析作業自体の質の向上も狙えることが少しでもご理解いただけたでしょうか。


投稿者 データサイエンス部 杉林(株式会社アイズファクトリー