2016年12月13日火曜日

ビジネスの理解とプロジェクトスコープの設計

お客様にデータ解析をご提供するにあたり、CRISP-DM(※注1)における「ビジネスの理解」はその後に影響するたいへん重要な工程です。今回は「ビジネスの理解」にもとづいたプロジェクトスコープの設計について、ある案件の事例を紹介いたします。

(※注1)
CRISP-DM(CRoss-Industry Standard Process for Data Mining)は、SPSS、NCR、ダイムラークライスラー、OHRAがメンバーとなっているコンソーシアムにて開発されたデータマイニングのための方法論を規定したものです。業界横断的に展開可能なデータマイニングのプロセスモデルとなっています。

レコメンドの導入事例

ある商材の情報サイトを運営されているお客様(以後A社とします)から、「サイト上に掲載している商材のレコメンドの仕組みを導入したい」と言うお話をいただきました。
レコメンドとは、端的に言うと「この商品を見ている人は、次の商品も見ています」という方法で、他の商品のリストを提示(推奨)する仕組みです。サイト閲覧者の購買率アップやクロスセルなどを促進させることを目的とすることが多く、狙いとする目的により、「見ている」は「購入した」となる場合もあります。

A社のご担当者によると、自社サイトにレコメンドを取り入れ、サイトの競争力をつけたいというのがその理由でした。当時は、複数のサイトでレコメンドが導入され始めていた時期で、A社でも注目されていたようです。A社は近々サイトの全面リニューアルを計画しており、このタイミングでお考えになられていました。

さて、レコメンドに限らず、データ解析の実施やそのシステム化を行うにあたっては、まずは以下のプロセスを実施することが重要になります。

ビジネス上の目的を明確にする
費用対効果を考える

ビジネス上の目的を明確にする

レコメンドといっても、目的が購買単価のアップなのか、集客率の向上なのか、何を目的にするかによって、「誰に、何を、(どのように、)提示するか」が変わってきます。
たとえば、購買単価のアップが目的なら、中身を重視する顧客に、「価格が高くてもより魅力的な商品を提示する」という具合です。

A社の場合、サイト訪問者がサイトを回遊する中で、A社が力を入れている商材の閲覧につながるようなレコメンドを行いたい意図がありました。つまりは、特定商材についての集客率向上、というのがビジネスの目的になります。

費用対効果を考える -効果の測定-

次に、費用対効果です。
データ解析では、研究開発的要素が絡むことが多く、結果が確定的ではありません。また、研究で得られたロジックとビジネスでの応用との間では、精度・効果とコストがバーターになることが一般的です。
したがって、分析やそのシステム化にかかるコストが効果に見合うのかを推測し、収支に見合う分析内容やシステム化範囲をご提案することが、お客様の意思決定の助けとなります。

ここで、データ解析の効果をどう測るかが、課題となります。
レコメンドにおいては、「行う/行わない」や行うパターンごとのABテストなど、実証比較実験を行えば効果を測定できますが、準備時間やコスト増になりがちです。

A社の場合も、サイトリニューアルのスケジュールは既に立てられており、レコメンドのための実証比較実験を挟む余地が無い事情がありました。そのため、現実的にレコメンドの効果を(サイトリニューアルにおける他の施策と独立して)測定することは困難でした。
そこで、協議のうえ、実証比較による効果測定は行わないことにしました。かわりに、過去の実データをもとにレコメンドのシミュレーション(模擬実験)を行い、提示される商材リストがページ閲覧や購買につながりそうかどうかの妥当性を、A社内に評価チームを組み検証いただくことにしました。

費用対効果を考える -費用-

続いて、費用対効果の「費用」、すなわち分析内容やシステム化の範囲についてです。
データ解析は確定的な結果が保証されていないことから、次の進め方を提案しました。

(a) まずは最も基本的なレコメンド手法である協調フィルタリングから始め、運用の中で必要に応じて高度な手法の導入を検討していく。
(b) いきなり実運用システムの構築を行うのではなく“プロトタイプシステム”により(シミュレーションを行い)効果を検証する。

(a)については、基本的な手法は複雑なロジックと比べ得られる効果は及ばないものの費用対効果は高くなることが多く、どこまでコストを投下してよいかが明確でないケースでの現実的な進め方です。
また、(b)は一見すると遠回りに見えますが、トータルで効率的となる進め方です。実際、実運用システムでは単に分析内容をシステム化するだけでなく、扱うデータ量や処理速度などの非機能要件や運用まで考慮した設計・実装が必要となります。そのため、簡易的であってもプロトタイプシステムを構築し分析結果を検討し、その結果を踏まえてサービス内容や実運用システムを構築することが、結果として効率的な推進となります。

A社のご担当者は上記の進め方についてご了承くださいましたが、一点だけ、「古いアクセスに引っ張られて古い商材がいつまでもレコメンドで出ることは避けたい」とご要望をいただきました。

これは一般には「忘却効果」といわれる要素で、古い情報は順次捨てていき、これにより状況の変化を反映させるというものです。A社のビジネス目的上も重要な観点であることから、(a)とともにまずは簡易的な「忘却効果」実現ロジックを検討し、協調フィルタリングと組み合わせる、という方針としました。

以上が、ビジネスの理解からプロジェクトスコープの設計までの流れになります。

まとめ

実際のプロジェクトでは、CRISP-DMの残りの工程を(ビジネスの理解に立ち返りつつ)行いました。具体的には、実際にログデータを解析し、「忘却効果」の簡易ロジックと協調フィルタリングを用いたA社向けのレコメンドロジックを構築しました。また、そのロジックを実装した簡易な“プロトタイプシステム”により、A社の評価チームにもシミュレーションを行っていただき、解析上のパラメータや、実際のサービス化にも影響するレコメンドの粒度などを調整しながら、実運用システムでの提供イメージをつけていきました。

最終的には評価チームの方々にもご満足いただき、引き続き実運用システム構築のプロジェクトを進めていくこととなりました。
そちらの推進にあたってはまた別の課題がありましたが、それはまた別の機会に…。


投稿者: データサイエンス部 データサイエンティスト (株式会社アイズファクトリー