ニュース
» 2013年6月14日 更新

目指せ! セクスィー・データサイエンス・マーケター いよいよモデル構築~アナリティクスを始めよう!講座4


【過去の記事はコチラ】 アナリティクスを始めよう!講座 
   第1回 アナリティクスが成功に至る3つフェーズと最初のステップ「企画」
   第2回 データ探索って?~アナリティクスを始めよう!講座2
   第3回 分析のキモ!変数って?~アナリティクスを始めよう!講座3



第2・3回でご紹介したデータ探索、変数作成のステップで、分析作業の下準備が完了しました。
今回は第1フェーズの最後のステップ「モデル構築」です。

3phases_s.gif 

mini_oshima.gif モデルっていったい何でしょう?
  ファッション誌の表紙を飾るモデルさん!・・・では無いですよね?


 モデルって、何?


目的変数と説明変数との関係式をモデルと呼びます。

以前、「ワイン評論家を激怒させた方程式」でご紹介した、アッシェンフェルター氏が編み出したワインの質を収穫段階で予言できてしまう方程式を覚えていらっしゃるでしょうか?

 ワインの質=
 12.145+0.00117×冬の降雨+ 0.0614×育成期平均気温‐ 0.00386×収穫期降雨

この場合、
 目的変数 : ワインの質
 説明変数 : 冬の降雨量、育成期平均気温、収穫期降雨
となり、目的変数と説明変数との関係を表したこの方程式は、「ワインの質の予測モデル」と呼ぶことができます。雨や気温がワインの質に及ぼす関係を過去のデータから学び、一般的法則として導き出すことがモデルの目的です。
mini_oshima.gif なるほど!
  でも、こんな関係式を作るのって難しそうだなぁ。
  統計解析の専門知識とかが必要だったりしますか?
  ワタクシ自慢じゃないですが、高校の統計解析の試験は・・・・・。
  ・・・・・助けて!えんぞう先生!

20130614_1.gif

統計解析などの専門知識が無くても、分析ツールなどを活用することでアッシェンフェルターさんが作り上げたような関係式、つまりモデルを作ることが可能です。ここではSASを使って、前回までの通販会社が分析モデルを作る作業を見てみましょう。


 モデルを構築してみよう!


通販会社の担当者はツール上で「ディシジョン・ツリー(決定木)分析」と呼ばれる分析手法を選択、目的変数を 「顧客の休眠有無」 に設定し、前回作成した説明変数を投入しました。操作はこれだけです。あとは分析ツールが自動的に、影響力の強い属性を順に抽出し、グループ分けしてくれるのです!

実際の分析結果の画面を見てみましょう。

会員 120,000名のなかで、休眠状態になっている顧客は12%です。各ボックスのグラフで、青色がアクティブ顧客、緑色で表示されているのが休眠顧客です。
分析ツールは分析結果に基づき、休眠している/していない という目的変数に最も影響を与える属性を上からは順に表示してくれます。まず最も明確に分けられるのは、「女性単身者かどうか」という属性であることが判明しました。木の幹が枝分かれするように、単身女性かそれ以外かで分岐し、グループ分けして表示されます。女性単身者だけに絞り込んだ場合、休眠している率は20%になりました。
20130613_2.jpg
次に影響が強い因子としてツールが発見したのが、「季節用品の購入履歴の有無」です。季節変化に伴う商品の購入履歴がある単身女性に限定すると、休眠化している顧客は37%まで高まりました。そして最後の因子が「Webからの購入有無」です。Webからの購入比率が高い顧客だけに絞り込むと、休眠している顧客は65%にも上ることが判明しました。
こうして顧客グループごとの休眠化確率を予測する「予測モデル」が構築できました。このモデルを活用することで同じ属性を持つ顧客の休眠確率を予測することができるようになるのです。
mini_oshima.gif すごい!
  基本的な知識は必要でも、難しい専門知識なしでモデルができちゃった!
  これなら、私でも簡単で出来ちゃいそう。うーん。セクスィー!


さらに分析を行った結果、休眠する確率が65%の次のような「顧客像」を導き出すことができました。

 ■過去データで休眠化が高い顧客像
 
新生活準備や季節変化に伴う商品(カーテン、マット、布団カバー、家電)を
 Webからまとめ買いした単身女性

20130614_2.gif

データ探索のステップで見つけた、「Webだけから日用品を注文する顧客は休眠しやすい」という仮説が裏付けられただけでなく、具体的な顧客像が浮かんできました。
mini_oshima.gif うんうん!すごくイメージが湧きます。
  新入社員や新入生など一人暮らしを始める女の子たちが
  Webからお得に賢く家具一式を買っけど、一度揃えちゃえば
  季節用品はなかなか購入しないですもんね。
  きっとそのまま休眠化しちゃったんでしょうね。
 

上図のボックスは、一つ一つが、同一あるいは類似する特徴を持つ顧客グループとなります。
個人の属性や特徴が同一または類似する顧客をグルーピングし分類する手法をセグメンテーションと呼びます。似た傾向のある顧客をいくつかのグループ=セグメントに分けることで、そのセグメントの特性がより理解しやすくなり顧客理解を深めることができるのです。

これらの属性の中から有効なものを複数組み合わせていく事でよりセグメントを細分化することができ、セグメント特性に応じたマーケティング・キャンペーンを設計したり、対象とすべき顧客をピンポイントで抽出することができるようになります。セグメンテーションを活用して対象とすべき顧客を選別することを「ターゲティング」と言います。(詳細はコチラ!)


アナリティクスによって明らかにされた「顧客セグメントごとの休眠化リスク」と「休眠化に影響を与える要素」、そして「具体的な顧客像」をベースに、具体的な施策を検討することができるのです。皆さんだったらこの場合、どんなキャンペーンを企画されますか?
mini_oshima.gif うわー
  ここまで具体的な対象者のイメージや休眠化に影響を与える要素が
  わかれば、キャンペーンを企画するのも楽しいですね。

  たとえば、季節ごとに模様替えを楽しみたい女子ゴコロに響くよう、
  「季節ごとに暮らしを演出する!生活用品3アイテム」とかどうでしょう。
  それから、それから・・・・・。



モデルが示す関係式に納得がいき、分析結果の信頼性が高ければ、データ分析の作業は完了です。
もっとも、この作業が最初から最後まで一回でスムーズに完了することはほとんどありません。実際には個々の作業は繰り返しが何度も発生します。最初は根気が必要と感じられるかと思いますが、徐々に慣れていただけると思います。このPDCAサイクルを何度も繰り返していくことが、データ分析の高度化への隠れた近道なのです。
20130614_3.gif

mini_oshima.gif なるほど。
  モデルの精度を実際のデータで検証してみて、
  微調整しながらチューニングしていくんですね。
  分析ツールといっても魔法の杖のように、ポンッ!と結果が出る訳じゃないんだ。

  モデル構築の重要さとPDCAサイクルの大切さを学んだ私。
  セクスィー・ポイントを 5ポイントと、分析の木を 3本をGetしました。 

20130614_4.gif



 


 ★えんぞう先生からのお知らせ★

えんぞう先生が大活躍するFacebookのページが始まりました。その名も、「アナリティクス」!
えんぞう先生がアナリティクスに関する情報を毎日更新しています。
「いいね!」で応援、お願いします!
 http://www.facebook.com/analyticsjapan


 「All Analytics Day」 開催決定!


 アナリティクスとは何か? アナリティクスを成功に導く体系的な手法を事例とともに紹介する、
 アナリティクスのためのイベントです。
  日 時  2013年6月21日(金)13:30~17:25(受付開始13:00~)
  会 場  ベルサール六本木、ホールC/D(地下1階)
  主 催  SAS Institute Japan株式会社

AllAnalyticsDay すべての意思決定に、サイエンスを

Copyright © ITmedia, Inc. All Rights Reserved.

Loading

プロフィール

大島 玲子

大島 玲子

SAS Institute Japan株式会社 でBtoBマーケティングのキャンペーン企画/管理を担当。愛犬と一緒に、サッカー観戦をするのがお気に入りの時間。

「マーケター通信」購読一覧