ニュース
» 2013年6月 7日 更新

目指せ! セクスィー・データサイエンス・マーケター 分析のキモ!変数って?~アナリティクスを始めよう!講座3

 
mini_oshima.gif 
「アナリティクスを始めよう!講座」。第3回は「変数作成」を取り上げます。
  アナリティクスを成功に導く重要なカギとなるステップ。
  気合いを入れて勉強したいと思います
。  

 


【過去の記事はコチラ】 アナリティクスを始めよう!講座 
   第1回目 アナリティクスが成功に至る3つフェーズと最初のステップ「企画」
   第2回目 データ探索って?~アナリティクスを始めよう!講座2


変数作成はアナリティクスを成功に導く重要なカギとなる第1フェーズの3つ目のステップです。

3phases_s.gif 


 そもそも、「変数」って何?


そもそも変数ってどういう意味なんでしょう。
Wikipediaによると、「変数とは、未知あるいは不定の数・対象を表す文字記号のことである。」 とありますが、ちょっとスッキリしませんね。
mini_oshima.gif 分かったような、分からないような・・・・・。
  困った時は、えんぞう先生に聞いてみましょう。



20130607_1.jpg

変数は役割によって大きくふたつに分けられます。分析で明らかにしたいことが目的変数、その目的変数の関係性を説明する要素を説明変数と言います。
mini_oshima.gif なるほど。クリアになりました!


「変数作成」のステップは前回の「データ探索」のステップで選定したデータをもとに、この「説明変数」を洗い出していくプロセスです。

前回、この通販会社ではデータ探索を行い、「Webだけから日用品を購入する顧客は休眠しやすい!」という仮説を検証するために、次のデータを特定しました。
 ・Web販売管理システムデータ
 ・コールセンター販売管理システムデータ
 ・店舗販売管理データ
 ・顧客属性データ
 ・購買履歴データ

変数作成のステップで、「5W2H」の切り口から整理し、顧客の休眠化に影響する説明変数を抽出しました。
20130606_10.jpg

アナリティクスではこれらの説明変数について、目的変数である「顧客が休眠化するリスク」との関係性や影響度を定量的に明らかにしていくので、ここで有効な変数を抽出しておくことが重要なのです。
 
mini_oshima.gif わーい!顧客の休眠化リスクに関係がありそうな変数がたくさん
   抽出できましたよ。次はいよいよ、分析作業に突入ですね。
   「Webだけから日用品を購入する顧客は休眠しやすい!」って仮説、
   本当に正しいのか気になるところですね♪

   ・・・・・あれれ。ちょっと待ってください。
   さっき抽出した変数で、「Webだけから購入している人」や
   「日用品を中心に購入している人」って、どうやって見つければいいんだろう?


そう。実はここからが、「変数作成」の本番なのです。
顧客属性データやWeb販売管理システムデータなどに入っている「生データ」だけでは十分な分析は行えません。
例えば上記の説明変数の中にある「季節」という変数を考えてみましょう。販売システムに入っているデータは単に販売年月日だったりします。当然ながらシステム上にはそれが春なのか夏なのか、秋なのか冬なのかを判断できる情報は無いので、データを元に、事前に設定した「12月~2月までを冬と定義する」というルールに従って、「販売時の季節」という新たな変数を作成する必要があるのです。

それでは 「Webだけから日用品を購入する顧客は休眠しやすい!」という仮説を検証するためには、どんな変数を作成する必要があるでしょうか?
皆さんもぜひ一緒に考えてみてください!


 独自変数を作ってみよう!


この通販会社では、次の4つのポイントに注目しました。

 ①Webの利用率が休眠に影響するか?
 ②Web利用中心の顧客は休眠しやすいか?
 ③日用品の購買比率が高いと休眠しやすいか?
 ④特定カテゴリーしか購買しない人は休眠しやすいか?
20130607_3.jpg20130607_2.jpg20130607_4.jpg

さらにそれぞれのポイントを明らかにしていくため分析対象のデータを結合・加工し、新たに
 「Web購買比率」
 「利用チャネル数」
 「日用品比率」
 「販売カテゴリー数」
という説明変数を作成しました。これらは社内のデータソースを分析用に加工することにより新たに生み出された独自の説明変数です。
どこに注目して変数を作成するかが分析者のセンスの見せどころであり、日々の業務で培われてきた経験や知識が存分に生かされるポイントです。仮説検証を繰り返し、有効な説明変数をより多く手にすることが、アナリティクスを成功に導くポイントとなるのです。
20130607_5.jpg


以前、セクスィーな先進企業として「カべラス」の事例をご紹介しました。(「分析作業の75%を占めるもの」)
彼らは分析作業のうち75%もの時間をデータ準備だけに費やしていましたが、分析に使用する関連データの統合や、分析担当者自身が直接データにアクセスし加工できるシステム環境を整える事で、分析効率を飛躍的に向上させることに成功しました。特に変数作成では試行錯誤を通じて変数を磨いていく事が求められます。データ加工作業をプロセス化し、社内で共有することで大きな効率化を実現することができたのです。
mini_oshima.gifなるほど!
  カベラスの分析者たちがどんなデータ加工をしているのかな?って
  気になっていましたが、「変数作成」はまさに分析用データ加工の
  代表格だったんですね。



さて、分析に使用する変数作成が完了しました。
次はいよいよ、「モデル作成」のステップです。一気にアナリティクスっぽい響きになってきましたね。次回が楽しみです!
 

mini_oshima.gifアナリティクスにおける「変数作成」の重要性を理解した私。
  アナリティクス成功の鍵を 3個をGetしました!

20130607_6.jpg

 

 



 「All Analytics Day」 開催決定!


 アナリティクスとは何か? アナリティクスを成功に導く体系的な手法を事例とともに紹介する、
 アナリティクスのためのイベントです。
  日 時  2013年6月21日(金)13:30~17:25(受付開始13:00~)
  会 場  ベルサール六本木、ホールC/D(地下1階)
  主 催  SAS Institute Japan株式会社

AllAnalyticsDay すべての意思決定に、サイエンスを


 

Copyright© 2016 ITmedia, Inc. All Rights Reserved.

Loading

プロフィール

大島 玲子

大島 玲子

SAS Institute Japan株式会社 でBtoBマーケティングのキャンペーン企画/管理を担当。愛犬と一緒に、サッカー観戦をするのがお気に入りの時間。

「マーケター通信」購読一覧