ニュース
» 2013年4月22日 更新

データドリブンな時代を『データ柔術』で生き残ろう 番外編 「Facebookページで、ぜひ時系列分析をやっていただきたい理由」

Data Jujitsu5.png

1.はじめに: 長年の疑問

Webサイトの管理運営をしていく上で、効果測定ツールを入れて、ページビュー(PV)、セッション数、ユニークユーザー数(UU数)、コンバージョン数などをKPIとして皆さん管理し、レポートなどまとめていらっしゃると思います。その際に各指標を日別、月別などに集計し、時系列のグラフとしてまとめられていますが、それでいいのでしょうか?
  
・時系列の集計グラフからでは見えないことがあります。
Webサイトにおけるゴール(KPI)は普通、購入申し込み、資料請求などのCVに設定されると思います。それにつながる関連指標(KPI)として、PV、UU数などを設定されていることだと思います。Webサイトでは、目的は明確なことが多く、それにつながるKPIも経験上から決めやすいかと思います。
 (私からするとここも疑問なんですが)
  
では、Facebookページではどうでしょうか?
企業がFacebookページを運用する場合、なんらかのマーケティング目的があるはずです。FANづくりを目的として「いいね!」を獲得することをKGIとされている企業もあるでしょう。ソーシャルメディア上での情報拡散として「リーチ」をKGIとしている場合もあるかもしれません。また、試験運用のためKGI、KPIを設定しない企業もあるかもしれません。
では、KGIに関連するKPIをどのように設定しているのでしょうか?日別、週別、月別の集計値とその時系列グラフを眺めていて、それが決められるのでしょうか?グラフの形状を見て、なんとなく指標間に関係がありそうだからとKPIを決められることもあるかもしれません。
はたしてそれでいいのでしょうか?

2.KGIとKPIを決めるにあたって

 ・まず、統計的な問題解決の道筋を考えてみましょう。
 
第3回 図111.png
  
図1は、東洋大/統計数理研の渡辺先生のまとめられた「統計的(科学的)問題解決の枠組み」です。
問題解決に寄与する成果となる客観的評価指標Y(KGI)を設定し、Yに関する現状分析(分布)をまず確認しなさいとおっしゃっています。これが時系列グラフに相当します。しかしその先が重要なのです。
Yをコントロールするための要因X(KPI)の探索を行い、XとYの関連性の分析(因果・相関の分析)を行いなさいと。
時系列グラフからでは、Xを正確に決めることは不可能なのです。
 
・設定されたKPIは正しいのでしょうか? 相関と因果性の違い
kotobankによる相関性と因果性の定義を挙げておきます。

相関性:2つの値の関連性のこと。
散布図で調べられる。相関関係の種類に、正の相関、負の相関、無相関がある。x、yという
2つの変数による散布図で、xが増加するとyも増加する傾向にある場合、正の相関関係があり、xが増加しているにもか
かわらずyが減少する傾向にある場合、負の相関関係があるといえる。そのどちらにも当てはまらない場合、無相関であるといえる。
  
第3回 図22.png
  
因果性:原因と結果の関係のこと。
因果関係の把握は、問題解決において重要な思考技術である。
因果関係のパターンは、主に3つある。
1)単純な因果関係(ある原因が先にあって、そこから結果が生まれるパターン。)
2)にわとり-たまごの因果関係(ある原因から発生した結果が、さらにもとの原因を引き起こす原因にもなっているパターン)
3)複雑な因果関係(2と3が複雑に絡み合ったパターン)

 また、「相関関係は因果関係と同じではない。相関関係は因果関係の単なる必要条件の1つである」と言われています。    
  
  
第3回 図33.png

3.時系列分析の意義
  
では、時系列分析は何に使えるのでしょうか? 通常、時系列分析というと時系列のモデリングによる分析をさします。単変数の場合と複数変数(多変量)の場合があります。KGIといくつかのKPI候補となる変数の関係性を調べたいので、今回の場合では、VAR(Vector Auto-regression) モデルの使用が可能です。VARモデルでは2つのことが可能になります。
※ただしVARモデルを適応するには、定常性を持つことが前提です。
  
第3回 図4.png
  
予測:     
変数間の及ぼす影響を1期前、2期前といった時間軸の視点をもって漸化式の形でモデル化し、次期にどうなるのかが予測可能になります。
     
因果性の検定:
VARモデルでは、特定の変数が、他の変数に対して因果性を持つかどうかチェックができます。
グレンジャーの因果性テスト、インパルス応答関数などでチェックが可能です。
  
なんだか、ややこやしそうですが、Rを使うと意外と簡単にできます。
 
4.事例: Facebookページで時系列分析をやってみる

実際に私が管理しているFacebookページ「Web Mining勉強会」を例にご覧にいれましょう。 
Facebookページでは管理者にインサイトといって各指標のデータを視覚化、データのダウンロードのサービスがありますので、それを使ってみましょう。(特に管理用の特別なツールは不要です)
  
 
第3回 図5.png

FBインサイトに設定されている指標は?
指標データをダウンロードしてみると、各指標の時系列推移を観察することができます。グラフをご覧ください。
  
  
第3回 図6.png
 
何を目的(KGI)とするか?それに対する因果性のある指標は?
主要指標となるものから、「新たないいね数(like)」「話題にしている人の数(topic)」「到達した人の数(reach)」「記事投稿数(article)」「口コミリーチ数(viral)」「インプレッション数(imp)」の6変数を見てみたいと思います。
※このFBページでは、一切広告は使っておりません。
このFacebookページの目的として、自分の関心のある情報や意見について、できるだけ多くの人が賛同していただけるとうれしいので、「いいね」か「話題にしてる人数」のどちらかをKGIにしたいと思っておりました。
  
相関性の確認
6つの変数の相関関係について、統計解析のOSS Rを使って相関係数を調べました。
   
   
第3回 図7.png
 
  
VAR(多変量時系列解析)モデルによる因果性を検証(KGI、KPIの設定)
・Rを使用し、下記手順にて分析してみました。
・分析した手順: ①adfテストによる定常性の確認 ⇒②VARモデル作成 ⇒③グレンジャー因果性のテスト
 
・①の結果はすべて定常過程であることが確認できました。 ②について各2変数間で15のモデルを作成。
 ③として各2変数においての因果関係をチェックしました。
 その結果、図8のような変数(指標)間の因果性が確認できました。
 (予測モデルにつきましてはここでは割愛します。)
   
   
第3回 図8.png
   
つまり、2つのKGI候補のうち、「新たないいね数」を増やすための変数はなし。
 「話題にしている人数」については、「投稿記事数」「リーチ数」による因果性。「インプレッション」との間の相互の因果性という3つが確認できました。
また、「リーチ数」と「口コミリーチ」との間にも相互の因果性が見られました。
相関に比べ、かなり絞られています。
 
結論:
私のページ運用意図と、運用側として直接制御できる変数であることから判断して、
KGI: 「話題にしている人数」  KPI: 「投稿記事数」 が適当とします。
   
これはあくまでもこのFacebookページについての分析結果です。「いいね数」「リーチ数」の高いFacebookページであったり、広告出稿を実施したりしている場合は、異なる結果となることもあると思います。
   
   
参考: 投稿内容のコントロールにより、口コミリーチは拡大できるのか?
 
今回因果性を確認できませんでしたが、「口コミリーチ」を記事内容を調整することで、増やすことができれば、「リーチ数」を介して間接的に影響を及ぼすことができるかもしれません。※今後の課題として要検証ですが。
そこで、直近の投稿文をテキストマイニングしてみました。
図9は、「クチコミが10件以上あった投稿」「9件以下であった投稿」のそれぞれに含まれる主な特徴語の違いをグラフにしてみました。
  
 
第3回 図91.png
 
  
 「クチコミ10件以上の投稿」に含まれる特徴語を意識した内容の投稿を意識した場合にクチコミ増、リーチ増、話題にしている人数増につながるのか、検証してみたいです。
  
 
5.まとめ: データ柔術家としての意見

・現状分析(分布)を確認するだけの集計分析から、時系列分析を行うことで、統計的問題解決の枠組みに則ったマーケティング指標の設定のもと、運用改善を行いませんか。

・また時系列モデルによる予測もぜひチャレンジしていただきたいです。VARモデル以外にも多様な時系列モデルがあります。ぜひお試しください。

・今回は、Facebookページの分析でしたが、Webサイト解析についても、使用しているツールに盲従することなく、「統計的問題解決の枠組み」を意識
して様々な視点から分析し、知見による改善を行ってください。

・ご指摘やご質問、お問い合わせお待ちしております。
Facebookの分析以外にも、Webサイト分析、各種データ分析、マーケティングプラン立案などさせていただいております。
ご興味ありましたら、お気軽にご相談ください。お待ちしております。
 
・参照
  ・H23統計数理研究所公開講演会 「21世紀型ソフトスキルとしての統計思考力の育成」
   東洋大学 /統計数理研究所 渡辺美智子教授 講演資料
   http://www.ism.ac.jp/kouenkai/2011/ppt_watanabe.pdf
  
  ・「Do Display Ads Influence Search? Attribution and Dynamics in Online Advertising」(Working Paper)
    Pavel Kireyev, Koen Pauwels, and Sunil Gupta
    http://www.hbs.edu/faculty/Publication%20Files/13-070.pdf
   
  ・「Rによる時系列分析入門」 田中孝文著 シーエーピー出版

  

Copyright© 2017 ITmedia, Inc. All Rights Reserved.

Loading

プロフィール

久野 麻人

久野 麻人

大手広告会社を約15年勤務後、ネットベンチャーを経て現在、日本経済社に契約社員として勤務。リアルのプロモーションからネットプロモーション、統合的なマーケティング戦略までデータマイニングを駆使し、新たなマーケティング・プランニングを追い求めています。クルマ、IT系など他業種の企業のサポートを経験。Facebookで「Web Mining 勉強会」というページもやっています。 またフリーランスのマーケティングコンサルタントとしても活動しておりますので、ぜひご連絡をお待ちしております。

「マーケター通信」購読一覧