前回では、応用KPI分析の準備としてコンバージョンテーブルを作成するところまでを紹介しました。今回はこのコンバージョンテーブルを使って、実際に応用KPI分析を実行していきます。
コンバージョンパスに着目した応用KPI分析
まず、Webサイト全体のコンバージョン回数とパスの平均パス長、平均コンバージョン時間を算出します。一般に平均パス長とコンバージョン時間は、値が小さいほどコンバージョンへの効率が良いものと判断できます。
結果例
2015年1月には5053回のコンバージョン(サインアップ)がありました。また、平均的に1047回のページ遷移の末にコンバージョンしました。コンバージョンまでに平均的に66692秒(=18時間)の時間を要しました。
cnt | avg_path_length | avg_conversion_time |
5053 | 1047.1803 | 66692.8858 |
コンバージョンパス長の分布
先ほどは「平均」パス長さを求めましたが、パスの長さを「分布」として見る事でさらに多くの情報を得ることが可能です。
可視化してみると、平均パス長では1000という大きな値を出しましたが、実際には100以下のパス長さのものが多いことが分布よりわかります。
コンバージョン時間の分布
同様にコンバージョン時間の分布も見てみましょう。
コンバージョン時間もパス長と同じように、大きな平均値とは反して10時間までの値(特に10時間以内が3000件以上!)が多く分布していることがわかります。
コンバージョン率(全体)
非コンバージョンを保持していましたので、コンバージョン率の算出が可能です。
コンバージョン率は9%と、なかなか良い数字を出していることがわかります。
cv_cnt | uncv_cnt | cv_ratio |
5359 | 46500 | 0.10333 |
パス類型
さて今まで全体のコンバージョンパスを見ていましたが、ここではパスを類別して、それぞれの特徴を持つパスでのコンバージョン率を見ていくことも可能です。たとえば下記のようなシチュエーションごとに集計することで、パスを元にしたユーザの動向を分析することが可能です。
スルーコンバージョン
自社のコンバージョンにつながりそうなページを取り上げて、そのページを通って(スルーして)コンバージョンした率を見てみます。ここでは、"case-studies"(=事例紹介)のページを通ってから、サインアップしたユーザの割合を見てみます。
こうしてみると、事例紹介のページを見たユーザのユーザのコンバージョン率は90%にも及びます。
cv_cnt | uncv_cnt | cv_ratio |
3338 | 303 | 0.91678 |
ランディングコンバージョン
ランディングページは、企業にとってユーザが到達する最初のページです。たとえば、プレスリリースが挙げられます。プレスリリースは、自社ページや一般的なメディアなどに大きく掲載すべき重要なニュースです。プレスリリースを見てサイトを訪れてサインアップしてくれる人が多いことがわかれば、今後掲載するメディアを増やしたり、よりいっそうの活用を考えていけることになります。
cv_cnt | uncv_cnt | cv_ratio |
176 | 0 | 1.00000 |
この結果は非常に有意義で、press-releases からサイトに入って来た人はもれなくサインアップしてくれていることがわかります。
直前コンバージョン
コンバージョンの直前のページは、コンバージョンパスの中でも最も影響度の高いノードと見なすことができ、他のものよりも重要な指標になるかもしれません。
last_node | cnt |
/treasuredata.com/jp/home | 3379 |
/treasuredata.com/en/home | 1405 |
/treasuredata.com/jp/products | 98 |
/treasuredata.com/en/press-releases | 34 |
/treasuredata.com/en/learn | 33 |
基本/応用KPI分析まとめ
第6回から3回に渡って、SQLを使ったデータ分析を進めてきました。SQLだけでもWebページ全体を表す指標を収集する基本KPI分析やユーザのパスに着目した応用KPI分析など、さまざまな分析を行うことができたかと思います。こうしたユーザの行動に着目した分析では、データ量が膨大になり、通常のRDBでは難しい処理が多々あります。しかし、連載の第1回で紹介したビッグデータ分析エンジンを使うことによってより手軽に応用KPI分析を進めることができるようになります。
さらに、こうした集計処理を自動化し、実運用していくためには、データ収集やデータ集計を定期的に更新していくためのツールが重要となります。
次回は、そのためワークフロー管理ツールについて紹介していきます。