らくがき

「のほほん」ってローマ字で書いたら、後ろから読んでも「のほほん」になることに気付いた時の感動といったら。

データ分析の考え方をちょっとばかり。

 

こんにちは、とみたです。

先日ねーやんにお誘い頂き、某勉強会に参加してきました!

ameblo.jp

 

テーマはデータ分析についてで、ちょっとだけ自分がお話しする機会もあったんですが、当日の経験も踏まえて、データ分析における考え方の部分を書いてみます。


今回は体系化できてる話ばかりじゃなくて、考えてることをつらつら書き並べるだけなので、「らくがき」として気軽に流し読みしてくださいませ。


データは比較で見ている

これは普段無意識でやっている人も多いと思うんですが、ある数字がいいか悪いかっていうのは、比較することで判断できるものだと考えています。


例えば、『直帰率60%』という数字が出ていたとして、これだけでよいか悪いかを判断するのって、意外と難しいです。

どうすれば判断できるかというと、他のデータと並べて見て、「直帰率が70%よりはいい」と“比較”することで、よいか悪いかの説明ができます。


ただ、それにも少々問題があって、1つは“他のデータ”をどうやって得るのかということ。

経験から来る目安が頭の中にあればいいですが、それを最初から持ってる人はいません。
できるとすれば、自分のサイトの同じ性質のページ同士を比較して、あるページが直帰率50%なのにあるページは80%なら、改善できる可能性を考えられそうです。


それでも、“同じ性質の”というのがまた曲者で、『直帰率50%』というのもまた、流入経路の性質やそれに対するページの役割など、いくつかの条件が組み合わさって、数字として表れます。

条件が違えば数字が違うのも当然で、であれば、数字が違って当然な条件は省いたデータを用意したいものの、サイト運営ではさまざまなやり方があるので、その条件をそろえることがまた難しいのです。。


ちなみにですが、Google Analyticsにはベンチマークという機能があって、自分のデータもそのベンチマーク(参考基準)にされることに同意すれば、他のサイトの平均値を見ることができます。

 

f:id:sptomy:20160616163827p:plain

 

これはとある業種で直帰率を比較したところなのですが、ベンチマーク直帰率が58.53%(薄い青)に対してうちが76.35%(青)と、結構な大差で悪いです(苦笑)

悪いんですが、業種の分類もそこまで細かくないですし、そもそもアフィリエイトサイトだけじゃないなど条件が違うので、本当に参考(目標)にできるデータを得るのは難しいなぁ、と感じます。

 

ちょっと回りくどい説明になりましたが、例えるなら、50メートル走が遅いか早いかを判断できるのは比較するデータがあるからで、その時にも性別や年齢別に比較するように、条件はそろえないと、有効な判断できないということですね。

 

時間軸での比較なら難しくない

このように、ある数字がよいのか悪いのかを判断するのって意外と難しく、僕もどこまでよくすればいいのかって分かってません。。

ただ、何かの施策をした結果、数字がよくなったのなら、それは評価してもいいはずです。


さきほどの50メートル走の例えで言うと、スタートをクラウチングスタートに変えたら、7.0秒から6.5秒になったとか。

7.0秒が早いか遅いかはよく分からなくても、0.5秒数字が縮まったという事実は、施策が成功したと判断できます。

ですから、僕の場合はある施策を行う前の数字を取っておいて、施策後にどうなったかと比較して、よくなるようよくなるよう1つずつ試しています。


その際に気を付けているのは、複数の施策を一度に試してしまうと、原因と結果の関係性が分かりにくくなります。

クラウチングスタートに変えて、シューズも変えて、フォームも変えた結果、仮に遅くなった場合、もしかするとスタートもシューズの変更もよかったけど、フォームが崩れたことで数字が落ちたのだとしても、前2つの施策までダメと判断してしまうかもしれません。

これは改善する期待がどれだけ持てるかにもよるのですが、施策と効果の関係が分かる程度には丁寧に試した方が、判断がかんたんです。


また、スタートから15mまでと、15メートル以降の秒数を細かく計測しておけば、スタートとフォームの変更、それぞれの効果が判断できるかもしれません。

このように、データの方もまた、細かく見るほどその裏で何が起こっているかが特定しやすくなるので、スマートにパッパと見れたらカッコいいんですが、僕は泥臭く細かい分析をやっています。

もっと上手くなりたい(´・ω・`)


ではどこから手を付けようか?

本来であれば、データ分析によって問題点を発見して、それを改善するのがイメージしやすい流れです。

 

直帰率70%は高い
 ↓
じゃあイラストを取り入れてみよう
 ↓
直帰率が65%になった!
 ↓
今度はページの重さを改善しよう
 ↓
直帰率が60%になった!
 ↓
さらにコピーや中見出しをキャッチにしよう
 ↓
直帰率55%まで下がった!

 

例えばこんな感じで。


なんですが、これはスタートに「直帰率が70%は高い」という判断があり、その判断自体が難しいわけです。
そもそも直帰率が50%という基準があったとしても、それがベストという根拠もありません。

なので今のところ僕は、現在の数字が最善とは考えず、可能な限りよくしていこうと考えてやっています。


逆に、試してみたいアイディアとか仮説があって、「それをやれば何が改善するのかを数字で考える」という流れでやることもあります。

そのために、TLで公開されているサイトを見たり、ブログを読んでヒントを得たり、時には昔買った情報商材を読み返してみたりして、1つ1つ試しながら判断しています。


もちろん、まったくもって行き当たりばったりというわけでもなく、よく見かける次のような式を頭において、それぞれの数字を少しでもよくするような感じです。

 

売上=アクセス数×アクセスの質×クリック率×成約率×単価
※「アクセスの質」は100%から減点式で評価

・アクセスの数…検索アクセスの数やページ遷移数、人によっては広告なども
・アクセスの質…離脱率、直帰率、滞在時間、検索クエリの質
・クリック率…広告のクリック率
・成約率…クリック数に対する成約数、一人当たりの成約数も
・単価…広告単価、承認率


何を優先するかは運営方針とかやり方にもよるところなので、上手く説明するのが難しいのですが、まとまったらまた紹介してみます。


データ分析は施策の良し悪しを測るために

こんな感じで、データ分析といっても何かやり方を確立しているわけではなくて、主に施策してよかったのかどうかを判断するために、その時必要なデータを、やり方を調べつつ取っています。

今は参考になるサイトがいっぱい出てますし、情報もたくさんあります。
ただ、いっぱいあり過ぎて何がいいのか判断できなかったりするので、得たアイディア(施策)とデータを先に紐づけておいて、変化を見るところからやってみるでも十分だと思います。

そのアイディアの部分が僕は弱いので、皆さまツイート&ブログ更新、お待ちしてます( ´ ▽ ` )ノ


ではでは!