平均値と中央値

 慎重な吟味を要するアクセス解析のときには、
 平均値を鵜呑みにしてはイケマセン。

 例えば、次のようなセッションがあったとします。

 セッション サイト滞在時間
   1       5分
   2       5分
   3       2分
   4       2分
   5       1分

 平均サイト滞在時間は、(5+5+2+2+1)÷5セッション=3分です。
 しかし、この3分は全体を表しているでしょうか?

Google Analytics のサイト滞在時間の例

 グラフにしてみるとよくわかります。
 上位2セッションが、平均を押し上げていることがわかります。

 そういうときには、中央値を使うと便利です。

 中央値 – Wikipedia

 簡単に言ってしまうと、データを小さい順に並べたときの中央に位置する値です。
 この例ですと、3番目のセッションの時間です。つまり2分
 「真ん中の人は2分サイトを見ている」と聞くと、「平均3分」と言われたときよりも、印象が変わりますよね。

 残念ながらGoogle Analytics では中央値は、表示されませんので、

Google Analytics では中央値は表示されないが、並べ替えである程度はわかる

 上図のように、平均サイト滞在時間は約10分となっていても、
 サイト滞在時間で並べ替える(項目名をクリック)と、
 上位の2つのセッション郡が平均を押し上げていることがわかります。

 さらに、CSV形式などデータをエクスポートしてExcelなどで分析すれば、
 慎重な吟味が出来るでしょう。

 平均値と中央値、ぜひ活用してみて下さい。