Google Analyticsの(other)とはなんぞや?

アクセス解析してたら、どうもデータの取れていないページがある事に気づいた。確かに該当のページは他のページと比べてあまり見られてなさそうなページなので、もしかして、はしょられているの?なんて思いながらGoogle Analyticsのそこらへんの仕様について調べてみた。

というのも、データが取れていないのなら取れていないでいいんだけど、こっちとしてはなぜ取れていないのか説明できないとアクセス解析ツールを使う他部署の皆さんが不信感を抱いてしまう。「こんなうさんくさいツール信用できっかよ」なんて事になったら困りものだ。

そうゆことで、最初に目をつけたのがトラッキングコードがおかしくないか。うん、基本ですね。目視でちゃんと正しいトラッキングコードになっていることを確認。てか、テンプレートページに入れてあるので、該当のページだけおかしくなるというのは考えられない。

続いて、HTTPヘッダーでGIFリクエストされていることも確認。GAサーバーに情報は送られているのは確かなようだ。

つまり、情報が送られて表示するまでの間が問題かと思い、次にフィルタに着目。フィルタはほんとうに怖いね。試しに何にもフィルタをかけていないプロファイルを新しく作成し、該当のページにアクセスしてみた。一日後、うん記録されてないね。フィルタが原因ではなかった。

困った。だいぶ困った。そしたらこんなヘルプ記事見つけた。

一日で50,000ページ(または仮想ページ)以上をトラッキングしていませんか? Google AnalyticsはWebサイトの全ての情報を収集し、一日つき50,000ページまでページビューで分類されたレポートを表示します。残りのページはレポート上では (other) という名前のエントリに集約されます。トラフィックの少ないページの詳細なレポートを見るためには、トラフィックの多いページを除くフィルタをかけた新しいプロファイルを作成する必要があります。こうすることで、効果的に残ったページを50,000URLs内に含めておけます。

そんなん知らないよ〜>< 試しに1日分のデータ見たら確かに49,999ページ分しかなかった。

(other)は前々から気になってたけど、こんなところで理解するとは思わなかった。つまり、今回の現象はPV数が少ないページが記録される前に、他のPVの多いページが50,000ページ記録されて、それ以降は(other)にまとめられちゃったから、「上位のコンテンツ」から該当のURLで検索してもひっかからなかったってことね。

ということは、50,000ページ記録される前に該当のページにアクセスすれば記録されるんじゃねと思ったので、日付が変わる12時過ぎにアクセスしたけど、記録されなかった。たぶん、50,000ページのリセットのタイミングが日付と違うのか、それともPV数の多いページから優先的に処理されるのかもね。

ともかく、PV数の少ないページのレポートを見るためにフィルタで細分化されたプロファイルから確認しないといけないって他部署の人には説明すれば良いと言うわけだ、てかその前にそんなトラフィックあるんなら有償ツール使えってことですね…