2015年に入ってから急増しているgoogle analytics(グーグルアナリティクス)のリファラスパム。正確なトラッキング情報が欲しいのに、関係がないログが残ってしまうのでデータ解析の邪魔でしかないこのリファラスパム達を撲滅する対策方法の設定をご紹介します。
目次
そもそもリファラスパムとは
ご存知の方も多いと思いますが、google analyticsでは、集客の経路として
- 「Organic Search(オーガニックサーチ)」=自然検索
- 「Referral(リファラル)」=他サイトからのリンクなど
- 「Direcr(ダイレクト)」=URLを直接入力して来た人
- 「Social(ソーシャル)」=facebookやtwitter、はてぶなどが該当
- 「Paid Search(ペイドサーチ)」=google adwords
- 「Display(ディスプレイ)」=GDNなどのディスプレイ広告
の大きく6種類が存在します。
リファラスパムは上記のうち、「Referral(リファラル)」について本来トラッキングされるべきではないデータを紛れ込ませてくるスパムになります。
具体的なgoogle analyticsのレコードは以下以下のようになります。この中だと、
- o-o-6-o-o.com
- semalt.semalt.com
- humanorightswatch.org
- buttons-for-website.com
- bestwebsitesawards.com
- prs.is
がリファラスパムになります。
他にも
- addons.mozilla.org
- best-seo-offer.com
- best-seo-solution.com
- buttons-for-your-website.com
- buy-cheap-online.info
- forum.topic57402580.darodar.com
- free-share-buttons.com
- editors.choice57402580.hulfingtonpost.com
- googlsucks.com
- pornhub-forum.ga
- rapidgator-porn.ga
- s.click.aliexpress.com
- simple-share-buttons.com
- site12.simple-share-buttons.com
- site13.simple-share-buttons.com
- site18.simple-share-buttons.com
- site30.simple-share-buttons.com
- site38.simple-share-buttons.com
- theguardlan.com
- www.Get-Free-Traffic-Now.com
などもリファラのログが残っていました。(随時追記)
厄介なのは、リファラスパムがいろんなKPIをかき乱す点です。直帰率や平均セッション時間などが通常の人がサイトに訪れた時と大幅に異なるため、じっくり見られている記事や回遊度が高い記事のデータ分析をしようと思った場合に不確かなデータとなってしまう問題点があります。
google analyticsの「ユーザー > 地域 > 地域」からリファラスパムのデータを確認してみると、ありとあらゆる国からのログが。。。細かくチェックしていませんが、これほとんどリファラスパムの影響です。スパムのIPアドレスを調べてみると「78.110.60.230」「217.23.8.124」「217.23.7.144」「78.110.60.230」となっていましたが、スパムはIPアドレスを制限しても止まりませんのでご注意ください。
リファラスパムの目的(の推測)とスパムサイトに飛ぶとどうなるか
google analyticsで自分のブログに来た人をチェックしていて、見た事がないドメインからの流入があると、どんなサイトだろうと気になって、ドメインを調べる事があると思います。リファラスパムの目的は、おそらくアクセスを集めたいサイトが、気になってURLを入力してドメインを調べようと思った人を引っ掛けるためにいろんなサイトにログを残すスパムだと推測されます。
そこで、実際にリファラスパムのドメインをチェックしてみました。今回チェックしたのは「o-o-6-o-o.com」「semalt.semalt.com」「humanorightswatch.org」の3つです。
o-o-6-o-o.com
検索窓が斜めになっているところがオシャレポイントの素敵なスパムサイトが出てきました。背景の水上コテージと爽やかな海を見ているとスパムサイトであることを忘れそうです。これをきっかけに僕も斜め上を行くサイトデザインを目指そうと心に決めました。
semalt.semalt.com
こちらはサブドメインとメインのドメインが同じなところがオシャレポイントですね。入力してみると、semalt.comというSEOチェックツールみたいなサイトに飛びました。URLを入力するだけのシンプルなUIがCTR(クリックスルーレート)を高めているポイントの素敵なサイトで、SEOに困っている僕は思わずURLを入力してみたくなるサイトでした。
humanorightswatch.org
ひゅーまのらいつうぉっち、で読み方あってますか?クリックするとリダイレクトで
1 |
http://activities.aliexpress.com/bestselling-products.php?aff_platform=aaf&sk=fEM7Qfy7I%3A&cpt=1425822131854 |
のURLのECサイトに遷移しました。
1 |
aff_platform=aaf&sk=fEM7Qfy7I%3A&cpt=1425822131854 |
こちらがパラメータのようで、何かされていそうで気持ち悪いですね。
リファラスパムをgoogle analyticsから除外する方法
という冗談はさておき、肝心のリファラスパムをgoogle analyticsから除外する方法を説明します。
設定場所
「アナリティクス設定 > ビュー > フィルタ」を選択する。
「新しいフィルタ」を選択
「新しいフィルタを作成」を選択し、情報を入力していきます。「フィルタ名」はわかりやすい名前であれば何でもかまいません。「フィルタの種類」を「カスタム」に、「除外」を選択し、「フィルタパターン」にリファラスパムのドメインを指定します。あとは保存ボタンを押すだけ。
これだけで綺麗さっぱり指定したドメインがgoogle analyticsのデータから消えますが、注意点としてはgoogle analyticsは過去のデータは消せないので、設定した直後からのデータにしかフィルターの設定は反映されないことを頭に入れておきましょう。また、この手法だと、都度設定をする必要があるので、まとめて一度に設定することはできません。今のところまとめて除外設定する方法はないみたいです。
上記の設定で除外できないリファラスパムが登場しました。対象は、「free-share-buttons.com」です。対策は以下の設定が必要です。
www.Get-Free-Traffic-Now.comを除外する追加設定
更に、上記の設定を追加しても除外できないリファラスパムが存在します。対象は「www.Get-Free-Traffic-Now.com」です。以下の設定を追加しましょう。
Organicにもリファラスパムが・・・
上記設定できれいになったかと思いきや、2015年4月28日時点でなんとorganicにもリファラスパムが。。。こちらは国コードがロシアを除外する設定で今のところ除外することができます。
リファラスパムの除外設定をした結果
2015年3月の本日時点で、僕のサイトではきれいさっぱりいなくなりました!国別で見るとロシアからのアクセスもゼロに。意味不明に並んでいた世界中からのアクセスもなくなって、アクセスログが正常になりました。
(4月27日追記)free-share-buttons.comとwww.Get-Free-Traffic-Now.comは最初に提示した対策だと完全にスパムをなくすことができなかったので対策方法を追記しました。本来はセットされる言語設定やブラウザの設定がリファラスパムだと(not set)になる現象を利用した対策方法です。
google公式のボット除外機能
ボットやクローラーなどのトラフィックやアクセスを除外する機能がこちらから設定できますが、上記の方法の前に試しにやってみたところ、全てのリファラスパムを除外することはできませんでした。おそらくgoogleに登録されているものをフィルタリングしているはずなので、新規のボットの対応はしばらく時間がかかるものと思われますが、ゴミトラフィックを拾わないためにもここは設定しておきましょう。
リファラスパムの一覧
naverまとめにリファラスパムの一覧が記載されていたので参考までに引用しておきます。全て設定する必要はなく、あくまでもご自身のアナリティクスに来ているリファラスパムのみ個別に都度対応すれば良いと思います。
※ウィルスに感染する可能性もありますので、以下のURLにアクセスする場合は自己責任でお願いします。
7makemoneyonline.com
7secretsearch.com
adsensewatchdog.com
aliexpress.com
blackhatworth.com
buttons-for-website.com
cenoval.ru
darodar.com
econom.co
econom.com
etc.com
filmhill.com
hulfingtonpost.com
ilovevitaly.co
ilovevitaly.com
ilovevitaly.ru
iskalko.ru
kallery.net
ourmeets.com
priceg.com
r-e-f-e-r-e-r.com
savetubevideo.com
semalt.com
star61.de
textelle.ee
ticimax.com
topblogstories.com
uglystat.com
vampirestat.com
villainstat.com
waterfallscanopy.com
windstream.net
zombiestat.com出典:naverまとめ