KOBITブログ
Google Analyticsに新たなリファラルスパム!遂にGoogleも対策を立てるか!?
この記事は約 7分 で読めます。

もう気づいている方も多いと思いますが、新たなリファラルスパムがGoogle Analyticsに発生しています。
Google analyticsの集客セクションでリファラルの項目があると思いますが、その中に訳が分からないものからユーザーが訪問していることはありませんか?それがリファラルスパムです。
リファラルスパムは、実際は誰もサイトに訪問していないのに訪問したことになるので、正確のデータ収集、効果測定の妨害となります。
これまで多くのリファラルスパムが存在しましたが、Googleは具体的な対応をしてきませんでした。ですが、今回Googleは遂にリファラルスパムの駆逐に取り組むという情報が入ってきています。
今確認できる新たなリファラルスパム
今確認されているスパムをまずは上げていきます。
- Source: site-auditor.online, Referral Path: /
- Source: lifehacker.com, Referral Path: /new-revolutionary-shell-from-lifehacker.com
- Source: reddit.com, Referral Path: /r/technology/comments/5e2kcf/heres_a_secret_%C9%A2ooglecom_is_not_googlecom/
- Source: thenextweb.com, Referral Path: /contributors/a-russian-trump-fan-is-celebrating-by-hacking-google-analytics/
- Source: addons.mozilla.com, Referral Path: /en-US/firefox/addon/ilovevitaly/
- Source: fastmail, Referral Path: /help/files/website/html
皆さんがGoogle Analyticsを見ていて、この中に見たことがあるリファラルは存在しますか?やっかいなのは、Sourceにlifehackerなどの有名サイトが含まれている点ですね。
「自分のサイトがlifehackerに!!」と喜んでも、Referral PathのURLに飛んでみると「何これ?」となるわけです。こういった有名サイトのドメインを利用したリファラルスパムは常套手段なので、気をつけたいところです。
あと、リファラルではないのですが、最近では言語分析のセクションで、”Secret.google.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!”が表示されているのをよく見掛けます。このセクションでは、訪問ユーザーが利用している言語の内訳ですからね?「トランプに投票しろ」とか意味不明ですね。
リファラルスパムの目的
「なんでこんな邪魔をする!?」というのが正直な意見だと思います。理由はシンプルです。リファラルは被リンクをもらって、そこからユーザーが訪問するとセッションとしてカウントされます。ですので、新しいリファラルが出現すると皆さん喜んで「どんなサイトなんだろう」とリファラル先を訪問しますよね?
そうなんです。リファラルスパムの目的は、Webアナリストの行動を上手く利用して、自分のサイトへのトラフィックを増やすことなのです。訪問させてどうするか?違法ソフト、悪質ソフトのダウンロードをさせようとします。
たまに、訪問しただけでPCがウイルス感染するケースもありますので、少し変だなと思ったURLがリファラルに表示されていたら、訪問しないことをお勧めします。(特にウイルス対策ソフトをいれていないなら)
どのようにしてリファラルスパムが生まれるか?
実はGoogle Analyticsはリファラルをハッキングしやすいツールと言われています。基本的にリファラルスパムは、アタッカーがbotをあらゆるGoogle Analyticsアカウントに走らせて発生します。
つまり、各Google Analyticsのアカウントさえ分かってしまえば、簡単にリファラルスパムを発生させることができるのです。
そして、Google Analyticsの欠点はそのアカウントにあります。利用している人は知っていると思いますが、アカウント名はUA-12345-1といった形式ですよね?
ハイフンで囲まれた数字がアカウント番号で、2番目のハイフンの後の数字がプロパティ番号になります。Google Analyticsでは1つのアカウントで50のプロパティを持つことができます。
欠点の話に戻りますが、まずGoogle Analyticsのアカウント番号は連番である点です。クレジットカード番号は16桁の数字をランダムで組み合わせたものですから、特定するのは非常に困難です。
しかし、Google Analyticsの場合、作った順でアカウント番号が振り分けられるので、特定し易く、アタッカーが簡単に多くのアカウントにリファラルスパムを送ることができるのです。
たとえ、リファラルスパムが多いからと新しいアカウントを作ったとしても、連番であることから、すぐにリファラルスパムが出現します。
Googleの今後の対応
リファラルスパムはフィルター設定で排除することができます。しかし、設定しても設定しても、新しいURLでリファラルスパムを送り込まれます。切りがないのです。
しかも、1度収集してしまった過去のリファラルスパムデータを自分のアカウントから排除するにも、カスタムセグメントの設定が必要となり、毎度毎度対応するのは時間の無駄となります。
となると、期待したいのがGoogleで対応してもらうことです。今回Googleの1人の社員が、何かしらのソリューションを提供するとTwitter上で述べました。Googelが現在考えているソリューションは以下の3つです。
- 過去データのフィルターをシンプルにする。これは、カスタムセグメント設定のことでしょう。より簡潔にすることで、リファラルスパムを除いたデータ結果を閲覧できるようにするというソリューションです。
- フィルターセットアップをシンプルにする。例えば、「これがリファラルスパムだ」と判明したら1クリックでフィルターに送り込めるとかなら、結構な時間の削減に繋がります。
- 解読し辛い複雑なGoogle Analyticsコードを発行する。これが一番良いかもしれません。先にも述べた様に、Google Analyticsのアカウント番号は連番で、簡単に特定できることが問題です。これをクレジットカード番号のような振り分けなら、リファラルスパムの出現は格段に減ると思います。
まとめ
月間数百、数千万のアクセスがあるメディアにとっては、リファラルスパムのデータは微々たるものなので、痛くも痒くもないと思います。
ですが、月間数千、数万ぐらいの小規模のサイトでは、データ分析の大きな妨害となります。フィルター設定は非常に手間ですし、設定しても新たなスパムが来るので切りがありません。
なんとかGoogleには、上記で述べた3つのソリューション、特に3番目のソリューションを利用して対応してもらいたいものです。
参照:Marketing Land, New wave of referrer spam wrecking Google Analytics data


すぐに始められます。