
Реферальный спам в Google Analytics
В последнее время мы все чаще стали замечать резкое ухудшение канала “Referral” в Google Analytics:
При детальном же изучении, мы видим некие сайты, которые дают нам совершенно нецелевые переходы на сайт:
При попытке перейти на эти сайты, понятное дело, мы не обнаруживаем никаких ссылок на себя, а видим откровенную рекламу или предложение поставить некий скрипт у себя на сайте, чего делать, конечно же, ни в коем случае, не следует!
Мы столкнулись с реферальным спамом (referral spam) – явлением не столько опасным, сколько назойливым. И в этой заметке я покажу, как его легко убрать.
Вообще-то в интернете предлагается масса способов побороть это явление, но вот что поражает больше всего — это абсолютное невежество “экспертов”, авторов подавляющей части подобных советов.
Вот пример такой ахинеи, в котором предлагается вычислять спамеров по IP
http://blog.seolib.ru/marketing/master-klass-po-udaleniyu-refspama/
Чтобы понять как бороться со реферальным спамом, нужно четко себе представлять, как работает Google Analytics, с чем обычно бывает туго у таких “экспертов”.
Откуда берется реферальный спам
Итак, у Google Analytics есть несколько способов передачи данных. Точнее, способ то один – Measurement Protocol, а вот реализаций у него масса. Важно понимать, что передачу данных в Google Analytics через Measurement Protocol можно выполнить из любого приложения, из любого скрипта. То есть, чтобы зафиксировать, например, посещение страницы на вашем сайте, необязательно заходить к вам на сайт! Достаточно просто сделать обращение к Google Analytics из любой программы, чем и пользуются спамеры. Единственное, что им нужно знать, так это Ваш Google Analytics ID.
Это образная сторона той мощи, которую дает нам Measurement Protocol, и, к сожалению, однозначного решения этой проблемы нет.
Таким образом, важно понимать, что никаких заходов на ваш сайт не было и в помине, спамеры просто записали данные об этих заходах напрямую в Google Analytics. Хотите в этом убедиться? Попробуйте найти заходы на сайт с указанных ресурсов, например, в Метрике. Там их нет! Потому что и заходов не было. Понятно, что все эти дурацкие советы SEOLib с блокировкой спамеров НА ВАШЕМ СЕРВЕРЕ просто не имеют смысла!
Возникает резонный вопрос: а зачем спамеры это делают? Ответ прост: вы увидите неслабый трафик на сайт, перейдете на сайты-источники (якобы источники), где вас будет ждать или реклама услуг для маркетологов/вебмастеров или вредоносный скрипт, который вы добровольно разместите на своем сайте (те самые социальные кнопки). Вот и все.
Как убрать реферальный спам
Несмотря на утверждения “экспертов” SEOLib, есть дополняющих два способа убрать реферальный спам:
- Фильтр Google Analytics
- Расширенный сегмент
Регулярное выражение для реферального спама
Оба способа используют регулярное выражение, которое будет отфильтровывать строку с доменом спамера. Имеет смысл построить его заранее, протестировать и только потом использовать. К тому же, его желательно делать расширяемым на будущее.
Давайте внимательно посмотрим на список спамеров на примере одного из наших сайтов. Очень рекомендую взять временной интервал 2 – 3 месяца.
Мы хорошо видим, что очень часто используются слова “buttons”, “-seo”, “tracking”, “traffic”, “4web”, “-for” и другие. Здесь просто приведены фрагменты спамерских доменов. Давайте выпишем их в строку регулярного выражения
buttons|-seo|tracking|traffic|4web|-for|monetizer
Попробуйте ввести ее в строку быстрого фильтра и сделайте исключение этих доменов:
Смотрим список внимательно, есть ли там еще спамерские домены? Вроде нет.
Создаем фильтр реферального спама
Перейдите в раздел Администрирования и в колонке аккаунта выберите “Фильтры”.
Добавляем новый фильтр на все представления, называя его “Реферальный спам”
Если вы опасаетесь, что фильтр уберет лишний трафик, можно создать отдельное представление, сделать его по умолчанию и поставить фильтр только на него.
Однако фильтр не уберет уже накопленные данные, а лишь в будущем не даст им накапливаться. Чтобы убрать накопленные данные можно сделать сегмент:
Создаем расширенный сегмент “Без реферального спама”
Вообще-то таких сегментов полно в галерее, но мы сделаем свой
Откройте сегменты и нажмите [+Сегмент]. Заполните следующие поля:
Собственно, все.
Теперь осталось только мониторить и если будут появляться новые источники спама, просто добавлять их в регулярное выражение.
Ну и в завершение отмечу, что все эти темы подробно рассматриваются на курсе “Профессиональная Веб-аналитика“, который рекомендуется всем, кто работает с Google Analytics.
Спасибо! :)
А в метрике как это можно настроить?
А зачем? В метрике есть реферальный спам?
Спасибо вам! Единственный грамотный метод на просторах рунета. Подобрал фрагменты спама, все проверил через быстрый фильтр – очищает от мусора. Но вопрос!
При создании фильтра и попытке его проверить – выскакивает сообщение, что “Этот фильтр не изменяет данные”. Так и должно быть или в графе “поле фильтра” стоит выбрать иное, отличное от “переход”?
Заранее спасибо, жду ответа.
А он и не должен их изменять. Он их просто отбрасывает.
Но лучше не фильтр сделать, а сегмент.
Понаблюдаю день-другой.
Сегмент сделан, пользуюсь. Но удобнее не получать мусор, чем скрывать его. Вот и задумался о фильтре.
Тогда смело делайте фильтр
Спасибо! Единственная статья, которая ответила на мой вопрос: на одном из моих сайтов счетчик Гугла не работал и единственные переходы в отчете аналитика – это были как раз реферал спамы. Весь Гугл перечитала, пытаясь понять – как? Если счетчика нет на сайте (не успели обратно поставить, после обновления дизайна), а переходы идут…
Подождал пару недель, понаблюдал за статисткой – фильтр работает добротно. Чисто, ура!
Но в свободное время провел эксперимент. Есть 2 поддомена. Код счетчика на одном (UA-цифры-1), а другой (UA-цифры-2). Который оканчивается на двойку – не закидывается спамом. Просто повезло или есть закономерность в работе спамеров?
Особой закономерности не наблюдал.
Добрый день
Несколько дней назад в GA и в Я.Метрика в разделе “Реферальный трафик” появились переходы с сайта на котором нет ссылок на наш сайт.
подскажите как быть с метрикой?
Виктор, если GA и Метрика показывают одни и те же сайты, скорее всего, это не спам, а ссылки реально были.