Реферальный спам в Google Analytics
В последнее время мы все чаще стали замечать резкое ухудшение канала «Referral» в Google Analytics:
При детальном же изучении, мы видим некие сайты, которые дают нам совершенно нецелевые переходы на сайт:
При попытке перейти на эти сайты, понятное дело, мы не обнаруживаем никаких ссылок на себя, а видим откровенную рекламу или предложение поставить некий скрипт у себя на сайте, чего делать, конечно же, ни в коем случае, не следует!
Мы столкнулись с реферальным спамом (referral spam) — явлением не столько опасным, сколько назойливым. И в этой заметке я покажу, как его легко убрать.
Вообще-то в интернете предлагается масса способов побороть это явление, но вот что поражает больше всего — это абсолютное невежество «экспертов», авторов подавляющей части подобных советов.
Вот пример такой ахинеи, в котором предлагается вычислять спамеров по IP
http://blog.seolib.ru/marketing/master-klass-po-udaleniyu-refspama/
Чтобы понять как бороться со реферальным спамом, нужно четко себе представлять, как работает Google Analytics, с чем обычно бывает туго у таких «экспертов».
Откуда берется реферальный спам
Итак, у Google Analytics есть несколько способов передачи данных. Точнее, способ то один — Measurement Protocol, а вот реализаций у него масса. Важно понимать, что передачу данных в Google Analytics через Measurement Protocol можно выполнить из любого приложения, из любого скрипта. То есть, чтобы зафиксировать, например, посещение страницы на вашем сайте, необязательно заходить к вам на сайт! Достаточно просто сделать обращение к Google Analytics из любой программы, чем и пользуются спамеры. Единственное, что им нужно знать, так это Ваш Google Analytics ID.
Это образная сторона той мощи, которую дает нам Measurement Protocol, и, к сожалению, однозначного решения этой проблемы нет.
Таким образом, важно понимать, что никаких заходов на ваш сайт не было и в помине, спамеры просто записали данные об этих заходах напрямую в Google Analytics. Хотите в этом убедиться? Попробуйте найти заходы на сайт с указанных ресурсов, например, в Метрике. Там их нет! Потому что и заходов не было. Понятно, что все эти дурацкие советы SEOLib с блокировкой спамеров НА ВАШЕМ СЕРВЕРЕ просто не имеют смысла!
Возникает резонный вопрос: а зачем спамеры это делают? Ответ прост: вы увидите неслабый трафик на сайт, перейдете на сайты-источники (якобы источники), где вас будет ждать или реклама услуг для маркетологов/вебмастеров или вредоносный скрипт, который вы добровольно разместите на своем сайте (те самые социальные кнопки). Вот и все.
Как убрать реферальный спам
Несмотря на утверждения «экспертов» SEOLib, есть дополняющих два способа убрать реферальный спам:
- Фильтр Google Analytics
- Расширенный сегмент
Регулярное выражение для реферального спама
Оба способа используют регулярное выражение, которое будет отфильтровывать строку с доменом спамера. Имеет смысл построить его заранее, протестировать и только потом использовать. К тому же, его желательно делать расширяемым на будущее.
Давайте внимательно посмотрим на список спамеров на примере одного из наших сайтов. Очень рекомендую взять временной интервал 2 — 3 месяца.
Мы хорошо видим, что очень часто используются слова «buttons», «-seo», «tracking», «traffic», «4web», «-for» и другие. Здесь просто приведены фрагменты спамерских доменов. Давайте выпишем их в строку регулярного выражения
buttons|-seo|tracking|traffic|4web|-for|monetizer
Попробуйте ввести ее в строку быстрого фильтра и сделайте исключение этих доменов:
Смотрим список внимательно, есть ли там еще спамерские домены? Вроде нет.
Создаем фильтр реферального спама
Перейдите в раздел Администрирования и в колонке аккаунта выберите «Фильтры».
Добавляем новый фильтр на все представления, называя его «Реферальный спам»
Если вы опасаетесь, что фильтр уберет лишний трафик, можно создать отдельное представление, сделать его по умолчанию и поставить фильтр только на него.
Однако фильтр не уберет уже накопленные данные, а лишь в будущем не даст им накапливаться. Чтобы убрать накопленные данные можно сделать сегмент:
Создаем расширенный сегмент «Без реферального спама»
Вообще-то таких сегментов полно в галерее, но мы сделаем свой
Откройте сегменты и нажмите [+Сегмент]. Заполните следующие поля:
Собственно, все.
Теперь осталось только мониторить и если будут появляться новые источники спама, просто добавлять их в регулярное выражение.
Ну и в завершение отмечу, что все эти темы подробно рассматриваются на курсе «Профессиональная Веб-аналитика«, который рекомендуется всем, кто работает с Google Analytics.
Спасибо! :)
А в метрике как это можно настроить?
А зачем? В метрике есть реферальный спам?
Спасибо вам! Единственный грамотный метод на просторах рунета. Подобрал фрагменты спама, все проверил через быстрый фильтр — очищает от мусора. Но вопрос!
При создании фильтра и попытке его проверить — выскакивает сообщение, что «Этот фильтр не изменяет данные». Так и должно быть или в графе «поле фильтра» стоит выбрать иное, отличное от «переход»?
Заранее спасибо, жду ответа.
А он и не должен их изменять. Он их просто отбрасывает.
Но лучше не фильтр сделать, а сегмент.
Понаблюдаю день-другой.
Сегмент сделан, пользуюсь. Но удобнее не получать мусор, чем скрывать его. Вот и задумался о фильтре.
Тогда смело делайте фильтр
Спасибо! Единственная статья, которая ответила на мой вопрос: на одном из моих сайтов счетчик Гугла не работал и единственные переходы в отчете аналитика — это были как раз реферал спамы. Весь Гугл перечитала, пытаясь понять — как? Если счетчика нет на сайте (не успели обратно поставить, после обновления дизайна), а переходы идут…
Подождал пару недель, понаблюдал за статисткой — фильтр работает добротно. Чисто, ура!
Но в свободное время провел эксперимент. Есть 2 поддомена. Код счетчика на одном (UA-цифры-1), а другой (UA-цифры-2). Который оканчивается на двойку — не закидывается спамом. Просто повезло или есть закономерность в работе спамеров?
Особой закономерности не наблюдал.
Добрый день
Несколько дней назад в GA и в Я.Метрика в разделе «Реферальный трафик» появились переходы с сайта на котором нет ссылок на наш сайт.
подскажите как быть с метрикой?
Виктор, если GA и Метрика показывают одни и те же сайты, скорее всего, это не спам, а ссылки реально были.