Реферальный спам в Google Analytics

Иван Никитин и партнерыНовостиGoogleGoogle AnalyticsРеферальный спам в Google Analytics

В последнее время мы все чаще стали замечать резкое ухудшение канала “Referral” в Google Analytics:

Канал referral

При детальном же изучении, мы видим некие сайты, которые дают нам совершенно нецелевые переходы на сайт:

Домены реферальный спам

При попытке перейти на эти сайты, понятное дело, мы не обнаруживаем никаких ссылок на себя, а видим откровенную рекламу или предложение поставить некий скрипт у себя на сайте, чего делать, конечно же, ни в коем случае, не следует!

Мы столкнулись с реферальным спамом (referral spam) – явлением не столько опасным, сколько назойливым. И в этой заметке я покажу, как его легко убрать.

Вообще-то в интернете предлагается масса способов побороть это явление, но вот что поражает больше всего — это абсолютное невежество “экспертов”, авторов подавляющей части подобных советов.

Вот пример такой ахинеи, в котором предлагается вычислять спамеров по IP
http://blog.seolib.ru/marketing/master-klass-po-udaleniyu-refspama/

Я тебя вычислю по IP

Чтобы понять как бороться со реферальным спамом, нужно четко себе представлять, как работает Google Analytics, с чем обычно бывает туго у таких “экспертов”.

Откуда берется реферальный спам

Итак, у Google Analytics есть несколько способов передачи данных. Точнее, способ то один – Measurement Protocol, а вот реализаций у него масса. Важно понимать, что передачу данных в Google Analytics через Measurement Protocol можно выполнить из любого приложения, из любого скрипта. То есть, чтобы зафиксировать, например, посещение страницы на вашем сайте, необязательно заходить к вам на сайт! Достаточно просто сделать обращение к Google Analytics из любой программы, чем и пользуются спамеры. Единственное, что им нужно знать, так это Ваш Google Analytics ID.
Это образная сторона той мощи, которую дает нам Measurement Protocol, и, к сожалению, однозначного решения этой проблемы нет.

Таким образом, важно понимать, что никаких заходов на ваш сайт не было и в помине, спамеры просто записали данные об этих заходах напрямую в Google Analytics. Хотите в этом убедиться? Попробуйте найти заходы на сайт с указанных ресурсов, например, в Метрике. Там их нет! Потому что и заходов не было. Понятно, что все эти дурацкие советы SEOLib с блокировкой спамеров НА ВАШЕМ СЕРВЕРЕ просто не имеют смысла!

Рефералы в Метрике

Возникает резонный вопрос: а зачем спамеры это делают? Ответ прост: вы увидите неслабый трафик на сайт, перейдете на сайты-источники (якобы источники), где вас будет ждать или реклама услуг для маркетологов/вебмастеров или вредоносный скрипт, который вы добровольно разместите на своем сайте (те самые социальные кнопки). Вот и все.

Как убрать реферальный спам

Несмотря на утверждения “экспертов” SEOLib, есть дополняющих два способа убрать реферальный спам:

  • Фильтр Google Analytics
  • Расширенный сегмент

Регулярное выражение для реферального спама

Оба способа используют регулярное выражение, которое будет отфильтровывать строку с доменом спамера. Имеет смысл построить его заранее, протестировать и только потом использовать. К тому же, его желательно делать расширяемым на будущее.

Давайте внимательно посмотрим на список спамеров на примере одного из наших сайтов. Очень рекомендую взять временной интервал 2 – 3 месяца.

Домены спамеров

Мы хорошо видим, что очень часто используются слова “buttons”, “-seo”, “tracking”, “traffic”, “4web”, “-for” и другие. Здесь просто приведены фрагменты спамерских доменов. Давайте выпишем их в строку регулярного выражения

buttons|-seo|tracking|traffic|4web|-for|monetizer

Попробуйте ввести ее в строку быстрого фильтра и сделайте исключение этих доменов:

Фильтр по источнику
Исключение источников

Смотрим список внимательно, есть ли там еще спамерские домены? Вроде нет.

Создаем фильтр реферального спама

Перейдите в раздел Администрирования и в колонке аккаунта выберите “Фильтры”.
Добавляем новый фильтр на все представления, называя его “Реферальный спам”

Фильтр реферального спама

Если вы опасаетесь, что фильтр уберет лишний трафик, можно создать отдельное представление, сделать его по умолчанию и поставить фильтр только на него.

Однако фильтр не уберет уже накопленные данные, а лишь в будущем не даст им накапливаться. Чтобы убрать накопленные данные можно сделать сегмент:

Создаем расширенный сегмент “Без реферального спама”

Вообще-то таких сегментов полно в галерее, но мы сделаем свой

Сегмент фильтрации спама в галерее

Откройте сегменты и нажмите [+Сегмент]. Заполните следующие поля:

Расширенный сегмент Без реферального спама

Собственно, все.

Теперь осталось только мониторить и если будут появляться новые источники спама, просто добавлять их в регулярное выражение.

Ну и в завершение отмечу, что все эти темы подробно рассматриваются на курсе “Профессиональная Веб-аналитика“, который рекомендуется всем, кто работает с Google Analytics.

комментариев 12

  1. Спасибо вам! Единственный грамотный метод на просторах рунета. Подобрал фрагменты спама, все проверил через быстрый фильтр – очищает от мусора. Но вопрос!
    При создании фильтра и попытке его проверить – выскакивает сообщение, что “Этот фильтр не изменяет данные”. Так и должно быть или в графе “поле фильтра” стоит выбрать иное, отличное от “переход”?
    Заранее спасибо, жду ответа.

    • А он и не должен их изменять. Он их просто отбрасывает.
      Но лучше не фильтр сделать, а сегмент.

      • Понаблюдаю день-другой.
        Сегмент сделан, пользуюсь. Но удобнее не получать мусор, чем скрывать его. Вот и задумался о фильтре.

  2. Спасибо! Единственная статья, которая ответила на мой вопрос: на одном из моих сайтов счетчик Гугла не работал и единственные переходы в отчете аналитика – это были как раз реферал спамы. Весь Гугл перечитала, пытаясь понять – как? Если счетчика нет на сайте (не успели обратно поставить, после обновления дизайна), а переходы идут…

  3. Подождал пару недель, понаблюдал за статисткой – фильтр работает добротно. Чисто, ура!
    Но в свободное время провел эксперимент. Есть 2 поддомена. Код счетчика на одном (UA-цифры-1), а другой (UA-цифры-2). Который оканчивается на двойку – не закидывается спамом. Просто повезло или есть закономерность в работе спамеров?

  4. Добрый день

    Несколько дней назад в GA и в Я.Метрика в разделе “Реферальный трафик” появились переходы с сайта на котором нет ссылок на наш сайт.

    подскажите как быть с метрикой?

  5. Виктор, если GA и Метрика показывают одни и те же сайты, скорее всего, это не спам, а ссылки реально были.

Добавить комментарий