Как исключить спам в Google ***ytics, или Кто портит ваши данные > NetPeak - Независимость и осознанность
NetPeak Biz Tech    


Как исключить спам в Google ***ytics, или Кто портит ваши данные

Как исключить спам в Google ***ytics, или Кто портит ваши данные

< >

Что делать, если вы столкнулись со спамом в отчетах Google ***ytics? Значит ли это, что кто-то имеет доступ к вашему аккаунту, или что кто-то специально влияет на данные сайта в GA? Как они это делают? И как исключить подобные данные из отчетов?

Когда в источниках реферального трафика появляются нетематические ресурсы, или когда вы открываете «Поведение → События → Обзор», и видите событие, которое точно не настраивали самостоятельно, самое время разобраться, в чем же тут дело. Спам в событиях от event-tracking.com

Зачем спамить в Google ***ytics?

Google ***ytics — самый популярный инструмент веб-аналитики, его используют миллионы пользователей. Спамеры рассчитывают на переходы любопытных владельцев сайтов, а что уже делать с этими переходами — монетизировать через баннеры, перенаправлять в магазин или использовать любым другим способом — каждый решает сам. Даже если принять процент любопытства за 10%, в соотношении с миллионами пользователей Google ***ytics это получится значительная цифра.

Как они это делают? Метод спама Google ***ytics #1: Ghost spam

Ghost spam (спам-призpaк) называется призpaком, потому что отправляет данные в GA без взаимодействия с сайтом напрямую.

Как же данные попадают в Google ***ytics? GA использует протокол для передачи данных — Measurement Protocol, который позволяет разработчикам отправлять данные напрямую на сервера Google ***ytics. Measurement Protocol сам по себе — хорошая вещь, он позволяет использовать возможности Google ***ytics для сбора данных пpaктически из любой среды. Таким образом, становится возможным использовать инструменты аналитики GA, к примеру, в сети магазинов розничной торговли. Данные по продажам или любым другим взаимодействиям с покупателями магазинов будут собраны в Google ***ytics подобно данным с веб-сайтов. Однако, тот же Measurement Protocol можно использовать и для передачи спама.

Для доступа к аккаунту GA достаточно знать ID аккаунта. Спамерам ничего не нужно узнавать — ID можно генерировать автоматически в больших количествах. Остальное они вводят сами — рефералов, страницы, имена хостов, ключевые слова и так далее. Автоматизированный скрипт отправляет ложные данные в разные аккаунты GA.

Так как непосредственного взаимодействия с сайтом нет, то нельзя отсечь спамные данные на уровне сервера, используя .htaccess. Данные можно исключить из отчетов только с помощью фильтров Google ***ytics.

Пример Ghost spam: спам в событиях GA от www.event-tracking.com

Вы, конечно же, знаете, какие именно события настроены на сайте, и что хотите отслеживать. Поэтому идентифицировать спам в событиях очень просто. Если в событиях вы обнаружили чужое сообщение, к примеру, «to use this feature visit: www.event-tracking.com» — это спам. Чтобы отсеять ложные данные по несуществующему событию, нужно настроить отдельный фильтр — подробные инструкции, как это сделать, смотрите в конце поста.

Метод спама Google ***ytics #2: Crawler Referrer Spam

Есть роботы, которые совершают обход сайтов с целью привлечь трафик на определенный портал. Данные, которые такие роботы оставляют в Google ***ytics, не несут никакой полезной информации, а сфабрикованные показатели искажают статистику. Такие роботы игнорируют директивы robots.txt, поэтому блокировать их там нет смысла. Хорошая новость в том, что здесь есть обращение к сайту. Это значит, что можно заблокировать робота-спамера не только в настройках Google ***ytics, но и в .htaccess на уровне сервера.

Как определить реферальный спам в отчетах?

Зайдите в свой аккаунт Google ***ytics, вкладка «Отчеты», «Источники трафика → Весь трафик → Рефералы». К отчету добавьте дополнительный параметр «Поведение → “Имя хоста”» и отсортируйте по имени хоста. Увидите много интересного :) Поиск реферального спама в отчетах Если рефералов много, для удобства работы лучше выгрузить все данные в таблицу, и там отобрать те источники, которые необходимо исключить. Экспорт данных из Google ***ytics

Какие параметры нужно проанализировать для идентификации спамера?

  1. Источник — неестественный или нетематический адрес сайта говорит сам за себя.
  2. Новые сеансы и Показатель отказов — в первую очередь обратите внимание на значения 0% или 100%.
  3. Имя хоста — набор символов или «not set».
  4. Дублирование значений в дополнительных параметрах. В нашем случае — данные для «Имя хоста» и «Название экрана» для сайтов erot.co, sanjosestartups.com, непереводимая.рф и так далее частично или полностью совпадают.

Сравнение данных имени хоста и названия экрана для одинаковых источников.

5. Списки спамеров Google ***ytics в сети. Если мишенями спамеров становится большое количество людей, то и списки спам-роботов будут совпадать. Понимая это, Вы можете отсеять часть спама заранее. Настройте фильтр по чужому списку спамеров — пример такого списка находится здесь. Или сделайте общий список спамеров для нескольких SEO-проектов и примените к каждому сайту по отдельности.

Как исключить реферальный спам: фильтры Google ***ytics

Как мы уже писали выше, оба вида спама — Ghost spam и Crawler Referrer Spam — можно исключить из отчетов внутренними инструментами GA, настроив соответствующие фильтры.

Важно! Не применяйте фильтры к основному представлению Google ***ytics, иначе часть данных для вашего сайта не будет собрана. Для фильтрации данных используйте имеющееся дополнительное представление или создайте его (подробнее).

Фильтр по источнику кампании

Любые метрики Google ***ytics — количество переходов, длительность сессий, события и все остальное — имеют источник. Чтобы исключить их из отчета, внесите URL определенного сайта как источника кампании в фильтр представления с настройкой «Исключить». В дальнейшем все данные из этого источника не будут добавлены к отчету. Как настроить фильтр:

  1. Войдите в аккаунт Google ***ytics.
  2. Перейдите на вкладку «Администратор».
  3. Выберите представление, к которому будет применен фильтр. Основное представление не нужно трогать :)

4. В меню сразу под выбранным представлением выберите «Фильтры». 5. Кликните «Фильтры» → «Новый фильтр». 6. Заполните поля, как показано на скринах ниже. Настройка антиспам фильтра по источнику кампании. 7. Сохраните фильтр. Такой фильтр исключит все данные, которые приходят из указанного источника, в том числе и спам в разделе «События».

Фильтр по имени хоста или по любому другому параметру

Как настроить фильтр: пункты 1-5 те же — перейдите на вкладку «Администратор», выберите представление и откройте вкладку создания нового фильтра. Далее так же заполняем фильтр, только вместо «Источник кампании» выбираем «Имя хоста».

Аналогичным образом можно отфильтровать спамные данные и по другим параметрам. Главное, определить параметр, который однозначно определит нежелательный источник.

Важно! Обязательно проверяйте фильтр перед применением. К примеру, вы можете указать адрес сайта, имя хоста которого нужно исключить. Предположим, что для сайта в качестве имени хоста указан домен вашего ресурса. Но этот домен автоматически указывается в имени хоста и для всех естественных рефералов. Таким образом, если вы примените «не глядя» этот фильтр, данные из естественных источников также будут исключены.

Исключение обращений роботов

Исключить Crawler Referrer Spam можно в настройках представления. Последовательность та же:

  1. Войдите в аккаунт Google ***ytics.
  2. Перейдите на вкладку «Администратор».
  3. Выберите представление.
  4. Войдите в «Настройки представления».

Как настроить представление Google ***ytics 5. Отметьте пункт «Исключение обращений роботов и пауков». Исключение обращений роботов из данных представления Google ***ytics Теперь Google ***ytics на основании собственного алгоритма будет определять обращения роботов и отсеивать их.

А нужно ли заморачиваться?

Мы решили поинтересоваться у Middle SEO специалиста агентства Netpeak Алексея Данилина о том, как он фильтрует данные по своим проектам. По мнению Алексея, все зависит от ситуации. Прежде чем тратить время на отслеживание спамеров и настройку фильтров, стоит оценить, нужно ли это конкретному проекту. Если спам составляет незначительную часть всей аналитики, или если вам важно отследить отдельную тенденцию среди пользователей (например, распределение мобильных и десктоп посещений) — можно отфильтровать данные, просмотрев это соотношение только для посетителей из органического поиска, или для всех посещений, кроме реферального трафика.

Чтобы избежать пyтaницы в событиях, можно заранее отнести каждое настроенное событие к отдельной группе, при этом все возможные внешние события будут оставаться в общем списке и никак не попадут в какую-то из групп. Когда вы создаете отдельное представление, безусловно стоит отсеять из статистики обращения роботов и пауков. Настраивать ли дополнительно фильтры от спама — нужно смотреть для каждого проекта индивидуально.

Краткие выводы

Хорошие новости: полную картину по своему сайту видите только вы, никто не имеет доступа в ваш Google ***ytics. Плохие новости: отослать ложные данные в ваш GA можно пpaктически всегда. Определить ID — тоже. Хорошие новости: как правило, ID именно Вашего аккаунта никому не нужен. Чаще всего ложные данные попадают в GA после генерации случайных чисел и с целью рекламы другого ресурса. Больше хороших новостей: спам можно исключить из отчетов с помощью фильтров и настроек. Или, если он не мешает жить, можно просто не обращать на него внимания. Остались вопросы? Будем рады ответить на них в комментариях.



Комментарии:

Почему отдел продаж сидит без дела. Находим решение с помощью коллтрекинга

Почему отдел продаж сидит без дела. Находим решение с помощью коллтрекинга Отслеживаем пропущенные, анализируем входящие и делаем выводы о том, как организовать работу менеджеров....

28 09 2022 8:18:54

Метрики вовлеченности — ER или ERR? Как считать Engagement rate в Instagram и Facebook

Метрики вовлеченности — ER или ERR? Как считать Engagement rate в Instagram и Facebook Простой и понятный разбор двух формул для расчета коэффициента вовлеченности...

27 09 2022 11:43:43

15 примеров удачных маркетинговых онлайн-активностей к Новому году

15 примеров удачных маркетинговых онлайн-активностей к Новому году Адвент-календарь, конкурсы и викторины, праздничные линейки товаров, подборки подарков для родных и близких, опросы, тесты и другие интересности. Используйте, если нужны идеи и вдохновение....

26 09 2022 19:57:31

Как мотивировать клиентов оставить отзыв

Как мотивировать клиентов оставить отзыв Лестные отзывы от клинта в интернете невозможно переоценить. Если вы владелец малого бизнеса и только разpaбатываете и внедряете свою маркетинговую стратегию, книга «По рекомендации» будет вам полезной...

25 09 2022 5:38:42

Какую роль играют запахи?

Какую роль играют запахи? Аромамаркетинг. Почему В Нью-Йоркских магазинах Samsung пахнет медовой дыней, в British Airways — луговыми травами. Что мы знаем о восприятии нами сенсорной информации, а конкретно — ароматов. Читать дальше!...

24 09 2022 14:32:37

Что нужно понимать в SEO-отчетах, чтобы оценить эффективность продвижения

Что нужно понимать в SEO-отчетах, чтобы оценить эффективность продвижения Всё об оценке эффективности SEO-продвижения с инструментами и рекомендациями...

23 09 2022 12:33:26

Как создать портрет покупателя — руководство для бизнеса от SEMrush

Как создать портрет покупателя — руководство для бизнеса от SEMrush Как создать портрет покупателя и зачем он нужен бизнесу....

22 09 2022 18:20:10

Инфографика: как именно рулит контент

Инфографика: как именно рулит контент Консультант по маркетингу в зоне ru Екатерина Решетило написала пост о том, как правильно настроить стратегический контент-маркетинг для долгосрочных продаж...

21 09 2022 0:32:32

Netpeak Харьков: правила жизни нового офиса

Netpeak Харьков: правила жизни нового офиса Офис Netpeak в Харькове официально открыт! В этом посте, вместо игры на фанфарах, мы на собственном примере рассмотрим, что нужно для создания регионального отделения в разгар кризиса....

20 09 2022 7:45:23

Краткий курс машинного обучения, или Как создать нейронную сеть для решения задачи по скорингу

Краткий курс машинного обучения, или Как создать нейронную сеть для решения задачи по скорингу Нейронные сети, нейросети онлайн, сверхточные нейронные сети. Я рассажу, как они устроены, как написать свою нейронную сеть с нуля, как правильно обучить нейронную сеть на имеющихся данных...

19 09 2022 19:36:12

Списки исключенных мест размещения в Google Рекламе

Списки исключенных мест размещения в Google Рекламе О списках исключенных мест размещения будет интересно узнать тем, кто хочет облегчить себе работу с контекстно-медийными сетями....

18 09 2022 17:23:36

Чек-лист SMM-стратегии: готовимся к продвижению в соцсетях

Чек-лист SMM-стратегии: готовимся к продвижению в соцсетях 14 пунктов, которые помогут вам лучше изучить свой бизнес и подготовить эффективную SMM-стратегию...

17 09 2022 0:28:50

Кейс по продвижению интернет-магазина велосипедов и велозапчастей: ROMI 58%

Проделанные шаги и полученные результаты при раскрутке магазина великов в интернете...

16 09 2022 2:56:45

Google Ads: Планировщик рекламных кампаний в контекстно-медийной сети Google

Такое обозрение очередной новинки Google от Сергея Бахаря...

15 09 2022 20:41:58

Основные виды контента и правила оформления в зависимости от вида

Контент может информировать, вовлекать и продавать, при этом для каждой цели нужен свой тип контента...

14 09 2022 16:26:14

Сколько стоил клик в Google Ads в Украине в третьем квартале 2020 года — исследование Netpeak

Сколько стоил клик в Google Ads в Украине в третьем квартале 2020 года — исследование Netpeak Данные, приведенные в исследовании, помогут в составлении медиапланов по продвижению в интернете. Понимания стоимость конверсии и необходимое количество конверсий, вы можете прогнозировать, сколько денег на рекламу нужно выделить....

13 09 2022 8:56:56

Конкурент Shazam: искусственный интеллект распознает песни по насвистываниям и мычаниям

Конкурент Shazam: искусственный интеллект распознает песни по насвистываниям и мычаниям Как в Google Search можно найти мелодию по примерному напеву...

12 09 2022 10:11:13

Что такое ассоциированные конверсии и как проверить их ценность

Что такое ассоциированные конверсии и как проверить их ценность Примерно 70% конверсий происходит за счет дополнительных источников, их ценность отражается в GA. Разбираемся, какие отчеты использовать для анализа и оценки таких источников. Читайте далее!...

11 09 2022 3:37:29

Что такое академия и как ее использовать для сбора лидов

Что такое академия и как ее использовать для сбора лидов Академия — набор структурированного контента, интеpaктивных заданий и обучающих курсов, посвященных конкретному продукту или индустрии в целом...

10 09 2022 9:13:48

Портрет украинского фрилансера — исследование Freelancehunt.

Портрет украинского фрилансера — исследование Freelancehunt. Ежегодный прирост рынка фриланса в Украине составляет в среднем 35%. В прошлом году зарегистрировано более 200 тысяч проектов на общую сумму 385 млн гривен....

09 09 2022 12:50:23

Контекстная реклама для сервиса доставки пиццы в Украине — ROMI 616% за 4 месяца

Контекстная реклама для сервиса доставки пиццы в Украине — ROMI 616% за 4 месяца Поисковая реклама для службы доставки еды — пpaктические советы, как выделиться на фоне конкурентов в популярной нише. На примере харьковской доставки пиццы мы покажем, как правильно продавать еду. Читайте в статье!...

08 09 2022 20:14:19

Декрет, развод, разочарование в научной карьере — три истории специалистов, которые нашли себя в диджитале

Декрет, развод, разочарование в научной карьере — три истории специалистов, которые нашли себя в диджитале Менять карьеру страшно, особенно после тридцати. Поэтому мы спросили людей, у которых это получилось — через какие трудности им пришлось пройти....

07 09 2022 19:55:20

Как без ошибок объединять данные в Google Data Studio

Как без ошибок объединять данные в Google Data Studio Продолжаем разговор о том, почему функция «Совмещение данных» в Google Data Studio может работать не так, как вы ожидаете....

06 09 2022 3:14:58

Стратегия email-маркетинга: кому и зачем мы шлем письма

Стратегия email-маркетинга: кому и зачем мы шлем письма Старт любых активностей в сфере email-маркетинга — разработка стратегии...

05 09 2022 22:42:55

Netpeak + RadASO = Netpeak RadASO. Мы выходим на рынок комплексного продвижения мобильных приложений

Netpeak + RadASO = Netpeak RadASO. Мы выходим на рынок комплексного продвижения мобильных приложений Агентство Netpeak закрыло сделку по покупке агентства мобильного маркетинга Радомира Новковича RadASO....

04 09 2022 6:29:18

Как создать отчет по категориям и брендам в Google Data Studio, если они не передаются в Google ***ytics

Как создать отчет по категориям и брендам в Google Data Studio, если они не передаются в Google ***ytics Как настроить передачу категории и бренда товара в Google Data Studio....

03 09 2022 19:22:35

Кейс по контекстной рекламе сайта туристической компании: увеличение количества онлайн-бронирований на 100%

Кейс по контекстной рекламе сайта туристической компании: увеличение количества онлайн-бронирований на 100% Стратегия контекстной рекламы для лендинга турагенства: увеличение количества онлайн-бронирований на 100%...

02 09 2022 12:53:24

Семь улучшений Netpeak: создание инструментов веб-аналитики и строительство блогов под ключ. Выпуск третий

Новости агентства Netpeak за предыдущий квартал. Появление отдела веб-аналитики. Открыли услугу «Создание и ведение блогов». Добавили мультивалютность. Глобально изменили скрипт Netpeak X-Reference. Запустили серию писем. Что еще?...

01 09 2022 3:48:41

Как проходила первая интернатура в Serpstat: опыт отдела Quality Assurance

Как проходила первая интернатура в Serpstat: опыт отдела Quality Assurance HR-советы компаниям, которым нужно найти больше трех джунов в проект...

31 08 2022 3:30:24

Спикеры 8P о мобайле, программатике и инхаус комaнде мечты

Спикеры 8P о мобайле, программатике и инхаус комaнде мечты Мы попросили спикеров ответить на острые для многих онлайн-проектов вопросы о развитии мобайла как канала, программатике и строительстве инхаус комaнд...

30 08 2022 14:25:21

Первая помощь в офисе — как вести себя в нештатных ситуациях

Первая помощь в офисе — как вести себя в нештатных ситуациях Человеку стало плохо, он теряет сознание. Те, кто рядом, хотят помочь, но не знают, как это сделать. Давайте разбираться....

29 08 2022 4:24:46

Как говорить о бренде, чтобы вас запомнили. Reface в соцсетях

Как говорить о бренде, чтобы вас запомнили. Reface в соцсетях Клиенты, партнеры, потенциальные сотрудники — для каждой аудитории есть своя платформа. Какими нужно быть в соцсетях, чтобы вас заметили, читайте об опыте Reface....

28 08 2022 8:41:32

Как привлечь на 174% больше звонков с помощью видеорекламы — кейс клиники лазерной косметологии Goldlaser.com.ua

Как привлечь на 174% больше звонков с помощью видеорекламы — кейс клиники лазерной косметологии Goldlaser.com.ua Клиникка использует лазеры и нуждается в продвижении. В специфических сферах привлечь потребителя впервые бывает сложнее и дороже, чем удержать его. Этот кейс о том, как повысить количество обращений новых клиентов с помощью видеорекламы...

27 08 2022 0:46:53

Netpeak Group купила конференцию eCommerce от OWOX

Конференцию eCommerce будет развивать комaнда Octopus Events...

26 08 2022 8:59:26

Репутация в сети. Зачем она нужна молодой компании, и Как ее построить

Репутация в сети. Зачем она нужна молодой компании, и Как ее построить Узнать, как управлять репутацией в сети для молодой компании, можно в статье Netpeak Journal: что такое репутация, как формируется образ бренда и что нужно делать для получения положительных отзывов....

25 08 2022 19:30:37

Что делать со старыми статьями в блоге

Что делать со старыми статьями в блоге Что делать контент-маркетологам, когда все тексты в интернете начнут генерировать боты? Спойлер: обновлять старый контент....

24 08 2022 5:40:58

Отслеживание поведения пользователей на разных устройствах при помощи User-ID

Отслеживание поведения пользователей на разных устройствах при помощи User-ID Одно из фундаментальных обновлений Universal ***ytics...

23 08 2022 14:30:40

Лучшие программы для исправления орфографических ошибок

Лучшие программы для исправления орфографических ошибок Исправление ошибок в тексте возможно с помощью онлайн-инструментов и стационарных программ...

22 08 2022 10:42:12

Кейс по контекстной рекламе в тематике «языковые курсы»

Кейс по контекстной рекламе в тематике «языковые курсы» Филиалы курсов в Таллине, Москве, Днепропетровске. Оказывается, нельзя так просто взять и посчитать ROMI (возврат маркетинговых инвестиций) в этой тематике....

21 08 2022 8:22:26

Кейс по таргетированной рекламе в тематике «нижнее белье» или как увеличить продажи перед праздниками: ROMI 29%

Кейс по таргетированной рекламе в тематике «нижнее белье» или как увеличить продажи перед праздниками: ROMI 29% Для продвижения интернет-магазина женского нижнего белья мы решили попробовать новый источник привлечения клиентов....

20 08 2022 21:13:56

Синдром самозванца. Откуда берется и как с ним можно справиться

Синдром самозванца. Откуда берется и как с ним можно справиться Все успешные люди немного сомневаются в своих достижениях и рефлексируют о большом количестве ошибок. Не ок, когда сомнения затягивают и разрушают самооценку, создают постоянное напряжение. Давайте разбираться с синдромом самозванца....

19 08 2022 11:39:12

Email моей мечты, или Как настроить корпоративную почту

Email моей мечты, или Как настроить корпоративную почту Можно открыть корпоративную почту с использованием собственного сервера для принятия/отправки и с использованием стороннего сервиса от яндекс или гугл...

18 08 2022 5:45:14

Плотность ключевых слов — как определить релевантность документа ключевому запросу

SEOmoz создал систему, которая определяет релевантность страницы поисковому запросу....

17 08 2022 17:57:48

Что такое внутренние дубли страниц и как с ними бороться?

Что такое внутренние дубли страниц и как с ними бороться? Анализ содержимого сайта показывает: Url разные, а контент страниц одинаковый. Думаете, ничего страшного? Но одинаковый контент может попасть под фильтры поисковых систем. Чтобы этого не произошло, надо знать, как избавляться от внутренних дублей...

16 08 2022 12:48:18

Почему для пользователей разных устройств нужны разные стратегии контекстной рекламы — кейс

Почему для пользователей разных устройств нужны разные стратегии контекстной рекламы — кейс Как снизить цену за привлечение клиента на 50%, развивая только кампании для пользователей десктопов....

15 08 2022 9:37:33

Обзор трех новых типов микроразметки schema.org

Обзор трех новых типов микроразметки schema.org FAQ (frequently asked questions), HowTo и Q&A (questions and answers)....

14 08 2022 23:25:54

Сколько получают интернет-маркетологи? Обновленный рейтинг зарплат специалистов

Сколько получают интернет-маркетологи? Обновленный рейтинг зарплат специалистов Сбор анкет до 16 декабря, публикация результатов в конце декабря...

13 08 2022 0:12:28

Миллион сеансов в месяц на AMP-страницы в E-commerce

Миллион сеансов в месяц на AMP-страницы в E-commerce Как Bigl.ua внедрили AMP и остались очень довольны результатом....

12 08 2022 13:51:21

Как настроить передачу данных о заказе с помощью Google Tag Manager

Как настроить передачу данных о заказе с помощью Google Tag Manager Для эффективного ведения контекстной рекламы необходимо отслеживать продажи. Как сделать это с помощью Google Tag Manager расскажем в этой статье...

11 08 2022 12:30:34

Текст для главной страницы сайта — правила, требования и примеры

Текст для главной страницы сайта — правила, требования и примеры Как понравиться поисковым системам и пользователям....

10 08 2022 16:28:46

Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::