Как исключить спам в Google ***ytics, или Кто портит ваши данные
Что делать, если вы столкнулись со спамом в отчетах Google ***ytics? Значит ли это, что кто-то имеет доступ к вашему аккаунту, или что кто-то специально влияет на данные сайта в GA? Как они это делают? И как исключить подобные данные из отчетов?
Когда в источниках реферального трафика появляются нетематические ресурсы, или когда вы открываете «Поведение → События → Обзор», и видите событие, которое точно не настраивали самостоятельно, самое время разобраться, в чем же тут дело. Спам в событиях от event-tracking.com
Зачем спамить в Google ***ytics?
Google ***ytics — самый популярный инструмент веб-аналитики, его используют миллионы пользователей. Спамеры рассчитывают на переходы любопытных владельцев сайтов, а что уже делать с этими переходами — монетизировать через баннеры, перенаправлять в магазин или использовать любым другим способом — каждый решает сам. Даже если принять процент любопытства за 10%, в соотношении с миллионами пользователей Google ***ytics это получится значительная цифра.
Как они это делают? Метод спама Google ***ytics #1: Ghost spam
Ghost spam (спам-призpaк) называется призpaком, потому что отправляет данные в GA без взаимодействия с сайтом напрямую.
Как же данные попадают в Google ***ytics? GA использует протокол для передачи данных — Measurement Protocol, который позволяет разработчикам отправлять данные напрямую на сервера Google ***ytics. Measurement Protocol сам по себе — хорошая вещь, он позволяет использовать возможности Google ***ytics для сбора данных пpaктически из любой среды. Таким образом, становится возможным использовать инструменты аналитики GA, к примеру, в сети магазинов розничной торговли. Данные по продажам или любым другим взаимодействиям с покупателями магазинов будут собраны в Google ***ytics подобно данным с веб-сайтов. Однако, тот же Measurement Protocol можно использовать и для передачи спама.
Для доступа к аккаунту GA достаточно знать ID аккаунта. Спамерам ничего не нужно узнавать — ID можно генерировать автоматически в больших количествах. Остальное они вводят сами — рефералов, страницы, имена хостов, ключевые слова и так далее. Автоматизированный скрипт отправляет ложные данные в разные аккаунты GA.
Так как непосредственного взаимодействия с сайтом нет, то нельзя отсечь спамные данные на уровне сервера, используя .htaccess. Данные можно исключить из отчетов только с помощью фильтров Google ***ytics.
Пример Ghost spam: спам в событиях GA от www.event-tracking.com
Вы, конечно же, знаете, какие именно события настроены на сайте, и что хотите отслеживать. Поэтому идентифицировать спам в событиях очень просто. Если в событиях вы обнаружили чужое сообщение, к примеру, «to use this feature visit: www.event-tracking.com» — это спам. Чтобы отсеять ложные данные по несуществующему событию, нужно настроить отдельный фильтр — подробные инструкции, как это сделать, смотрите в конце поста.
Метод спама Google ***ytics #2: Crawler Referrer Spam
Есть роботы, которые совершают обход сайтов с целью привлечь трафик на определенный портал. Данные, которые такие роботы оставляют в Google ***ytics, не несут никакой полезной информации, а сфабрикованные показатели искажают статистику. Такие роботы игнорируют директивы robots.txt, поэтому блокировать их там нет смысла. Хорошая новость в том, что здесь есть обращение к сайту. Это значит, что можно заблокировать робота-спамера не только в настройках Google ***ytics, но и в .htaccess на уровне сервера.
Как определить реферальный спам в отчетах?
Зайдите в свой аккаунт Google ***ytics, вкладка «Отчеты», «Источники трафика → Весь трафик → Рефералы». К отчету добавьте дополнительный параметр «Поведение → “Имя хоста”» и отсортируйте по имени хоста. Увидите много интересного :) Поиск реферального спама в отчетах Если рефералов много, для удобства работы лучше выгрузить все данные в таблицу, и там отобрать те источники, которые необходимо исключить. Экспорт данных из Google ***ytics
Какие параметры нужно проанализировать для идентификации спамера?
- Источник — неестественный или нетематический адрес сайта говорит сам за себя.
- Новые сеансы и Показатель отказов — в первую очередь обратите внимание на значения 0% или 100%.
- Имя хоста — набор символов или «not set».
- Дублирование значений в дополнительных параметрах. В нашем случае — данные для «Имя хоста» и «Название экрана» для сайтов erot.co, sanjosestartups.com, непереводимая.рф и так далее частично или полностью совпадают.
Сравнение данных имени хоста и названия экрана для одинаковых источников.
5. Списки спамеров Google ***ytics в сети. Если мишенями спамеров становится большое количество людей, то и списки спам-роботов будут совпадать. Понимая это, Вы можете отсеять часть спама заранее. Настройте фильтр по чужому списку спамеров — пример такого списка находится здесь. Или сделайте общий список спамеров для нескольких SEO-проектов и примените к каждому сайту по отдельности.
Как исключить реферальный спам: фильтры Google ***ytics
Как мы уже писали выше, оба вида спама — Ghost spam и Crawler Referrer Spam — можно исключить из отчетов внутренними инструментами GA, настроив соответствующие фильтры.
Важно! Не применяйте фильтры к основному представлению Google ***ytics, иначе часть данных для вашего сайта не будет собрана. Для фильтрации данных используйте имеющееся дополнительное представление или создайте его (подробнее).
Фильтр по источнику кампании
Любые метрики Google ***ytics — количество переходов, длительность сессий, события и все остальное — имеют источник. Чтобы исключить их из отчета, внесите URL определенного сайта как источника кампании в фильтр представления с настройкой «Исключить». В дальнейшем все данные из этого источника не будут добавлены к отчету. Как настроить фильтр:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление, к которому будет применен фильтр. Основное представление не нужно трогать :)
4. В меню сразу под выбранным представлением выберите «Фильтры». 5. Кликните «Фильтры» → «Новый фильтр». 6. Заполните поля, как показано на скринах ниже. Настройка антиспам фильтра по источнику кампании. 7. Сохраните фильтр. Такой фильтр исключит все данные, которые приходят из указанного источника, в том числе и спам в разделе «События».
Фильтр по имени хоста или по любому другому параметру
Как настроить фильтр: пункты 1-5 те же — перейдите на вкладку «Администратор», выберите представление и откройте вкладку создания нового фильтра. Далее так же заполняем фильтр, только вместо «Источник кампании» выбираем «Имя хоста».
Аналогичным образом можно отфильтровать спамные данные и по другим параметрам. Главное, определить параметр, который однозначно определит нежелательный источник.
Важно! Обязательно проверяйте фильтр перед применением. К примеру, вы можете указать адрес сайта, имя хоста которого нужно исключить. Предположим, что для сайта в качестве имени хоста указан домен вашего ресурса. Но этот домен автоматически указывается в имени хоста и для всех естественных рефералов. Таким образом, если вы примените «не глядя» этот фильтр, данные из естественных источников также будут исключены.
Исключение обращений роботов
Исключить Crawler Referrer Spam можно в настройках представления. Последовательность та же:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление.
- Войдите в «Настройки представления».
Как настроить представление Google ***ytics 5. Отметьте пункт «Исключение обращений роботов и пауков». Исключение обращений роботов из данных представления Google ***ytics Теперь Google ***ytics на основании собственного алгоритма будет определять обращения роботов и отсеивать их.
А нужно ли заморачиваться?
Мы решили поинтересоваться у Middle SEO специалиста агентства Netpeak Алексея Данилина о том, как он фильтрует данные по своим проектам. По мнению Алексея, все зависит от ситуации. Прежде чем тратить время на отслеживание спамеров и настройку фильтров, стоит оценить, нужно ли это конкретному проекту. Если спам составляет незначительную часть всей аналитики, или если вам важно отследить отдельную тенденцию среди пользователей (например, распределение мобильных и десктоп посещений) — можно отфильтровать данные, просмотрев это соотношение только для посетителей из органического поиска, или для всех посещений, кроме реферального трафика.
Чтобы избежать пyтaницы в событиях, можно заранее отнести каждое настроенное событие к отдельной группе, при этом все возможные внешние события будут оставаться в общем списке и никак не попадут в какую-то из групп. Когда вы создаете отдельное представление, безусловно стоит отсеять из статистики обращения роботов и пауков. Настраивать ли дополнительно фильтры от спама — нужно смотреть для каждого проекта индивидуально.
Краткие выводы
Хорошие новости: полную картину по своему сайту видите только вы, никто не имеет доступа в ваш Google ***ytics. Плохие новости: отослать ложные данные в ваш GA можно пpaктически всегда. Определить ID — тоже. Хорошие новости: как правило, ID именно Вашего аккаунта никому не нужен. Чаще всего ложные данные попадают в GA после генерации случайных чисел и с целью рекламы другого ресурса. Больше хороших новостей: спам можно исключить из отчетов с помощью фильтров и настроек. Или, если он не мешает жить, можно просто не обращать на него внимания. Остались вопросы? Будем рады ответить на них в комментариях.
Комментарии:
Распределение бюджета на кампании в Google Рекламе. Обозревает Григорий Крутий....
26 04 2024 5:16:56
Книга про пять полезных фишек + стратегия продвижения интернет-магазина...
25 04 2024 17:33:43
Продвижение монобренда: особенности, трудности, подводные камни. Ниша здоровья и красоты....
24 04 2024 6:35:43
кмс Google: как достичь поставленной цели с помощью рекламы? Делимся советам по настройке КМС-кампаний....
23 04 2024 6:47:43
Кейс SEO-продвижения в США: рост трафика сайта с помощью низкочастотных запросов....
22 04 2024 1:10:40
Стоит ли платить за рекламную кампанию «Медийно-контекстный баннер на поиске»?...
21 04 2024 11:11:27
Идея ORM состоит в том, чтобы вызывать положительное мнение о вашей деятельности, работая с отзывами или комментариями, в результате чего больше людей будут покупать ваши товары или услуги. Узнать больше!...
20 04 2024 19:42:25
Тестирования наличия важных тегов на целевых страница — бесплатный скрипт и алгоритм...
19 04 2024 8:37:53
Пора принять решение! Разберитесь с регулярными выражениями для более продуктивной работы с Google ***ytics или Google Tag Manager...
18 04 2024 17:42:50
Мониторинг мобильных просмотр статистики Firebase в отчетах Google ***ytics и связь Firebase ***ytics с Google Рекламой...
17 04 2024 15:39:15
Chrome Extensions экономят время тех, кто продвигает мобильные приложения...
16 04 2024 9:39:50
Что поможет написать объявление без грамматических ошибок? В недрах агентства Netpeak рождается новый полезный сервис...
15 04 2024 18:50:49
Как собрать свой онлайн марафон на 500 или 1000 человек? Сколько это стоит и какие сервисы использовать. Давайте разбираться....
14 04 2024 11:12:33
Мы решили внедрить товарные рекомендации на сайте. Они приносят дополнительно до 10% дохода....
13 04 2024 15:29:52
Это исследование для тех, кто хочет выяснить, эффективно ли работать с лидами, если им год и больше...
12 04 2024 14:36:26
Очередной красивый пост о продвижении платформы email и sms-рассылок — UniSender...
11 04 2024 21:41:20
Инструменты интернет-маркетинга, которые вы не используете или используете не на сто процентов....
10 04 2024 14:22:50
Аналитик Netpeak Алексей Селезнев рассказал, как составить и пользоваться сводными таблицами онлайн в excel и за считанные секунды выделить нужные для анализа данные из десятков тысяч строк в отчетах Google ***ytics...
09 04 2024 19:55:39
Мы запустили email с нуля и стали получать стабильный ежемecячный доход....
08 04 2024 19:10:33
Новости агентства Netpeak за предыдущий квартал. Появление отдела веб-аналитики. Открыли услугу «Создание и ведение блогов». Добавили мультивалютность. Глобально изменили скрипт Netpeak X-Reference. Запустили серию писем. Что еще?...
07 04 2024 13:40:14
Подбор правильного инструмента для визуализации данных может сэкономить время и ресурсы компании, а также повысить общую продуктивность маркетинга...
06 04 2024 4:20:40
Краткая инструкция по поиску идеального кандидата, потому что (как видим) многим на рынке все еще сложно найти хорошего маркетолога. Да и понять, стоит ли вкладывать в сотрудника силы, время, средства с первой встречи достаточно сложно....
05 04 2024 18:46:33
Красивый слог и сюжет должны быть в интеpaктивной оболочке, соответствующей времени. Проект Gutenbergz идет к созданию именно такой — идеальной истории для людей XXI века. О пути к этой цели, топе App Store и успехе на Kickstarter мы поговорили с руководи...
04 04 2024 22:17:57
И эксперт, и агент. Анонимный покупатель — специальная проверка бизнес-процессов до и во время рекламной кампании...
03 04 2024 22:43:34
Почему Google ***ytics не видит ссылки на HTTP-сайт с сайта на HTTPS?...
02 04 2024 22:49:32
Советы специалистов по продвижению интернет-магазинов в сверхконкурентной нише одежды и обуви...
01 04 2024 5:48:43
Основатель фейсбука опубликовал на WIRED крутое интервью...
31 03 2024 8:50:58
Мотивация сотрудников к работе с текстами. Опыт бюро копирайтинга Texbroker...
30 03 2024 13:27:19
Повышение посещаемости на сайте: контент, seo, ppc и многое другое...
29 03 2024 4:53:43
Правила, законы, платное и бесплатное продвижение в Telegram...
28 03 2024 16:26:57
Кейсы с наибольшим количеством комментариев, репостов, оценок и дочитываний; по контекстной рекламе, поисковому продвижению, аналитике, SMM и другие. Узнать больше!...
27 03 2024 10:50:55
Зачем нужно работать с отчетами по ассоциированным конверсиям и сравнивать различные модели атрибуции?...
26 03 2024 16:11:29
Как Netpeak продвигал Cifrus.ru, один из ведущих магазинов цифровой техники в Москве....
25 03 2024 9:13:46
Facebook + Instagram, Business Manager + основная бизнес-страница на Facebook, BM + рекламный аккаунт и так далее....
24 03 2024 1:36:29
Крутые площадки для нового инструмента: контекстщикам на заметку!...
23 03 2024 16:43:54
А сейчас про конференцию Netpeak Friends Day для друзей Netpeak Group...
22 03 2024 21:32:33
Игроков интернета России, Уанета и Казнета зарубежные сайты coблaзняют семизначными результатами продаж во время «черной пятницы» и «киберпонедельника»....
21 03 2024 16:45:32
Аудит юзабилити способствует следованию современным тенденциям, пониманию целевого посетителя и увеличению конверсии....
20 03 2024 14:20:52
Информация для бизнесменов, интернет-маркетологов и всех, кто интересуется продвижением бизнеса в интернете....
19 03 2024 6:53:11
Охват и средняя цена за клик в самых популярных тематиках....
18 03 2024 6:50:44
Чем радовала, удивляла и шокировала таргетированная реклама в социальных сетях...
17 03 2024 9:49:51
Подборка для застройщиков, маркетологов и менеджеров по продажам...
16 03 2024 18:11:38
Создаем фид с помощью выгрузки товаров в формате yml и специального скрипта, который сделает всю (почти) грязную работу за вас....
15 03 2024 7:57:27
Обзор главных преимуществ, которые дают облачные академии бизнесу....
14 03 2024 13:46:57
На третий месяц работы мы вышли на положительный ROMI, на четвертый — ROMI превысил 800%....
13 03 2024 5:59:41
Система индексирования страниц — как поисковик и его роботы разбирают перечень контента по полочкам...
12 03 2024 5:17:43
Читайте простой мануал о том, как перейти на Universal ***ytics и не поломать весь сбор данных...
11 03 2024 4:45:57
Современные платформы телефонии и коллтрекинга — это не только про звонки. С Ringostat вы узнаете, откуда пришел клиент, как менеджер ему ответил и какая реклама «принесла» деньги....
10 03 2024 3:12:59
Лучшие результаты в SEO дает заранее спланированное сотрудничество клиента с агентством на всех этапах работ с сайтом....
09 03 2024 12:33:54
29 ноября в Киеве в UNIT.City — конференция по медицинскому маркетингу MeDiConf...
08 03 2024 9:37:29
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::