Как исключить спам в Google ***ytics, или Кто портит ваши данные
Что делать, если вы столкнулись со спамом в отчетах Google ***ytics? Значит ли это, что кто-то имеет доступ к вашему аккаунту, или что кто-то специально влияет на данные сайта в GA? Как они это делают? И как исключить подобные данные из отчетов?
Когда в источниках реферального трафика появляются нетематические ресурсы, или когда вы открываете «Поведение → События → Обзор», и видите событие, которое точно не настраивали самостоятельно, самое время разобраться, в чем же тут дело. Спам в событиях от event-tracking.com
Зачем спамить в Google ***ytics?
Google ***ytics — самый популярный инструмент веб-аналитики, его используют миллионы пользователей. Спамеры рассчитывают на переходы любопытных владельцев сайтов, а что уже делать с этими переходами — монетизировать через баннеры, перенаправлять в магазин или использовать любым другим способом — каждый решает сам. Даже если принять процент любопытства за 10%, в соотношении с миллионами пользователей Google ***ytics это получится значительная цифра.
Как они это делают? Метод спама Google ***ytics #1: Ghost spam
Ghost spam (спам-призpaк) называется призpaком, потому что отправляет данные в GA без взаимодействия с сайтом напрямую.
Как же данные попадают в Google ***ytics? GA использует протокол для передачи данных — Measurement Protocol, который позволяет разработчикам отправлять данные напрямую на сервера Google ***ytics. Measurement Protocol сам по себе — хорошая вещь, он позволяет использовать возможности Google ***ytics для сбора данных пpaктически из любой среды. Таким образом, становится возможным использовать инструменты аналитики GA, к примеру, в сети магазинов розничной торговли. Данные по продажам или любым другим взаимодействиям с покупателями магазинов будут собраны в Google ***ytics подобно данным с веб-сайтов. Однако, тот же Measurement Protocol можно использовать и для передачи спама.
Для доступа к аккаунту GA достаточно знать ID аккаунта. Спамерам ничего не нужно узнавать — ID можно генерировать автоматически в больших количествах. Остальное они вводят сами — рефералов, страницы, имена хостов, ключевые слова и так далее. Автоматизированный скрипт отправляет ложные данные в разные аккаунты GA.
Так как непосредственного взаимодействия с сайтом нет, то нельзя отсечь спамные данные на уровне сервера, используя .htaccess. Данные можно исключить из отчетов только с помощью фильтров Google ***ytics.
Пример Ghost spam: спам в событиях GA от www.event-tracking.com
Вы, конечно же, знаете, какие именно события настроены на сайте, и что хотите отслеживать. Поэтому идентифицировать спам в событиях очень просто. Если в событиях вы обнаружили чужое сообщение, к примеру, «to use this feature visit: www.event-tracking.com» — это спам. Чтобы отсеять ложные данные по несуществующему событию, нужно настроить отдельный фильтр — подробные инструкции, как это сделать, смотрите в конце поста.
Метод спама Google ***ytics #2: Crawler Referrer Spam
Есть роботы, которые совершают обход сайтов с целью привлечь трафик на определенный портал. Данные, которые такие роботы оставляют в Google ***ytics, не несут никакой полезной информации, а сфабрикованные показатели искажают статистику. Такие роботы игнорируют директивы robots.txt, поэтому блокировать их там нет смысла. Хорошая новость в том, что здесь есть обращение к сайту. Это значит, что можно заблокировать робота-спамера не только в настройках Google ***ytics, но и в .htaccess на уровне сервера.
Как определить реферальный спам в отчетах?
Зайдите в свой аккаунт Google ***ytics, вкладка «Отчеты», «Источники трафика → Весь трафик → Рефералы». К отчету добавьте дополнительный параметр «Поведение → “Имя хоста”» и отсортируйте по имени хоста. Увидите много интересного :) Поиск реферального спама в отчетах Если рефералов много, для удобства работы лучше выгрузить все данные в таблицу, и там отобрать те источники, которые необходимо исключить. Экспорт данных из Google ***ytics
Какие параметры нужно проанализировать для идентификации спамера?
- Источник — неестественный или нетематический адрес сайта говорит сам за себя.
- Новые сеансы и Показатель отказов — в первую очередь обратите внимание на значения 0% или 100%.
- Имя хоста — набор символов или «not set».
- Дублирование значений в дополнительных параметрах. В нашем случае — данные для «Имя хоста» и «Название экрана» для сайтов erot.co, sanjosestartups.com, непереводимая.рф и так далее частично или полностью совпадают.
Сравнение данных имени хоста и названия экрана для одинаковых источников.
5. Списки спамеров Google ***ytics в сети. Если мишенями спамеров становится большое количество людей, то и списки спам-роботов будут совпадать. Понимая это, Вы можете отсеять часть спама заранее. Настройте фильтр по чужому списку спамеров — пример такого списка находится здесь. Или сделайте общий список спамеров для нескольких SEO-проектов и примените к каждому сайту по отдельности.
Как исключить реферальный спам: фильтры Google ***ytics
Как мы уже писали выше, оба вида спама — Ghost spam и Crawler Referrer Spam — можно исключить из отчетов внутренними инструментами GA, настроив соответствующие фильтры.
Важно! Не применяйте фильтры к основному представлению Google ***ytics, иначе часть данных для вашего сайта не будет собрана. Для фильтрации данных используйте имеющееся дополнительное представление или создайте его (подробнее).
Фильтр по источнику кампании
Любые метрики Google ***ytics — количество переходов, длительность сессий, события и все остальное — имеют источник. Чтобы исключить их из отчета, внесите URL определенного сайта как источника кампании в фильтр представления с настройкой «Исключить». В дальнейшем все данные из этого источника не будут добавлены к отчету. Как настроить фильтр:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление, к которому будет применен фильтр. Основное представление не нужно трогать :)
4. В меню сразу под выбранным представлением выберите «Фильтры». 5. Кликните «Фильтры» → «Новый фильтр». 6. Заполните поля, как показано на скринах ниже. Настройка антиспам фильтра по источнику кампании. 7. Сохраните фильтр. Такой фильтр исключит все данные, которые приходят из указанного источника, в том числе и спам в разделе «События».
Фильтр по имени хоста или по любому другому параметру
Как настроить фильтр: пункты 1-5 те же — перейдите на вкладку «Администратор», выберите представление и откройте вкладку создания нового фильтра. Далее так же заполняем фильтр, только вместо «Источник кампании» выбираем «Имя хоста».
Аналогичным образом можно отфильтровать спамные данные и по другим параметрам. Главное, определить параметр, который однозначно определит нежелательный источник.
Важно! Обязательно проверяйте фильтр перед применением. К примеру, вы можете указать адрес сайта, имя хоста которого нужно исключить. Предположим, что для сайта в качестве имени хоста указан домен вашего ресурса. Но этот домен автоматически указывается в имени хоста и для всех естественных рефералов. Таким образом, если вы примените «не глядя» этот фильтр, данные из естественных источников также будут исключены.
Исключение обращений роботов
Исключить Crawler Referrer Spam можно в настройках представления. Последовательность та же:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление.
- Войдите в «Настройки представления».
Как настроить представление Google ***ytics 5. Отметьте пункт «Исключение обращений роботов и пауков». Исключение обращений роботов из данных представления Google ***ytics Теперь Google ***ytics на основании собственного алгоритма будет определять обращения роботов и отсеивать их.
А нужно ли заморачиваться?
Мы решили поинтересоваться у Middle SEO специалиста агентства Netpeak Алексея Данилина о том, как он фильтрует данные по своим проектам. По мнению Алексея, все зависит от ситуации. Прежде чем тратить время на отслеживание спамеров и настройку фильтров, стоит оценить, нужно ли это конкретному проекту. Если спам составляет незначительную часть всей аналитики, или если вам важно отследить отдельную тенденцию среди пользователей (например, распределение мобильных и десктоп посещений) — можно отфильтровать данные, просмотрев это соотношение только для посетителей из органического поиска, или для всех посещений, кроме реферального трафика.
Чтобы избежать пyтaницы в событиях, можно заранее отнести каждое настроенное событие к отдельной группе, при этом все возможные внешние события будут оставаться в общем списке и никак не попадут в какую-то из групп. Когда вы создаете отдельное представление, безусловно стоит отсеять из статистики обращения роботов и пауков. Настраивать ли дополнительно фильтры от спама — нужно смотреть для каждого проекта индивидуально.
Краткие выводы
Хорошие новости: полную картину по своему сайту видите только вы, никто не имеет доступа в ваш Google ***ytics. Плохие новости: отослать ложные данные в ваш GA можно пpaктически всегда. Определить ID — тоже. Хорошие новости: как правило, ID именно Вашего аккаунта никому не нужен. Чаще всего ложные данные попадают в GA после генерации случайных чисел и с целью рекламы другого ресурса. Больше хороших новостей: спам можно исключить из отчетов с помощью фильтров и настроек. Или, если он не мешает жить, можно просто не обращать на него внимания. Остались вопросы? Будем рады ответить на них в комментариях.
Комментарии:
Отслеживание конверсий: покупка, подписка на рассылку, отправка контактных данных и другое....
17 04 2024 0:30:53
Как создать Apple ID и настроить поисковую рекламу в App Store...
16 04 2024 23:13:36
Первое подробное руководство по работе с оконными функциями в Google BigQuery....
15 04 2024 10:11:42
Технология «лёгкость восприятия» — инструмент, который поможет убедить клиентов покупать именно у вас...
14 04 2024 9:53:35
Пост постоянно обновляется актуальными данными о размерах картинок...
13 04 2024 7:31:55
На третий месяц работы мы вышли на положительный ROMI, на четвертый — ROMI превысил 800%....
12 04 2024 20:39:32
Фубольный клуб. Как увеличить ROMI (возврат маркетинговых инвестиций) в рекламных кампаниях — рассказываем на примере киевского интернет-магазина «Динамо»...
11 04 2024 12:11:27
Самые популярные блоги Рунета по интернет-маркетингу — все RSS-фиды в одном месте...
10 04 2024 3:12:22
Выдержка из интервью Дэнни Салливаном с представителями компаний Google и Bing...
09 04 2024 23:44:34
Правила, требования, особенности. А ещё примеры, которые помогут создать правильную, с точки зрения поисковиков, рекламу. Читать!...
08 04 2024 10:45:55
Перевод статьи Никки Джиллиленд из Econsultancy об уроках для маркетологов про то, каким должно быть хорошее видео. Узнайте 4 правила эффективного видеоконтента прямо сейчас!...
07 04 2024 7:55:22
Шаги, которые необходимо выполнить для правильного сбора и анализа данных сайта...
06 04 2024 4:15:26
Почему Google ***ytics не видит ссылки на HTTP-сайт с сайта на HTTPS?...
05 04 2024 3:14:47
Как специалисту оптимизировать рабочее время, качественно развивать проекты и меньше нервничать...
04 04 2024 12:13:41
Ситема управления проектами, которой пользуются в Netpeak....
03 04 2024 10:45:46
Почему имеет смысл выбрать его, а не Google Tag Manager?...
02 04 2024 9:21:12
Следим за развитием событий и анализируем решение суда. Читать дальше!...
01 04 2024 5:29:59
Расскажем про ошибки интернет-магазинов, которые трудно найти соответствующими программами и сервисами проверки...
31 03 2024 3:42:29
Какие типы звонков отслеживаются? Есть ли интеграция с Google ***ytics? Существуют ли в выбранном сервисе или на платформе инструменты интеграции с другими системами? Больше вопросов и ответов на них — в статье....
30 03 2024 3:53:22
О том, как работают, празднуют, танцуют и в какой корпоративной культуре живут сотрудники корпорации Google. Этот пост развеет кое-какие мифы....
29 03 2024 19:46:22
Как сэкономить на рекламе мобильных приложений в Facebook...
28 03 2024 11:29:41
1 — меняй работу внутри работы, 2 — выбери то, что нравится больше всего и старайся делать это чаще, 3 — придумай себе развлечения. Подробности — в посте. Читать дальше....
27 03 2024 8:10:58
Что такое контекстная реклама? Настраиваем рекламу в поиске Google...
26 03 2024 19:57:32
Блог на новом движке и с новым дизайном, перетянувший в себя огромное количество постов и комментариев за Х лет своей работы...
25 03 2024 19:37:35
LinkedIn хороший инструмент для достижения B2B целей. Пока его редко используют в СНГ, что делает LinkedIn еще привлекательней. В этой социальной сети возможности рекламных форматов и таргетингов почти безграничны. Узнать больше....
24 03 2024 3:37:14
Услуга уровня элит-класса в конкурентной нише и не в самом простом для продвижения регионе. Рассказываем, как привели целевой трафик по минимальной цене. Узнать!...
23 03 2024 8:16:43
Наконец-то вы создали сайт. Вы потратили усилия на дизайн, разработку, его наполнение. Но этого оказалось недостаточно, чтобы о вашем интернет- ресурсе узнали. Как же привлечь посетителей на сайт?...
22 03 2024 0:52:27
SEO для цветочных магазинов с оплатой за трафик и полученные результаты...
21 03 2024 1:24:52
От того, что такое оффер до лучших стратегий и избежания ошибок...
20 03 2024 4:32:52
Что нужно знать перед запуском рекламы в мессенджерах....
19 03 2024 3:47:41
Более строгие требования к таким ресурсам обуславливают свои подходы....
18 03 2024 9:33:34
Будьте полезны, будьте удобны и будьте везде. Далее подробно — 18 способов собрать базу для email-рассылок. О пользе бесплатного, привлечении внимания, возможных активностях для аудитории, социальных доказательствах, предсказуемости, работе с Facebook и многом другом...
17 03 2024 23:53:51
Раньше покупка фолловеров, лайков, репостов строго осуждалась. Сегодня это обычное дело. Всё больше сервисов предлагают по приемлемой цене купить репутацию в соцсетях: от лайков в Instagram до фолловеров в твиттере. Покупка фолловеров аукнется мне в будущ...
16 03 2024 13:38:11
Nommi — сокращение от nomadic MiFi: роутер для современных цифровых кочевников...
15 03 2024 11:51:44
Подробно о преимуществах и особенностях двух сервисов контекстной рекламы....
14 03 2024 11:19:15
Настроить контекстную рекламу для сети гипермаркетов бытовой техники и электроники Mechta.kz...
13 03 2024 12:24:20
При использовании похожих инструментов важно не переборщить с количеством рекламы...
12 03 2024 6:44:11
Как правильно оформлять свое портфолио, писать сопроводительные письма и делать посты в соцсетях. С помощью простой человеческой адекватности можно выигрывать у 90% других подрядчиков. Как это использовать? Читайте дальше!...
11 03 2024 3:56:59
Программа действий, если захотелось удалить себя из ютуба, гугла и прочих социалок....
10 03 2024 2:40:25
Как найти, нарастить и проанализировать ссылочную массу...
09 03 2024 14:31:36
Настройка пикселя TikTok — короткий и понятный мануал. Устанавливаем пиксель вручную: вставка кода на сайт и интеграция через Install pixel code by 3rd party tool. Читать дальше....
08 03 2024 13:44:35
Что нужно, чтобы реклама в интернете приносила прибыль....
07 03 2024 4:48:14
В одной из самых «перегретых» ниш вышли в топ-5 по некоторым высокочастотным запросам. Узнать больше!...
06 03 2024 20:12:25
Алгоритм ссылочного ранжирования, который показывает ее значимость, в частности, для поисковиков. Важность показателя PageRank оспаривают, но до сих пор считают. Читать!...
05 03 2024 17:38:51
Одесса. Конференция «Контекстная реклама 2013». Самые полезные настройки рекламной кампании....
04 03 2024 21:38:30
Нашим решением было трaнcлировать хотя бы часть опыта спикеров 8P, составив дайджест лучших, на их взгляд, кейсов, о которых они узнали за этот год....
03 03 2024 18:22:24
Правильная внутренняя перелинковка необходима, чтобы страницы не вылетали из индекса, а также чтобы увеличить ссылочный вес продвигаемых страниц...
02 03 2024 1:46:37
Как работать с новой функцией, чтобы набирать подписчиков и делать продажи. Подробное и актуальное руководство в 2021 году....
01 03 2024 7:33:49
Сервисы для сбора поисковых фраз позволяют регулярно расширять семантическое ядро, обеспечивая сайту высокую видимость и увеличение трафика по тематическим запросам...
29 02 2024 19:38:58
Чем радовала, удивляла и шокировала таргетированная реклама в социальных сетях...
28 02 2024 23:53:34
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::