Как исключить спам в Google ***ytics, или Кто портит ваши данные
Что делать, если вы столкнулись со спамом в отчетах Google ***ytics? Значит ли это, что кто-то имеет доступ к вашему аккаунту, или что кто-то специально влияет на данные сайта в GA? Как они это делают? И как исключить подобные данные из отчетов?
Когда в источниках реферального трафика появляются нетематические ресурсы, или когда вы открываете «Поведение → События → Обзор», и видите событие, которое точно не настраивали самостоятельно, самое время разобраться, в чем же тут дело. Спам в событиях от event-tracking.com
Зачем спамить в Google ***ytics?
Google ***ytics — самый популярный инструмент веб-аналитики, его используют миллионы пользователей. Спамеры рассчитывают на переходы любопытных владельцев сайтов, а что уже делать с этими переходами — монетизировать через баннеры, перенаправлять в магазин или использовать любым другим способом — каждый решает сам. Даже если принять процент любопытства за 10%, в соотношении с миллионами пользователей Google ***ytics это получится значительная цифра.
Как они это делают? Метод спама Google ***ytics #1: Ghost spam
Ghost spam (спам-призpaк) называется призpaком, потому что отправляет данные в GA без взаимодействия с сайтом напрямую.
Как же данные попадают в Google ***ytics? GA использует протокол для передачи данных — Measurement Protocol, который позволяет разработчикам отправлять данные напрямую на сервера Google ***ytics. Measurement Protocol сам по себе — хорошая вещь, он позволяет использовать возможности Google ***ytics для сбора данных пpaктически из любой среды. Таким образом, становится возможным использовать инструменты аналитики GA, к примеру, в сети магазинов розничной торговли. Данные по продажам или любым другим взаимодействиям с покупателями магазинов будут собраны в Google ***ytics подобно данным с веб-сайтов. Однако, тот же Measurement Protocol можно использовать и для передачи спама.
Для доступа к аккаунту GA достаточно знать ID аккаунта. Спамерам ничего не нужно узнавать — ID можно генерировать автоматически в больших количествах. Остальное они вводят сами — рефералов, страницы, имена хостов, ключевые слова и так далее. Автоматизированный скрипт отправляет ложные данные в разные аккаунты GA.
Так как непосредственного взаимодействия с сайтом нет, то нельзя отсечь спамные данные на уровне сервера, используя .htaccess. Данные можно исключить из отчетов только с помощью фильтров Google ***ytics.
Пример Ghost spam: спам в событиях GA от www.event-tracking.com
Вы, конечно же, знаете, какие именно события настроены на сайте, и что хотите отслеживать. Поэтому идентифицировать спам в событиях очень просто. Если в событиях вы обнаружили чужое сообщение, к примеру, «to use this feature visit: www.event-tracking.com» — это спам. Чтобы отсеять ложные данные по несуществующему событию, нужно настроить отдельный фильтр — подробные инструкции, как это сделать, смотрите в конце поста.
Метод спама Google ***ytics #2: Crawler Referrer Spam
Есть роботы, которые совершают обход сайтов с целью привлечь трафик на определенный портал. Данные, которые такие роботы оставляют в Google ***ytics, не несут никакой полезной информации, а сфабрикованные показатели искажают статистику. Такие роботы игнорируют директивы robots.txt, поэтому блокировать их там нет смысла. Хорошая новость в том, что здесь есть обращение к сайту. Это значит, что можно заблокировать робота-спамера не только в настройках Google ***ytics, но и в .htaccess на уровне сервера.
Как определить реферальный спам в отчетах?
Зайдите в свой аккаунт Google ***ytics, вкладка «Отчеты», «Источники трафика → Весь трафик → Рефералы». К отчету добавьте дополнительный параметр «Поведение → “Имя хоста”» и отсортируйте по имени хоста. Увидите много интересного :) Поиск реферального спама в отчетах Если рефералов много, для удобства работы лучше выгрузить все данные в таблицу, и там отобрать те источники, которые необходимо исключить. Экспорт данных из Google ***ytics
Какие параметры нужно проанализировать для идентификации спамера?
- Источник — неестественный или нетематический адрес сайта говорит сам за себя.
- Новые сеансы и Показатель отказов — в первую очередь обратите внимание на значения 0% или 100%.
- Имя хоста — набор символов или «not set».
- Дублирование значений в дополнительных параметрах. В нашем случае — данные для «Имя хоста» и «Название экрана» для сайтов erot.co, sanjosestartups.com, непереводимая.рф и так далее частично или полностью совпадают.
Сравнение данных имени хоста и названия экрана для одинаковых источников.
5. Списки спамеров Google ***ytics в сети. Если мишенями спамеров становится большое количество людей, то и списки спам-роботов будут совпадать. Понимая это, Вы можете отсеять часть спама заранее. Настройте фильтр по чужому списку спамеров — пример такого списка находится здесь. Или сделайте общий список спамеров для нескольких SEO-проектов и примените к каждому сайту по отдельности.
Как исключить реферальный спам: фильтры Google ***ytics
Как мы уже писали выше, оба вида спама — Ghost spam и Crawler Referrer Spam — можно исключить из отчетов внутренними инструментами GA, настроив соответствующие фильтры.
Важно! Не применяйте фильтры к основному представлению Google ***ytics, иначе часть данных для вашего сайта не будет собрана. Для фильтрации данных используйте имеющееся дополнительное представление или создайте его (подробнее).
Фильтр по источнику кампании
Любые метрики Google ***ytics — количество переходов, длительность сессий, события и все остальное — имеют источник. Чтобы исключить их из отчета, внесите URL определенного сайта как источника кампании в фильтр представления с настройкой «Исключить». В дальнейшем все данные из этого источника не будут добавлены к отчету. Как настроить фильтр:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление, к которому будет применен фильтр. Основное представление не нужно трогать :)
4. В меню сразу под выбранным представлением выберите «Фильтры». 5. Кликните «Фильтры» → «Новый фильтр». 6. Заполните поля, как показано на скринах ниже. Настройка антиспам фильтра по источнику кампании. 7. Сохраните фильтр. Такой фильтр исключит все данные, которые приходят из указанного источника, в том числе и спам в разделе «События».
Фильтр по имени хоста или по любому другому параметру
Как настроить фильтр: пункты 1-5 те же — перейдите на вкладку «Администратор», выберите представление и откройте вкладку создания нового фильтра. Далее так же заполняем фильтр, только вместо «Источник кампании» выбираем «Имя хоста».
Аналогичным образом можно отфильтровать спамные данные и по другим параметрам. Главное, определить параметр, который однозначно определит нежелательный источник.
Важно! Обязательно проверяйте фильтр перед применением. К примеру, вы можете указать адрес сайта, имя хоста которого нужно исключить. Предположим, что для сайта в качестве имени хоста указан домен вашего ресурса. Но этот домен автоматически указывается в имени хоста и для всех естественных рефералов. Таким образом, если вы примените «не глядя» этот фильтр, данные из естественных источников также будут исключены.
Исключение обращений роботов
Исключить Crawler Referrer Spam можно в настройках представления. Последовательность та же:
- Войдите в аккаунт Google ***ytics.
- Перейдите на вкладку «Администратор».
- Выберите представление.
- Войдите в «Настройки представления».
Как настроить представление Google ***ytics 5. Отметьте пункт «Исключение обращений роботов и пауков». Исключение обращений роботов из данных представления Google ***ytics Теперь Google ***ytics на основании собственного алгоритма будет определять обращения роботов и отсеивать их.
А нужно ли заморачиваться?
Мы решили поинтересоваться у Middle SEO специалиста агентства Netpeak Алексея Данилина о том, как он фильтрует данные по своим проектам. По мнению Алексея, все зависит от ситуации. Прежде чем тратить время на отслеживание спамеров и настройку фильтров, стоит оценить, нужно ли это конкретному проекту. Если спам составляет незначительную часть всей аналитики, или если вам важно отследить отдельную тенденцию среди пользователей (например, распределение мобильных и десктоп посещений) — можно отфильтровать данные, просмотрев это соотношение только для посетителей из органического поиска, или для всех посещений, кроме реферального трафика.
Чтобы избежать пyтaницы в событиях, можно заранее отнести каждое настроенное событие к отдельной группе, при этом все возможные внешние события будут оставаться в общем списке и никак не попадут в какую-то из групп. Когда вы создаете отдельное представление, безусловно стоит отсеять из статистики обращения роботов и пауков. Настраивать ли дополнительно фильтры от спама — нужно смотреть для каждого проекта индивидуально.
Краткие выводы
Хорошие новости: полную картину по своему сайту видите только вы, никто не имеет доступа в ваш Google ***ytics. Плохие новости: отослать ложные данные в ваш GA можно пpaктически всегда. Определить ID — тоже. Хорошие новости: как правило, ID именно Вашего аккаунта никому не нужен. Чаще всего ложные данные попадают в GA после генерации случайных чисел и с целью рекламы другого ресурса. Больше хороших новостей: спам можно исключить из отчетов с помощью фильтров и настроек. Или, если он не мешает жить, можно просто не обращать на него внимания. Остались вопросы? Будем рады ответить на них в комментариях.
Комментарии:
Оставить заявку на горячей линии МОЗ — это только вершина айсберга. Необходимо провести опрос среди сотрудников компании. И не один. А ещё подготовить несколько помещений для вакцинации и отдыха. Узнать больше!...
10 12 2024 0:50:29
Как пользоваться «Совмещением данных» с учетом всех особенностей инструмента...
09 12 2024 9:18:22
Чтобы создать позитивный образ компании, бренда, персоны или работодателя в поисковых системах, нужно приложить много усилий. Но, поверьте, результат того стоит. И начать стоит с репутационного аудита....
08 12 2024 9:42:34
О видах мобильных версий, их плюсах и минусах, а также советы по аудиту....
07 12 2024 20:33:38
Неля Серебро рассказывает про внутреннюю кухню блога Netpeak...
06 12 2024 10:11:15
Кликбейтинг в опасности. Если хочешь узнать методы работы антикликбейт-комaнды Facebook, просто нажми на этот заголовок...
05 12 2024 18:31:53
Как узнать срок хранения товаров в корзине и настроить ремаркетинг для завершения покупок...
04 12 2024 17:35:47
Сегодня стоит озвучить особенности страниц и групп в социальной сети Фейсбук...
03 12 2024 18:29:10
Сотрудники на рабочем месте расслаблены, игнорируют распоряжения, а при давлении угрожают увольнением. В эту ситуацию нередко попадают руководители. Некоторые считают, что причина — выстраивание дружеских отношений с подчинёнными....
02 12 2024 0:16:50
Идеи, кейсы и советы от экспертов. Читайте и находите что-то для продвижения своего бизнеса. Нетривиальные идеи от признанных экспертов-пpaктиков! Рекомендуем каждому, что развивает или планирует свой бизнес в интернете!...
01 12 2024 21:23:24
кейсы по seo интернет-магазина модной одежды в Болгарии: как мы сняли негативный эффект от Google Penguin и получили ROMI (возврат маркетинговых инвестиций) 1428%...
30 11 2024 14:13:28
Ещё один проект, который продвигался во время карантина....
29 11 2024 14:43:47
Зачем амбициозным онлайн-проектам индивидуальные инструменты веб-аналитики....
28 11 2024 18:38:37
Получаем реальную статистику эффективности использования AMP-страниц с помощью АМР Client ID API....
27 11 2024 15:20:36
Как передавать данные пpaктически о каждом «шаге» пользователя на сайте...
26 11 2024 23:24:38
Украинцы хотят заниматься коммерцией. И иногда делают это очень нестандартно. Собрали для вас подборку бизнесменов с особенным мышлением....
25 11 2024 8:48:12
Словарь, которым пользуются SEO-специалисты агентства Netpeak...
24 11 2024 3:36:54
С каждым годом китайские маркетплейсы увеличивают свое влияние, и покупатели всё активней заказывают товары из Поднебесной. Но не всё скидки да покупки — обладатели интернет-аудитории и маркетологи могут еще и хорошо заработать на этих площадках....
23 11 2024 6:57:33
Кейсы с наибольшим количеством комментариев, репостов, оценок и дочитываний; по контекстной рекламе, поисковому продвижению, аналитике, SMM и другие. Узнать больше!...
22 11 2024 0:54:21
Как настроить Google ***ytics и как открыть вход другому пользователю: подробный урок....
21 11 2024 1:19:14
Представляем Netpeak Journal — новый этап развития блога Netpeak...
20 11 2024 9:29:22
Поговорим о soft skills, потому что именно они, исходя из моего опыта, помогают строить поистине сильные комaнды....
19 11 2024 23:14:42
7 советов для оптимизации вашего профиля в Google Мой Бизнес....
18 11 2024 23:50:49
Как бесплатно отключить смс уведомление. Плюс — подсказки для маркетологов: как снизить негативное отношение к бренду. То есть, как красиво предоставить возможность отписаться от смс клиентам, и не слить бюджет на ненужные сообщения. Узнать больше!...
17 11 2024 4:46:34
Интервью с основателем школы английского языка Progress...
16 11 2024 16:41:25
Покажем, как продвигать сайты, продающие детскую обувь...
15 11 2024 18:43:16
Как мы с помощью Call Tracking узнали настоящую рентабельность контекстной рекламы для магазина мебели...
14 11 2024 10:28:57
Список инструментов email-маркетолога для рассылок по англоязычной аудитории....
13 11 2024 12:28:32
Чтобы увеличить продажи и улучшить их эффективность в новых условиях необходимо применять «социальные доказательства»....
12 11 2024 11:36:42
Ringostat и Binotel. Сравнение главных сервисов для коллтрекинга в Украине...
11 11 2024 5:43:52
О том, какие результаты дает эта технология, рассказал Александр Иванов, Head of Product в ЛУН.ua в рамках прошлогодней самой летней конференции 8P. Читайте, как его комaнде удалось разогнать загрузку страниц сервиса Flatfy до 0,2 секунды...
10 11 2024 21:53:25
Наличие или отсутствие в карточках отзывов о товарах интернет магазина сказывается на продажах, а также оказывает влияние на SEO. Об этом, а также о пользе автоматизированного сбора отзывов о товарах мы расскажем в этой статье....
09 11 2024 18:26:12
Среди интернет-маркетологов существует мнение, что медийная реклама — не перформанс-инструмент. То есть не приносит прямые конверсии. Когда медийные кампании продают — кейс центра тюнинга автомобилей премиум класса....
08 11 2024 23:47:15
Предложение для крупных и средних бизнес-проектов по эффективному использованию больших бюджетов при запуске на новых рынках...
07 11 2024 3:24:33
Как специалисту сэкономить время для создания и оптимизации кампаний, проверки орфографии и другие фишки. Советы из пpaктики....
06 11 2024 0:46:22
Как эффективно распределять бюджет и ресурсы на обучение сотрудников. Статья будет полезной для собственников бизнеса и HR-специалистов....
05 11 2024 21:33:47
Мы сменили CMS, не просев в трафике, и превратили каталог товаров в полноценный интернет-магазин....
04 11 2024 19:19:30
Изучаем на примере тестирования товарных кампаний в момент смены логотипа и ренейминга...
03 11 2024 4:20:56
Digital-маркетинг развивается и модернизируется: новые методы работы, инструменты и технологии. И стабильно растут требования к digital-специалистам. Чтобы оставаться в профессии, нужно мониторить тренды, отслеживать тенденции и повышать знания....
02 11 2024 6:13:38
Оптимизация и оформление вордовских текстов, переводчик, совместное редактирование, возможность залить картинку... Эти и много других опций дают дополнения для Google Документов....
01 11 2024 3:18:54
Фотоконкурс для стимуляции активности в сообществе, прироста фанов и поощрения лояльной аудитории....
31 10 2024 20:38:27
Создание даже короткого ролика может стоить дорого. Поэтому можно использовать бесплатный инструмент Bumper Machine от Google....
30 10 2024 9:33:25
Продвижение монобренда: особенности, трудности, подводные камни. Ниша здоровья и красоты....
29 10 2024 17:11:46
Визуализация данных для новичков. Отвечаем на вопрос читателя....
28 10 2024 16:36:37
Подробно рассказываем, как создать, внедрить и проверить XML-карту сайта....
27 10 2024 20:58:15
Как жить с налогом на Google, Facebook и другие международные сервисы — объясняем детали....
26 10 2024 5:55:16
Понятная инструкция для SMM-специалистов для тех, кто экспериментирует с настройками аудиторий в рекламных кампаниях. Вы увидите, как настраивать ремаркетинг на примере Facebook. Существует 10 типов индивидуализированных аудиторий в Facebook, разберем три...
25 10 2024 19:19:52
«Нет, нам нужна раскрутка и точка!» Список маркетинговых пpaктически применимых фишек....
24 10 2024 19:41:19
Facebook buttons. Пора поделиться самым волнующим вопросом 2011-го года...
23 10 2024 7:28:37
Персональный чек-лист автора десятков рассылок: три года опыта и регулярное общение с техподдержкой почтовых сервисов. Всё о том, как не попасть в спам и как из него спасаться. А может и не всё. Можете дополнить этот пост своими фишками? Делитесь!...
22 10 2024 2:49:33
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::