Big Data SEO — как заставить большие данные работать на ваш бизнес

Как начать работу с BigData — загружаем данные в Google BigQuery Big Data в сфере маркетинга означает работу
Big Data SEO: кому и зачем
С каждым годом появляется больше грамотных пользователей, которые умеют четко сформулировать свой запрос в поиске, по одному только названию сайта и сниппету определить, можно ли доверять ресурсу. Также чрезвычайно много людей, которые готовы долго искать, продумывать и формулировать длинные запросы, чтобы найти именно то, чего хочется.
Большим проектам (от 300 000 страниц) есть что предложить этим пользователям, но далеко не всегда нужные категории и товары оказываются на первых страницах выдачи даже по тому товару или услуге, которые интересуют покупателя и есть в наличии магазина. И это при том, что SEO-работы на сайте проводят систематически и штатные специалисты регулярно оптимизируют всё на свете.
А сколько всего спрятано в подкатегориях...
В какой-то момент проект перестает быстро расти. Маркетинговые активности, реклама дают какие-то скачки на праздники и другие традиционные сезонные пики, но в целом нет ощущения, что проект развивается. Собственники бизнеса, маркетинг-комaнды начинают переживать, что SEO не работает.
Средний рост проекта в год — +20-30% трафика на сайт. У больших проектов такой показатель снижается, и меньше 10% в год считается вполне себе нормой.
Елена Воскобойник, глава департамента SEO в Netpeak
Можно точечно оптимизировать каждую страницу и категорию: подбирать релевантные ключевые слова, включать их в описание, контент, организовывать с ними перелинковку, наращивать ссылки, строить планы проработки всех разделов сайта и двигаться постепенно, наблюдая результат своей работы. Но такой подход для объемных проектов с сотнями тысяч страниц энерго и трудозатратен, а результат растянут во времени.
Можно добиться значительного прироста трафика, увеличить число продаж с помощью масштабирования классического SEO. Та же работа с поисковыми запросами, только большая, очень большая работа — выгрузка нескольких миллионов запросов по тематике и нише, их сортировка и массовая оптимизация страниц на основании готовых шаблонов.
Как сделать правильную перелинковку в интернет-магазине Как подобрать низкочастотные запросы и для чего это нужно Big data SEO — альтернативный способ решения проблемы. За основу мы берем один из важнейших параметров внутренней оптимизации —
Почему перелинковка?
Существует множество способов улучшить ранжирование страниц в выдаче и непрокаченные проекты могут использовать их по полной. Но когда уже все или почти всё сделано, нужно искать новые точки роста. Подход Netpeak строится на работе с семантикой, которая всегда бесконечна
Наши продукты заточены под такие задачи — инструменты и сервисы, которые помогают извлечь огромные объемы данных, упорядочить их, очистить от шлака и структурировать для постановки технических заданий на SEO-специалистов, разработчиков и аналитиков в штате заказчика. Речь о Serpstat, Netpeak Spider, Netpeak Checker.
Напомним, в чем суть перелинковки:
- Передача веса между страницами. Если на страницу ссылается много других страниц внутри сайта, это указывает поисковикам: страница действительно весома. Так, главная всегда самая «тяжелая», потому что на неё ссылаются все остальные страницы сайта. Та же история со страницами категорий в интернет-магазине. Они сквозные: на каждой странице есть ссылка на категорию. Из-за этого роботы считают страницы категорий весомыми.
Таким образом формируется иерархия важности страниц сайта в глазах робота. Перелинковкой мы придаем так называемый статический вес страницам, который важен с точки зрения продвижения. Мы размещаем ссылки перелинковки на страницы, которые потенциально может искать пользователь — услуг, товаров и так далее.
- Передача анкорного веса (задаем тематику странице). Ссылка всегда привязана к анкорному тексту. Анкорный текст это, по сути, запрос, например «стиральная машина». Увеличивая анкорный вес, мы передаем поисковым роботам понимание, о чем она.
Анкорный текст может быть разный «стиральная машина», «стиральная машина купить», «стиральная машина киев». Чем лучше робот понимает, о чем страница, тем она релевантнее.
- Удобство для пользователя. Человеку предлагают товары, страницы, которые могут его заинтересовать. Это и про навигацию и про помощь в выборе — предложение максимально близкое к тому, что ищет человек.
Почему перелинковка важна для больших проектов? Структура таких сайтов настолько широкая, что пользователи и боты могут не доходить до страниц с большой вложенностью.
Выносить тысячи ссылок на эти страницы в меню для придания им веса— идея тоже не очень. Приходится искать другие варианты и делать перелинковку внутри сайта.
Почему низкочастотные запросы?
Продвижение сайта VIN-кодов в США по низкочастотным запросам: рост трафика на 681% за 6 месяцев Зачем для продвижения использовать
Например, заходим на сайт магазина одежды. Здесь нет категории «сиреневое платье в клеточку», но на сайте оно может быть. Но на главной только основные категории, необходимые для выбора. А ведь запросов по платьям десятки тысяч: фасоны, цвета, модели, имя селебрити, которая надевала похожее на красную дорожку.
У пользователя есть определенный образ, по нему формируется запрос и он ожидает увидеть соответствующее его ожиданиям предложение. Задача оптимизатора — предоставить страницу релевантную запросу.
Как создавать, продвигать и продавать сайты под Amazon На продвижении с помощью низкочастотных запросов строится стратегия успешных
Этапы Big Data Seo
Вне зависимости от объема, тематики сайта, работа над проектом разбивается на шесть этапов (итераций):
Под каждый проект подбираем источники данных, метод и принцип, алгоритм, по которому мы будем их обpaбатывать. На старте готовим техническое задание, в котором детально описываем этапы и промежуточные шаги каждой итерации.
Работаем с семантикой (пулом поисковых запросов)
Выгрузка всей семантики ниши, начиная с нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
Откуда берем данные:
- Google Search Console;
- Serpstat;
- Google Ads;
- Google ***ytics и другие.
Эти данные собираются как для текущего сайта, так и с сайтов конкурентов. То есть мы получаем всю семантику ниши. Затем информация автоматически очищается от мусора.
Следующий шаг — расширение списка запросов с помощью скрипта генерации семантики. Для каждого ранее выгруженного запроса автоматически подбираются похожие фразы, подсказки. Объем снова увеличивается и мы проводим повторную чистку.
При повторной чистке фильтруются, например, запросы в нерелевантной для языка системе письменности (для кириллицы — латиница и наоборот, иероглифы). Также определяем нерелевантную длину запроса. Количество слов в фразе выбирается исходя из объема данных и личной оценки фраз Data Scientist.
Какие инструменты использует отдел Data Science — собственные скрипты на языке R и Python, Serpstat, Netpeak Spider. Только с помощью этих сервисов можно собрать, выгрузить сотни тысяч или миллионы запросов, отсеять нерелевантные.
Собираем топ по всем запросам
По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
В дальнейшем эта информация понадобится нам для автоматического сопоставления страниц сайта и поисковых запросов.
Формируем скоринговую модель
Цель — из всего собранного пула отобрать запросы, которые нам выгодно использовать для перелинковки. Делаем это с помощью скоринговой модели.
Скоринг — это «оценка». Скоринговая модель — алгоритм оценки.
В нашем случае он заключается в определении эффективных запросов, которые потенциально могут принести трафик с наименьшими затратами.
С помощью нейронной сети формируем скоринговую модель. Модель помогает оценить каждый поисковый запрос с точки зрения конкурентности, релевантности, потенциала трафика. Каждому запросу присваивается балл. Балл показывает эффективность ключевого запроса.
После оценки отбираем пул запросов, которые принесут максимальную выгоду.
«На пальцах»: если нет рекламы в выдаче — фразе добавляем два балла, если есть слово «купить» — добавляем ещё три бала, присутствует слово «бесплатно» — минус шесть баллов. Если конкуренция по запросу почти отсутствует — плюс пять баллов. В итоге берем только те ключевики, которые собрали достаточное количество баллов.
Денис Стадник, SEO Tech Lead в Netpeak
Скоринг нужен, чтобы определить запросы, которые точно подойдут данному конкретному сайту.
На этом этапе используем собственный скрипт для определения показателя качества фразы. Скоринговая модель, а следовательно и скрипт корректируется под каждую конкретную тематику, учитывая ее особенности.
Проводим автоматическую кластеризацию подходящих запросов
Цель — сопоставить страницы сайта и ключевые запросы ниши, которые мы получили на основании двух предыдущих итераций.
Для кластеризации (группировки) поисковых запросов используем алгоритмы Machine learning, в основе которых лежат метод иерархической и k-means кластеризации и данные поисковой выдачи (топа).
На выходе получаем связку URL сайта+кластер (группу) поисковых запросов. Оцениваем, каким запросам нужно больше входящих ссылок, каким меньше.Создаем связки для перелинковки
Цель: определить доноров — страницы сайта, с которых будем расставлять ссылки и связать их уже с созданными на предыдущем этапе связками «URL+кластер».
Проводим оценку «веса» и «тематичности» каждой страницы сайта для максимального эффекта.
Мы принимаем решение, какие именно страницы-доноры будут ссылаться на страницы-реципиенты. Важно, чтобы на страницу с ноутбуками ссылалась страница с телефонами, а не подгузниками (параметр «тематичность»). Дальше смотрим — если по этому запросу большая конкуренция, значит донору нужны ссылки с 20 страниц сайта. По другому такой конкуренции нет — достаточно и одной ссылки.
Денис Стадник, SEO Tech Lead в Netpeak
В результате получаем базы данных со списком анкоров, доноров и реципиентов. Пример:
На этом этапе мы используем, в частности, собственные скрипты для кластеризации и привязки кластеров к текущей структуре сайта, Serpstat.
Формируем шаблоны title, h1, description
Как оптимизировать контент: title, h1, description, keywords На финальной стадии работ наши специалисты генерируют новое
Далее мы сопровождаем внедрение перелинковки, шаблонов новых описаний и отслеживаем результат, консультируем специалистов заказчиков на протяжении всего процесса оптимизации.
Как правило, такая работа показывает результаты в сжатые сроки — и не только за счет опытных специалистов в штате комaнд крупных проектов. Дело в том, что большие сайты (с историей и регулярными работами по SEO) для поисковых систем — трастовые ресурсы и это помогает ускорить продвижение оптимизированных страниц.
Хочу быстро найти клиентов онлайнЗапомнить
Существует огромное количество данных о пользователях, их предпочтениях, поведении на сайтах, о том, как и что ищут люди (в поисковых запросах). Все эти данные — и есть Big Data.
11 этапов SEO-продвижения сайта Использование Big Data для поискового продвижения называется Big Data SEO. Подход Netpeak заключается в том, чтобы масштабировать
Упор делаем на перелинковку и низкочастотные запросы.
Перелинковка помогает передавать вес между страницами, анкорный вес, улучшает навигацию по сайту. В итоге, поисковикам станет понятнее ресурс, отдельные его страницы, вырастет их вес, а значит ценность по мнению роботов. Такой сайт будет удобен для пользователя — а здесь и лояльность, и низкий показатель отказов.
Использование низкочастотных запросов помогает увеличить конверсию, а ещё такие запросы, как правило, низкоконкурентные. Но нельзя так просто взять и массово найти, выгрузить, очистить от мусора нч запросы для больших проектов.
Этапы Big Data SEO:
- Сбор семантики, чтобы по максимуму расширить пул поисковых запросов. Мы делаем выгрузку всей семантики ниши: нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
- По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
- Формирование скоринговой модели: здесь находим запросы, которые выгодно использовать для перелинковки.
- Кластеризация подходящих запросов — сопоставляем страницы сайта и ключевые запросы ниши.
- Создание связки для перелинковки (определяем релевантных доноров).
- Формирование шаблонов title, h1, description — делаем описания для страниц, участвующих в перелинковке.
Комментарии:
Как Netpeak продвигал Cifrus.ru, один из ведущих магазинов цифровой техники в Москве....
04 06 2026 12:34:52
Как автоматизировать целый участок в работе комaнды специалистов по контекстной рекламе — кейс concert.ua...
03 06 2026 15:44:22
Подборка онлайн-платформ и программ для работы с текстом и изображениями....
02 06 2026 7:59:33
В Казнете о маркетплейсе подрядчиков Naimi.kzприложении говорят все: от студентов до президента....
01 06 2026 21:35:26
Краткая инструкция по поиску идеального кандидата, потому что (как видим) многим на рынке все еще сложно найти хорошего маркетолога. Да и понять, стоит ли вкладывать в сотрудника силы, время, средства с первой встречи достаточно сложно....
31 05 2026 14:50:41
Откуда берутся установки и стоит ли тратить деньги на покупку мотивов...
30 05 2026 14:57:34
От создания аккаунта до выбора пикселя — просто и понятно про TikTok....
29 05 2026 20:40:41
Более строгие требования к таким ресурсам обуславливают свои подходы....
28 05 2026 13:26:52
Технология «лёгкость восприятия» — инструмент, который поможет убедить клиентов покупать именно у вас...
27 05 2026 5:48:12
Стратегия продвижения, благодаря которой удалось снизить стоимость заявки от покупателей. Рассказываем об особенностях проведения акций в нише. Узнать больше!...
26 05 2026 11:10:51
В 2019 году в цикл зрелости вошли 28 технологий и инструментов...
25 05 2026 19:55:58
На что обратить внимание при покупке интернет-ресурса, какие факторы влияют на цену и что помогает определить качество сайта? Ответы на все эти вопросы в статье. Читать!...
24 05 2026 1:38:15
Статистика изменений долей рынка после майского и декабрьского апдейта Google в 2020 году....
23 05 2026 12:53:44
Пример, как 4000+ гривен превращаются в 45000+ гривен. Ниша интернет-магазинов, да еще и бытовой техники уже давно является высококонкурентной. Но при правильном продвижении даже новичок может добиться результатов....
22 05 2026 8:34:14
Владельцы айфонов в странах арабского мира легче расстаются с деньгами за приложения. Вот почему арабская локаль в App Store так привлекательна...
21 05 2026 9:19:42
Что делать, когда не получается заставить себя написать статью или кейс...
20 05 2026 3:22:16
Нам удалось увеличить количество органических показов на 63% и установок на 25%....
19 05 2026 16:51:53
Как рекламировать смартфоны в YouTube — советы крупному бизнесу по настройке и запуску эффективной рекламы. Важно: корректный анализ результатов. Узнайте как его сделать!...
18 05 2026 17:41:43
Как завоевать Instagram, задавая правильные цели и вопросы. Также в статье делимся табличкой лучшего времени постинга для различных тематических публикаций. Узнать больше!...
17 05 2026 7:46:22
Данные по 22,4 миллионам кликов в 46 тематиках и 392 населенных пунктах страны — собрана статистика исключительно по проектам агентства Netpeak. Узнать больше!...
16 05 2026 1:29:40
Зачем размещаться на AppSumo и как запустить продукт в 2021 году? Лайфхаки по размещению, личный опыт и результаты по проведенной кампании...
15 05 2026 19:44:55
Бонус в статье: как собрать аудитории для ремаркетинга на брошенную корзину...
14 05 2026 7:22:39
Краш-тест сервиса визуализации данных: выбираем задачу, источники, создаём отчет с помощью DataDeck. Бонус в конце — лаконичные списки преимуществ и недостатков этого инструмента и приятный подарок для дочитавших...
13 05 2026 21:59:22
Популярные скрипты Google Рекламы позволяют автоматизировать рутинные и монотонные процессы. Каждый скрипт состоит из функций, переменных, объектов, сущностей, селекторов, итераторов...
12 05 2026 0:19:33
Раскрутить телеграм-канал с нуля до тысячи — реально. Раскрываем пошаговый алгоритм и даем рекомендации для SMM-специалистов....
11 05 2026 23:43:43
У нас на руках оказались все карты для создания собственного мини-рейтинга популярных сервисов email-рассылок....
10 05 2026 6:38:37
Узнаем расширенную информацию о посещениях сайта с помощью языка R — кейс Netpeak...
09 05 2026 15:10:59
Дейли — ежедневный комaндный митинг, на котором комaнда синхронизируется по ключевым моментам работы и по текущим задачам. Делимся чек-листом агентства Netpeak по организации дейли на удалёнке....
08 05 2026 1:27:47
All about internet mail. Примеры того, что стоит внедрить в рассылках почты онлайн....
07 05 2026 22:25:11
Чтобы перенаправить рекламу не на свой домен, арбитражники используют редирект в Яндексе при работе с партнерскими ссылками...
06 05 2026 5:34:55
Эти данные пригодятся в составлении медиапланов по продвижению в интернете. Понимания стоимость конверсии и необходимое количество конверсий, вы можете прогнозировать, сколько денег на рекламу нужно выделить. Читать!...
05 05 2026 20:46:16
Как анализировать конкуренты и делать правильные выводы для развития бизнеса....
04 05 2026 3:48:37
Узкие специализированные ниши и широкие, которые, как правило, уже заняты лидерами рынка — в каждой найдется место для онлайн-издания с полезным контентом. Узнать больше!...
03 05 2026 13:45:43
Пост по мотивам видео Мэтта Каттса из Google. Из первых рук, как говорится....
02 05 2026 9:52:56
Актуальный обзор особенностей работы онлайн-проектов в Казахстане...
01 05 2026 12:55:40
Что такое контекстная реклама? Словарь терминов для чайников...
30 04 2026 20:55:18
Как найти продавцов для маркетплейса с помощью рекламы в Google, Facebook, TikTok и Viber....
29 04 2026 1:39:57
Вместо легкой пятничной темы, представляю вольный перевод статьи автора книги «Позитивная иррациональность»....
28 04 2026 5:46:30
Как найти сетку сайтов конкурентов — рассказываем о популярных методах и секретных фишках. Бонус — инструкция по выявлению PBN конкурентов. Читать дальше!...
27 04 2026 16:56:27
Как избежать ошибок при продвижении интернет-магазина с помощью видеоблогеров....
26 04 2026 10:29:33
Определяем, кто из mail подписчиков предан вашему бренду по-настоящему....
25 04 2026 18:26:47
14 пунктов, которые помогут вам лучше изучить свой бизнес и подготовить эффективную SMM-стратегию...
24 04 2026 22:56:25
Анализ содержимого сайта показывает: Url разные, а контент страниц одинаковый. Думаете, ничего страшного? Но одинаковый контент может попасть под фильтры поисковых систем. Чтобы этого не произошло, надо знать, как избавляться от внутренних дублей...
23 04 2026 11:43:37
Легче запомнить алгоритм правильной отправки писем, чем потом вытягивать их из папки со спамом....
22 04 2026 7:29:59
Как найти релевантный сайт-донор для размещения своей ссылки...
21 04 2026 20:51:33
Ringostat и Binotel. Сравнение главных сервисов для коллтрекинга в Украине...
20 04 2026 12:18:58
Как работать с негативом и что делать, чтобы его было меньше/не было вовсе....
19 04 2026 11:45:50
Аромамаркетинг. Почему В Нью-Йоркских магазинах Samsung пахнет медовой дыней, в British Airways — луговыми травами. Что мы знаем о восприятии нами сенсорной информации, а конкретно — ароматов. Читать дальше!...
18 04 2026 5:49:37
Direct сделал подарок всем, кто уже давно хотел увеличить привлекательность своих объявлений — добавил возможность включения видеодополнений к текстово-графическим кампаниям. Как включить новую фишку от Директа и достаточно ли она эффективна?...
17 04 2026 2:50:47
Вывод информационного сайта из-под алгоритмического YMYL фильтра Google...
16 04 2026 10:42:42
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::