Big Data SEO — как заставить большие данные работать на ваш бизнес

Как начать работу с BigData — загружаем данные в Google BigQuery Big Data в сфере маркетинга означает работу
Big Data SEO: кому и зачем
С каждым годом появляется больше грамотных пользователей, которые умеют четко сформулировать свой запрос в поиске, по одному только названию сайта и сниппету определить, можно ли доверять ресурсу. Также чрезвычайно много людей, которые готовы долго искать, продумывать и формулировать длинные запросы, чтобы найти именно то, чего хочется.
Большим проектам (от 300 000 страниц) есть что предложить этим пользователям, но далеко не всегда нужные категории и товары оказываются на первых страницах выдачи даже по тому товару или услуге, которые интересуют покупателя и есть в наличии магазина. И это при том, что SEO-работы на сайте проводят систематически и штатные специалисты регулярно оптимизируют всё на свете.
А сколько всего спрятано в подкатегориях...
В какой-то момент проект перестает быстро расти. Маркетинговые активности, реклама дают какие-то скачки на праздники и другие традиционные сезонные пики, но в целом нет ощущения, что проект развивается. Собственники бизнеса, маркетинг-комaнды начинают переживать, что SEO не работает.
Средний рост проекта в год — +20-30% трафика на сайт. У больших проектов такой показатель снижается, и меньше 10% в год считается вполне себе нормой.
Елена Воскобойник, глава департамента SEO в Netpeak
Можно точечно оптимизировать каждую страницу и категорию: подбирать релевантные ключевые слова, включать их в описание, контент, организовывать с ними перелинковку, наращивать ссылки, строить планы проработки всех разделов сайта и двигаться постепенно, наблюдая результат своей работы. Но такой подход для объемных проектов с сотнями тысяч страниц энерго и трудозатратен, а результат растянут во времени.
Можно добиться значительного прироста трафика, увеличить число продаж с помощью масштабирования классического SEO. Та же работа с поисковыми запросами, только большая, очень большая работа — выгрузка нескольких миллионов запросов по тематике и нише, их сортировка и массовая оптимизация страниц на основании готовых шаблонов.
Как сделать правильную перелинковку в интернет-магазине Как подобрать низкочастотные запросы и для чего это нужно Big data SEO — альтернативный способ решения проблемы. За основу мы берем один из важнейших параметров внутренней оптимизации —
Почему перелинковка?
Существует множество способов улучшить ранжирование страниц в выдаче и непрокаченные проекты могут использовать их по полной. Но когда уже все или почти всё сделано, нужно искать новые точки роста. Подход Netpeak строится на работе с семантикой, которая всегда бесконечна
Наши продукты заточены под такие задачи — инструменты и сервисы, которые помогают извлечь огромные объемы данных, упорядочить их, очистить от шлака и структурировать для постановки технических заданий на SEO-специалистов, разработчиков и аналитиков в штате заказчика. Речь о Serpstat, Netpeak Spider, Netpeak Checker.
Напомним, в чем суть перелинковки:
- Передача веса между страницами. Если на страницу ссылается много других страниц внутри сайта, это указывает поисковикам: страница действительно весома. Так, главная всегда самая «тяжелая», потому что на неё ссылаются все остальные страницы сайта. Та же история со страницами категорий в интернет-магазине. Они сквозные: на каждой странице есть ссылка на категорию. Из-за этого роботы считают страницы категорий весомыми.
Таким образом формируется иерархия важности страниц сайта в глазах робота. Перелинковкой мы придаем так называемый статический вес страницам, который важен с точки зрения продвижения. Мы размещаем ссылки перелинковки на страницы, которые потенциально может искать пользователь — услуг, товаров и так далее.
- Передача анкорного веса (задаем тематику странице). Ссылка всегда привязана к анкорному тексту. Анкорный текст это, по сути, запрос, например «стиральная машина». Увеличивая анкорный вес, мы передаем поисковым роботам понимание, о чем она.
Анкорный текст может быть разный «стиральная машина», «стиральная машина купить», «стиральная машина киев». Чем лучше робот понимает, о чем страница, тем она релевантнее.
- Удобство для пользователя. Человеку предлагают товары, страницы, которые могут его заинтересовать. Это и про навигацию и про помощь в выборе — предложение максимально близкое к тому, что ищет человек.
Почему перелинковка важна для больших проектов? Структура таких сайтов настолько широкая, что пользователи и боты могут не доходить до страниц с большой вложенностью.
Выносить тысячи ссылок на эти страницы в меню для придания им веса— идея тоже не очень. Приходится искать другие варианты и делать перелинковку внутри сайта.
Почему низкочастотные запросы?
Продвижение сайта VIN-кодов в США по низкочастотным запросам: рост трафика на 681% за 6 месяцев Зачем для продвижения использовать
Например, заходим на сайт магазина одежды. Здесь нет категории «сиреневое платье в клеточку», но на сайте оно может быть. Но на главной только основные категории, необходимые для выбора. А ведь запросов по платьям десятки тысяч: фасоны, цвета, модели, имя селебрити, которая надевала похожее на красную дорожку.
У пользователя есть определенный образ, по нему формируется запрос и он ожидает увидеть соответствующее его ожиданиям предложение. Задача оптимизатора — предоставить страницу релевантную запросу.
Как создавать, продвигать и продавать сайты под Amazon На продвижении с помощью низкочастотных запросов строится стратегия успешных
Этапы Big Data Seo
Вне зависимости от объема, тематики сайта, работа над проектом разбивается на шесть этапов (итераций):
Под каждый проект подбираем источники данных, метод и принцип, алгоритм, по которому мы будем их обpaбатывать. На старте готовим техническое задание, в котором детально описываем этапы и промежуточные шаги каждой итерации.
Работаем с семантикой (пулом поисковых запросов)
Выгрузка всей семантики ниши, начиная с нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
Откуда берем данные:
- Google Search Console;
- Serpstat;
- Google Ads;
- Google ***ytics и другие.
Эти данные собираются как для текущего сайта, так и с сайтов конкурентов. То есть мы получаем всю семантику ниши. Затем информация автоматически очищается от мусора.
Следующий шаг — расширение списка запросов с помощью скрипта генерации семантики. Для каждого ранее выгруженного запроса автоматически подбираются похожие фразы, подсказки. Объем снова увеличивается и мы проводим повторную чистку.
При повторной чистке фильтруются, например, запросы в нерелевантной для языка системе письменности (для кириллицы — латиница и наоборот, иероглифы). Также определяем нерелевантную длину запроса. Количество слов в фразе выбирается исходя из объема данных и личной оценки фраз Data Scientist.
Какие инструменты использует отдел Data Science — собственные скрипты на языке R и Python, Serpstat, Netpeak Spider. Только с помощью этих сервисов можно собрать, выгрузить сотни тысяч или миллионы запросов, отсеять нерелевантные.
Собираем топ по всем запросам
По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
В дальнейшем эта информация понадобится нам для автоматического сопоставления страниц сайта и поисковых запросов.
Формируем скоринговую модель
Цель — из всего собранного пула отобрать запросы, которые нам выгодно использовать для перелинковки. Делаем это с помощью скоринговой модели.
Скоринг — это «оценка». Скоринговая модель — алгоритм оценки.
В нашем случае он заключается в определении эффективных запросов, которые потенциально могут принести трафик с наименьшими затратами.
С помощью нейронной сети формируем скоринговую модель. Модель помогает оценить каждый поисковый запрос с точки зрения конкурентности, релевантности, потенциала трафика. Каждому запросу присваивается балл. Балл показывает эффективность ключевого запроса.
После оценки отбираем пул запросов, которые принесут максимальную выгоду.
«На пальцах»: если нет рекламы в выдаче — фразе добавляем два балла, если есть слово «купить» — добавляем ещё три бала, присутствует слово «бесплатно» — минус шесть баллов. Если конкуренция по запросу почти отсутствует — плюс пять баллов. В итоге берем только те ключевики, которые собрали достаточное количество баллов.
Денис Стадник, SEO Tech Lead в Netpeak
Скоринг нужен, чтобы определить запросы, которые точно подойдут данному конкретному сайту.
На этом этапе используем собственный скрипт для определения показателя качества фразы. Скоринговая модель, а следовательно и скрипт корректируется под каждую конкретную тематику, учитывая ее особенности.
Проводим автоматическую кластеризацию подходящих запросов
Цель — сопоставить страницы сайта и ключевые запросы ниши, которые мы получили на основании двух предыдущих итераций.
Для кластеризации (группировки) поисковых запросов используем алгоритмы Machine learning, в основе которых лежат метод иерархической и k-means кластеризации и данные поисковой выдачи (топа).
На выходе получаем связку URL сайта+кластер (группу) поисковых запросов. Оцениваем, каким запросам нужно больше входящих ссылок, каким меньше.Создаем связки для перелинковки
Цель: определить доноров — страницы сайта, с которых будем расставлять ссылки и связать их уже с созданными на предыдущем этапе связками «URL+кластер».
Проводим оценку «веса» и «тематичности» каждой страницы сайта для максимального эффекта.
Мы принимаем решение, какие именно страницы-доноры будут ссылаться на страницы-реципиенты. Важно, чтобы на страницу с ноутбуками ссылалась страница с телефонами, а не подгузниками (параметр «тематичность»). Дальше смотрим — если по этому запросу большая конкуренция, значит донору нужны ссылки с 20 страниц сайта. По другому такой конкуренции нет — достаточно и одной ссылки.
Денис Стадник, SEO Tech Lead в Netpeak
В результате получаем базы данных со списком анкоров, доноров и реципиентов. Пример:
На этом этапе мы используем, в частности, собственные скрипты для кластеризации и привязки кластеров к текущей структуре сайта, Serpstat.
Формируем шаблоны title, h1, description
Как оптимизировать контент: title, h1, description, keywords На финальной стадии работ наши специалисты генерируют новое
Далее мы сопровождаем внедрение перелинковки, шаблонов новых описаний и отслеживаем результат, консультируем специалистов заказчиков на протяжении всего процесса оптимизации.
Как правило, такая работа показывает результаты в сжатые сроки — и не только за счет опытных специалистов в штате комaнд крупных проектов. Дело в том, что большие сайты (с историей и регулярными работами по SEO) для поисковых систем — трастовые ресурсы и это помогает ускорить продвижение оптимизированных страниц.
Хочу быстро найти клиентов онлайнЗапомнить
Существует огромное количество данных о пользователях, их предпочтениях, поведении на сайтах, о том, как и что ищут люди (в поисковых запросах). Все эти данные — и есть Big Data.
11 этапов SEO-продвижения сайта Использование Big Data для поискового продвижения называется Big Data SEO. Подход Netpeak заключается в том, чтобы масштабировать
Упор делаем на перелинковку и низкочастотные запросы.
Перелинковка помогает передавать вес между страницами, анкорный вес, улучшает навигацию по сайту. В итоге, поисковикам станет понятнее ресурс, отдельные его страницы, вырастет их вес, а значит ценность по мнению роботов. Такой сайт будет удобен для пользователя — а здесь и лояльность, и низкий показатель отказов.
Использование низкочастотных запросов помогает увеличить конверсию, а ещё такие запросы, как правило, низкоконкурентные. Но нельзя так просто взять и массово найти, выгрузить, очистить от мусора нч запросы для больших проектов.
Этапы Big Data SEO:
- Сбор семантики, чтобы по максимуму расширить пул поисковых запросов. Мы делаем выгрузку всей семантики ниши: нашего сайта и сайтов конкурентов (прямых и косвенных) в каждой категории.
- По каждому поисковому запросу, собранному на предыдущем этапе, выгружаем топ-100 выдачи для того, чтобы определить тип страницы, который чаще всего встречается среди конкурентов. Результат — миллионы строк данных.
- Формирование скоринговой модели: здесь находим запросы, которые выгодно использовать для перелинковки.
- Кластеризация подходящих запросов — сопоставляем страницы сайта и ключевые запросы ниши.
- Создание связки для перелинковки (определяем релевантных доноров).
- Формирование шаблонов title, h1, description — делаем описания для страниц, участвующих в перелинковке.
Комментарии:
Самопомощь по тревоге во время карантина и экономического кризиса...
04 06 2026 5:50:58
Правила преобразования фидов в Google Merchant Center помогут сегментировать товары и сделать вашу рекламу более эффективной...
03 06 2026 22:44:48
Семнадцать крутых шагов к эффективному бренду Заг — это авторский неологизм от слова зигзаг (англ. zigzag). Он подразумевает движение в другом направлении....
02 06 2026 1:48:53
Десять вопросов, которые чаще всего задают люди, столкнувшиеся с необходимостью создания landing page....
01 06 2026 18:38:29
RFM — это аббревиатура слов Recency, Frequency, Money — новизна, частота, деньги. То есть считаем, как давно клиент купил товар в последний раз, сколько всего покупок он сделал и сколько денег принес нам за все время заказов....
31 05 2026 20:19:44
Пример пользовательских отчетов в Google ***ytics, созданных за 15 минут...
30 05 2026 20:36:48
Статья будет полезна небольшим агентствам, которые мечтают работать с заграничными клиентами. Зачем нужно выходить за рубеж, если и в своей стране все идет неплохо, да и вообще — нет времени на продвижение на незнакомом рынке? Давайте разбираться вместе!...
29 05 2026 12:32:46
Об истории и значении поговорок и других фразеологических оборотов...
28 05 2026 8:51:45
Рекламные аукционы Фейсбук заточены поднимать объявление с наивысшей итоговой ценностью — это главное отличие от классических аукционов...
27 05 2026 0:51:33
Языковой закон требует, чтобы общение бизнеса с клиентами шло на украинском языке, если нет просьбы о другом приемлемом варианте. Что это означает для РРС, читайте дальше....
26 05 2026 3:13:50
Инструкция по интеграции рекламной кампании с чат-ботом...
25 05 2026 20:23:15
22 оригинальные гипотезы для A/B-теста сайта, которые чаще всего влияют на получаемую прибыль...
24 05 2026 4:20:57
Кейс — поисковое продвижение блога в нише юридических услуг. Как увеличить количество читателей из поисковых систем и трафик на страницы услуг....
23 05 2026 16:12:13
Каким образом бизнес-модель маркетплейса может помочь увеличить трафик интернет-магазина в целом....
22 05 2026 15:16:11
Продажа климатического оборудования. Кейс о проекте, который продвигался у нас на услуге «продвижение по позициям» и не демонстрировал хороших результатов как по росту трафика, так и по продажам, не смотря на высокие места в выдаче. Узнать больше!...
21 05 2026 3:42:28
Что, если бы покупка в супермаркете происходила так же, как в онлайн-магазине?...
20 05 2026 19:38:47
Что такое App Store optimization и как раскручивать мобильные приложения...
19 05 2026 5:11:36
Отличный способ мотивации, который мы попробовали и вам рекомендуем....
18 05 2026 13:29:45
Как увеличить охват целевой аудитории ресторана или магазина с помощью рекламы на мобильных и сверхточного геотаргетинга...
17 05 2026 22:28:52
Как избежать ошибок при продвижении интернет-магазина с помощью видеоблогеров....
16 05 2026 2:45:11
Как найти релевантный сайт-донор для размещения своей ссылки...
15 05 2026 21:53:24
Как правильно распределить рекламный бюджет? Читайте топ-50 самых дорогих ключевых слов Google Рекламы в Казахстане по версии Serpstat...
14 05 2026 8:54:25
Свежесть и актуальность контента — главные уроки из Google December 2020 Core Update. Почему — читайте в статье....
13 05 2026 11:21:55
Как правильно оформлять свое портфолио, писать сопроводительные письма и делать посты в соцсетях. С помощью простой человеческой адекватности можно выигрывать у 90% других подрядчиков. Как это использовать? Читайте дальше!...
12 05 2026 11:36:59
Разбираемся, как определить самые эффективные источники лидов....
11 05 2026 16:10:50
Какие рассылки можно отправить покупателю, если у вас есть только данные из карточки товара...
10 05 2026 7:18:12
Можно открыть корпоративную почту с использованием собственного сервера для принятия/отправки и с использованием стороннего сервиса от яндекс или гугл...
09 05 2026 4:14:23
Интересный и важный документ, не пропустите. Для ранжирования используется сумма коммерческой и тематической релевантности. Уходя с головой в SEO, многие вебмастера забывают о пользовательских факторах. Узнайте больше об этом!...
08 05 2026 7:50:27
Используем маску ввода для оптимизации сбора телефонных номеров в формах на сайте: кейсы агентства Netpeak...
07 05 2026 22:10:10
Case по продвижению в Instagram. В любой непонятной ситуации — масштабируйте рекламные инструменты...
06 05 2026 8:36:52
Работающие способы повысить эффективность рекламных кампаний...
05 05 2026 9:23:19
Эта история о том, как за два года комплексный подход к поисковому продвижению (SEO на этапе разработке сайта и дальнейшие действия по оптимизации) помог увеличить рост бесплатного трафика на 463% или Что делать, если SEO не приносит результаты сразу...
04 05 2026 1:16:34
Человек скачал ваше приложение, воспользовался им один раз и … забыл. Что с этим делать, читайте в Netpeak Journal....
03 05 2026 0:54:58
Что делать, если вы специально или нет попали под фильтр: руководство от выявления до спасения...
02 05 2026 8:48:24
Данные, приведенные в исследовании, помогут в составлении медиапланов по продвижению в интернете. Понимания стоимость конверсии и необходимое количество конверсий, вы можете прогнозировать, сколько денег на рекламу нужно выделить....
01 05 2026 1:20:59
Как создать портрет покупателя и зачем он нужен бизнесу....
30 04 2026 0:28:33
Девять свежих советов для продвижения интернет-магазинов...
29 04 2026 1:28:40
Как настроить многокaнaльную модель атрибуции для своего бизнеса....
28 04 2026 12:43:44
Четыре важных шага для новичка...
27 04 2026 23:41:19
Как найти тему для поста, который и в онлайн поиске будет хорошо ранжироваться, и по социалкам разойдется, и комментарии в треде обеспечит...
26 04 2026 7:18:30
Менеджер экспортного направления Гугл Украина — об особенностях выхода на рынки разных стран мира....
25 04 2026 0:20:30
Хотите раскрутить свои соцсети в 2022 году? Тогда уже сейчас нужно задуматься, что будете публиковать. В статье расскажем, какой контент будет в тренде в будущем году....
24 04 2026 10:52:52
Личный опыт маркетинг-директора Serpstat. Внутренняя перелинковка, работа с контентом, настройка email-рассылок и построение качественного комьюнити помогли нам получить стабильный поток читателей и новых пользователей. Обо всем читайте дальше!...
23 04 2026 6:45:52
Если вы автор телеграм-канала, то стоит задуматься об альтернативных контент-платформах. Мнение...
22 04 2026 6:37:37
Изучаем на примере тестирования товарных кампаний в момент смены логотипа и ренейминга...
21 04 2026 1:40:37
Как упростить работу со скриптами на языке R? Программирование удобного интерфейса с помощью пакета «gWidgets»...
20 04 2026 15:54:15
Как за полгода обновить корпоративный блог, зачем это может быть нужно. О том, как начинали с сегментации, внедряли SEO-рекомендации, оптимизировали ЧПУ, трaнcлитерацию, пагинацию и структуру блога вплоть до конкретной работы со статьями, рейтингами и их страницами...
19 04 2026 23:28:58
Данные по 43 миллионам кликов в 27 тематиках и 391 городах страны...
18 04 2026 2:58:32
При выборе SEO сервиса принято ориентироваться на объем ссылочной массы, но надежен ли такой подход? Большая база не всегда значит качество содержащихся в ней данных, а количество нередко обеспечивают спамные ссылки в отчетах....
17 04 2026 19:14:32
В основе каждой великой компании – хорошо рассказанная история....
16 04 2026 11:27:11
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::