Как провести контент-аудит сайта — пошаговое руководство

Как понять, что проект нуждается в новых текстах, а того, что написала дeвoчка с биржи за два косаря, недостаточно для счастья читателя и выхода сайта на первые позиции? Проведите контент-аудит. Прочитав этот текст до конца, вы узнаете как.
- Как найти все страницы без текстов
- Как проверить, есть ли анализируемые страницы в индексе поисковой системы
- Как проанализировать спрос
- Как провести анализ входящего трафика на страницы фильтров
- Как найти страницы с текстами, которые нуждаются в доработке
- Как проверить тексты на сайте
- Как доработать старые тексты
- Выводы
Как найти все страницы без текстов
Речь о всех страницах, включая разделы, категории, подкатегории, страницы фильтров. Если сайт небольшой, страницы без текстов можно найти вручную. В других случаях лучше использовать Netpeak Spider.
Для начала выделим потенциально важные типы страниц — разделы/категории/подкатегории.
Например:
- раздел — https://www.newegg.com/Electronics/Store;
- категория — https://www.newegg.com/Cell-Phones/Category/ID-450?Tid=161569;
- подкатегория — https://www.newegg.com/Tablets/SubCategory/ID-2557?Tid=171661.
Инструменты для парсинга в работе SEO-специалиста С помощью XPath (XML Path Language — язык запросов к элементам XML-документа) спарсим все аналогичные типы страниц. Читайте подробно,
Находясь на главной странице, кликаем правой кнопкой мыши по первому разделу и нажимаем «Просмотреть код»:
Находим блок со всеми URL-адресами разделов, категорий, подкатегорий:
Копируем путь к этому блоку:
Чтобы спарсить только ссылки, к результату нужно добавить //@href, то есть в итоге получается:
//*[@id=\"main-nav-menu-list\"]//@hrefЭто и есть наш XPath, его нужно сохранить. Для проверки корректности результата можно использовать браузерное расширение XPath Helper в Chrome.
Теперь можно скопировать список всех URL:
И почистить список от дублей и лишних страниц. Например, нужно удалить URL других сайтов:
Теперь необходимо найти XPath для текстов на всех страницах, так как он может быть разным для отдельных типов страниц.
В зависимости от типа страницы, путь может меняться, поэтому нужно проверить все страницы.
Для этого открываем Netpeak Spider и выбираем способ сканирования «По списку URL»:
Добавляем XPath в настройки:
Добавляем список наших URL и запускаем сканирование:
В самом крайнем столбике (справа) будет выводиться статус присутствия текста на странице:
После того как все страницы будут просканированы, можем выгрузить все страницы без текстов, выполнив сортировку. Страницы без текстов отмечены нулем:
Также можно воспользоваться фильтром:
Важно: все анализируемые страницы должны возвращать код ответа 200.
Допустим, в списке встретились URL-адреса с редиректами:
В таком случае укажите конечные URL и пересканируйте страницы заново:
Как проверить, есть ли анализируемые страницы в индексе
Необходимо убедиться, что анализируемые страницы есть в индексе поисковых систем. Если поисковик уже добавил страницу в индекс, то с большей вероятностью будет ее ранжировать в результатах поиска.
Отмечу, что описанный в данном разделе метод подходит для страниц фильтров и других посадочных под средне- и низкочастотные запросы.
Откроем Netpeak Checker и добавим туда список наших адресов:
Выбираем: «Google SERP» — «Индексация»:
Берем в работу страницы со статусом «True», со статусом «False» — отбрасываем:
Со страницами, которых нет в индексе, мы также будем работать. Просто на данном этапе это не в приоритете, к ним можно вернуться позже.
Важно учитывать индивидуальные особенности каждого сайта. То есть причин плохой индексации может быть множество. Например, неуместное использование метатега , HTTP заголовок X-Robots-Tag: noindex, неверно указанные директивы в файле robots.txt, низкое качество контента на странице, высокий уровень вложенности и так далее.
Как проанализировать спрос
Метод не очень точный, но для быстрого анализа подойдет.
Открываем Netpeak Checker, выбираем параметры: «On-Page» — «значение h1» и выгружаем все заголовки h1 наших страниц:
Включаем сканирование и копируем все заголовки h1:
Пробиваем частотность с помощью Планировщика ключевых слов Google. Чтобы ключи были более коммерческими, добавим в начало фразы «buy».
Важно анализировать частотность на вкладке «Планирование бюджета и получение прогнозов». При этом необходимо указывать ключевые слова в точном соответствии, добавив квадратные скобки для ключевых фраз:
Экспортируем данные и удаляем фразы без частотностей. Оставляем только нужные столбцы, как на картинке:
После этого сопоставляем заголовки с соответствующими URL-адресами — можно использовать функцию vlookup в таблицах Google.
То есть берем выгруженный список URL-адресов и заголовков h1:
Удаляем «buy» (c пробелом) из списка фраз KeywordPlanner, нажав сочетание клавиш «Ctrl +H» и выбрав диапазон нужного столбца:
Далее на нужной вкладке в столбце «Avg. Monthly Searches» прописываем формулу:
=VLOOKUP(B2;\\\'Keyword Planner \\\'!$2:$172;2;0)
Протягиваем ее вниз и получаем соответствие и частотности искомых ключевых фраз.
Чтобы отсортировать данные по частотности, выделяем столбец с частотностями, нажимаем сочетание клавиш «Сtrl+С» и вставляем столбец на то же место, нажав «Сtrl+Shift+V». Так мы переведем значения в обычный формат.
После этого выделяем столбец с частотностями и выбираем в меню «Данные» — «Сортировать лист по столбцу C, Я-A»:
Получаем таблицу, которая дает ориентировочное представление, какие группы товаров более востребованные.
Как использовать возможности поиска для решения бизнес-задач В Яндексе
Как провести анализ входящего трафика на страницы фильтров
Еще один способ узнать, для каких страниц нужны тексты — проанализировать количество органического трафика, приходящего на конкретную страницу. Для анализа можно использовать Google ***ytics или Яндекс.Метрику.
Смотрим количество органического трафика со страниц входа. В Google ***ytics для этого нужно перейти на: «Источник трафика» — «Каналы» — «Organic Search» — «Страницы входа».
В Яндекс.Метрике нужно пройти по пути: «Стандартные отчеты» — «Содержание» — «Страницы входа»:
Затем следует выбрать сегмент «Поисковый трафик»:
Пример страниц фильтров с достаточно хорошим трафиком:
Конечно, не для всех страниц нужен текстовый контент, но проведя такой анализ, вы получите готовый полигон для экспериментов с текстами.
Как найти страницы с текстами, которые нуждаются в доработке
Проанализируем динамику трафика.
В Google ***ytics переходим по пути: «Источник трафика» — «Каналы» — «Organic Search» — «Страницы входа». Выбираем анализируемый период и сравнить его с предыдущим годом:
Замечаем страницы, трафик на которые сильно просел:
Также смотрим на изменение показателей отказов, страниц за сеанс, средней длительности сеанса Все это — аргументы в пользу оптимизации контента данных страниц.
Если вам ближе Яндекс.Метрика, следуйте по пути: «Стандартные отчеты» — «Содержание» — «Страницы входа». Затем выбираем период и сравниваем.
Важно: анализ будет корректен, только если URL-адрес страницы за выбранный период не менялся.
Как проверить тексты на сайте
Приоритетные страницы, для которых нужны хорошие тексты, определили. Допустим, что на некоторых из них тексты уже есть. Как проверить их качество?
Уникальность текстов должна быть не менее 90%. Можно использовать, например, Advego Plagiatus. Если вы делаете рерайт или темы ваших статей очень похожи, также проверяйте тексты на сайте на схожесть между собой. Вот неплохой сервис: https://utext.rikuz.com.
Допустим, вы делаете описания для похожих моделей телефонов. При трех словах в шингле (фрагменте текста, с которым работает программа проверки уникальности), показатель схожести должен быть не более 10%:
Спамность (плотность) ключевых слов в тексте должна быть не более 3%. Это условный показатель, но на него можно ориентироваться. Проверить вхождение ключевых слов легко с помощью сервиса istio.
Еще один отличный сервис — «Семён-Ядрён» (для регистрации понадобится яндексовская почта). С его помощью удобно проверять работу копирайтеров:
- В колонке «Фразы для поиска» добавляем ключевые фразы, которые вы указывали в техзадании для копирайтера.
- В колонку «Текст или URL:» вставляем написанный текст или адрес страницы.
- Получаем список ключевых слов в тексте.
Оптимальный размер текстов, конечно, отличается от ниши к нише, но недавний эксперимент Алексея Рылко доказывает, что роботы поисковых систем предпочитают тексты объемом более 150 слов. Короткая выдержка из исследования: «Страницы, которые имеют меньше 150 слов текста, краулятся роботом реже всего. А страницы с текстами свыше 1200 слов крауляется в 89% случаев».
Если хотите лучше понять, какого объема тексты вам нужны, можно вручную посчитать объем текстов на релевантных страницах из ТОП-10. Затем рассчитать среднее количество символов и готовить тексты побольше.
Но это, естественно, слишком трудоемкий процесс, если у вас большой проект. В данном случае лучше использовать megaindex — сервис анализирует ТОП-10 по Яндексу/Google, подсчитывая средний объем текстов по заданному региону.
Этот сервис бесплатный, а вот аналог от Seolib обойдется в копеечку.
Алгоритм действий аналогичен:
- Нужно добавить анализируемую ключевую фразу.
- Выбрать регион.
- Поставить галочку рядом со строкой «Объем текста в словах и символах».
- Поставить галочку рядом со строкой «Всю страницу».
Результат:
Еще одна программа — Ultimate Keyword Hunter — позволяет анализировать объем контента по ТОПу.
Единственный минус — нельзя выгрузить данные об объеме символов.
Инструмент анализа текстовой релевантности от Serpstat в частности позволяет узнать необходимый размер текста на основании анализа конкурентов. Кроме того, сервис предоставляет данные о релевантности и коэффициенте штиля анализируемых ключевых фраз и дает рекомендации по использованию важных ключевых слов в title, h1 и самом тексте.
Также хорошие результаты дает совмещение двух инструментов: Key Collector (для Яндекса, при анализе до 50 фраз, можно использовать arsenkin.ru) и Netpeak Checker.
Алгоритм действий:
- Добавляем максимально релевантные ключевые фразы в Key Collector:
- Определяем регион:
- Идем по пути: «SERP» — «Получить данные для ПС Google»:
- Экспортируем данные:
Получается такой отчет.
- Добавляем в Netpeak Checker список найденных URL из ТОПа.
Важно, чтобы URL были конечные, то есть возвращали код ответа 200, иначе Checker не выгрузит количество символов.
- Напротив строки «Количество символов» ставим галочку:
Получаем такой отчет.
После этого следует сопоставить полученные данные с нашим списком URL-адресов по ТОПам.
В документе сопоставим основной список ключей и URL с количеством символов. Для этого используем все ту же функцию vlookup в таблицах Google.
Посчитаем среднее количество символов в ТОП-10 по каждому запросу — для этого нужно использовать функцию =AVERAGE()
Чтобы сосчитать для всех строк, нужно выделить первые десять строк, а затем протянуть курсор вниз до конца списка.
Так же можно находить самые большие тексты и стараться сделать их еще длиннее.
С помощью сочетания клавиш Ctrl+H удаляем из ключевых фраз «buy» с пробелом.
Затем копируем все полученные данные в таблицу с общим списком URL категорий (вставлять данные следует с помощью CTRL+SHIFT+V). И опять с помощью функции =VLOOKUP сопоставляем среднее количество символов с названиями категорий:
В итоге получается такая таблица.
Оформление текста так же важно для оптимизации страницы. Следует учесть технические рекомендации:
1. Не должно быть слишком много ключевых слов, выделенных полужирным (тегами , ):
2. В тексте присутствуют подзаголовки h1, h2...h6.
3. Все списки размечены корректно. Пример некорректной разметки (без и
):
4. Текст желательно не скрывать:
Скрытый текст весит меньше для поисковых роботов Google
Как доработать старые тексты
Если у вас информационный ресурс, алгоритм реанимации контента хорошо представлен в этой презентации:
Что делать со старыми статьями в блоге Часть этих советов представлена в материале
Дооптимизация текстов на страницах товаров
Повышением информативности страниц товаров на сайтах интернет-магазинов обычно занимаются в последнюю очередь (или вообще за это не берутся). Часто оправданно, так как описания одинаковых товаров на сайтах похожи друг на друга.
Чтобы сделать уникальные описания, добавьте к названию товара «отзывы» и введите полученную комбинацию в поисковик. Затем выберите страницы с отзывами. Их легко найти по микроразметке:
Скопируйте полностью все отзывы со страницы и вставьте их в сервис istio.
После этого нужно найти тематические слова, которые часто встречаются в тексте описания:
На сайте с отзывами ищем предложения/вопросы с этими словами:
Видим, что многие интересуются вопросом расширения оперативной памяти на ноутбуке. Соответственно, в описании товара на сайте добавляем информацию о возможностях расширения оперативной памяти.
Отзывы можно использовать и для определения ключевых достоинств и недостатков товара/услуги. Отличная площадка для этого — Яндекс.Маркет:
1. Находим отзывы о товаре на сайте.
2. Копируем весь текстовый контент из графы «Достоинства»:
3. Определяем частотность слов/фраз и составляем список всех достоинств/недостатков продукта.
Используйте мощь пользовательского контента. Бесплатная идея:
Слишком бaнaльно? Ok. Как насчет того, чтобы выводить на странице товара блок с превью информационных статей по заданной теме вместо стандартного текста:
Или, например, показывать отзывы на страницы категорий:
На самом деле все средства хороши, чтобы посетители вашего сайта как можно быстрее нашли желаемое. Так что главный совет: пишите так, чтобы читатели были счастливы.
Выводы
1. Создавать простыни текста важно далеко не во всех нишах и не для каждого бизнеса. Изучайте тематику, анализируйте старые тексты. Легче переписать и дооптимизировать их, чем подготовить ворох новых материалов и неожиданно попасть под «Баден-Баден» из-за некачественных старых статей. В результате вы потратите гораздо больше времени для поиска текстов, из-за которых сайт оказался под санкциями.
2. При поиске страниц, для которых нужны тексты, используйте автоматизированные инструменты. Это значительно сэкономит время.
3. Периодически проводите дооптимизацию существующих статей: исправляйте ошибки, следите за структурой, спамностью, дополняйте текст упущенными ключевыми фразами.
4. Ищите альтернативные способы создания контента: проводите статейные конкурсы, предлагайте скидки за отзывы.
Думаете, на этом контент-аудит завершен? Как бы не так: впереди еще составление техзадания для копирайтеров и комплекс мероприятий по анализу сети для выявления плагиаторов и защиты от них. Но это уже темы для отдельных статей.
Комментарии:
«Что такое диджитал и чем это отличается от услуги продвижения в социальных сетях» — о цифровой стратегии, креативных концепциях и том, как это все происходит в крупных агентствах....
16 04 2026 13:37:13
Что нужно делать на старте работ с интернет-магазином и как минимизировать риски для бизнеса онлайн, используя такие инструмента как SEO, PPC и Email-маркетинг — советы от эксперта. Читать дальше!...
15 04 2026 6:27:27
Главная цель инфлюенс-маркетинга — теплый и близкий контакт с аудиторией. Клиентам нравится ассоциировать продукты с живыми, знакомыми им людьми — пускай и только по интернету. Читать дальше....
14 04 2026 23:46:34
UTM-метки позволяют эффективно отслеживать источники трафика. Но составлять их нужно правильно. Как именно, давайте разбираться....
13 04 2026 17:51:32
Фильтруем свой трафик от сотрудников в Google ***ytics...
12 04 2026 4:40:48
Небольшая wiki о программатик-баинг и RTB. Объяснение алгоритма, обзор рынка, мнения экспертов....
11 04 2026 10:40:59
И чем этот тип отслеживания событий отличается от Client-side. Узнать!...
10 04 2026 21:37:51
История от первого лица про звуковые сигналы в Facebook....
09 04 2026 4:15:56
Рост дохода в шесть раз, ROMI +500% за пять месяцев....
08 04 2026 23:26:36
Простая инструкция для новичков, как легко создать анимированные баннеры для рекламных кампаний с помощью бесплатного инструмента Google Web Designer. При создании баннера сервис предложит создать файл с нуля либо использовать шаблон. Узнайте обо всех возможностях!...
07 04 2026 1:46:34
Знания основных принципов конверсионности сайта, этапов воронки продаж важны для того, чтобы наладить процессы, рост продаж в любом бизнесе. Узнать больше!...
06 04 2026 4:20:12
Контекстная реклама и ее эффективность: как долго длится, как измерить, что бывает, как заканчиваются деньги....
05 04 2026 23:40:10
Если вы автор телеграм-канала, то стоит задуматься об альтернативных контент-платформах. Мнение...
04 04 2026 20:13:37
Мы восстановили репутацию и повысили рейтинг домена за три месяца....
03 04 2026 5:52:29
Чат-боты упрощают процесс покупки продуктов онлайн. Netflix, Adidas, British Airways и другие крупные компании уже внедрили ботов в свои маркетинговые системы. Так ли это эффективно, если компании начинают отказываться от операторов в пользу ботов?...
02 04 2026 13:16:56
Как пользоваться «Совмещением данных» с учетом всех особенностей инструмента...
01 04 2026 17:45:49
Цели у личных сайтов могут быть разные, но в первую очередь они помогают рассказать историю о специалисте...
31 03 2026 1:23:12
Выдержка из интервью Дэнни Салливаном с представителями компаний Google и Bing...
30 03 2026 10:23:28
Как найти и быстро исправить причины падения трафика? Совет номер один — не паниковать....
29 03 2026 9:27:24
Собирательный опыт сотрудников Netpeak. Мы изучали много всего в стиле «купить парковку в аэропорту Гатвика в Лондоне» и тому подобное. Но все, кроме описанного ниже, показалось сложным и ненадежным. Поэтому рассказываем про спокойные варианты....
28 03 2026 9:31:40
Как с помощью рекламы в Apple Search Ads получить дешевые установки и привлечь релевантных пользователей среди владельцев айфонов...
27 03 2026 10:33:28
Распространенные ошибки продвижения B2B-компаний + стратегии того, как наращивать число активных подписчиков и потенциальных клиентов....
26 03 2026 8:14:12
Зачем амбициозным онлайн-проектам индивидуальные инструменты веб-аналитики....
25 03 2026 5:25:39
Как эффективно выйти из карантина с помощью контекстной рекламы...
24 03 2026 9:49:34
Делаем первые шаги к созданию системы email-коммуникаций бренда....
23 03 2026 23:58:38
Как пользоваться выбором высокочастотных фраз для метатегов, чисткой мусорных фраз и как расставлять приоритеты для навигационных запросов с указанием определенного направления...
22 03 2026 20:27:42
Обзор полезных сервисов и программ, которые увеличат эффективность работы из дома и улучшат организацию бизнес-комaнды...
21 03 2026 20:23:27
Мы достигли поставленных на старте продвижения целей: вернули потерянный трафик, получили дальнейший рост видимости сайта и увеличили доход....
20 03 2026 23:38:47
Несколько фишек Google Tag Manager, чтобы сделать продвинутые списки ремаркетинга....
19 03 2026 22:41:50
Что постить предпринимателям в соцсетях. Несколько примеров уместной работы SMM- и PR-специалистов, которые прямо и четко помогают озвучить позицию бизнеса в период карантина. Узнайте больше, чем действовать правильно!...
18 03 2026 8:41:29
Крауд-маркетинг предполагает взаимодействие с целевой аудиторией с помощью рекомендательных комментариев на форумах, сайтах вопросов и ответов, в блогах, на других площадках...
17 03 2026 13:30:56
Недавно у нас появился свой генератор мемов :) Во многих компаниях смешные слова и фразы стараются запомнить и передать следующим поколениям сотрудников. В Netpeak же долго работали над секретным проектом и... Читайте!...
16 03 2026 19:24:12
Уже сейчас в Google Play и App Store миллионы приложений. Как сделать так, чтобы приложение получило достаточное количество установок и приносило доход? Читайте об этом далее и изучайте наглядную инфографику!...
15 03 2026 22:48:16
Распространенные ошибки в XML-фидах Google и Яндекс, CSV-фидах и как исправить их своими силами. Используем Notepad++, отладчик ленты Facebook и Excel. Узнать больше!...
14 03 2026 8:20:13
Инструкция для новичков: как быстро отправить почтовую рассылку клиентам...
13 03 2026 13:39:52
Продолжаем уроки по Google ***ytics для новичков. Сегодня рассмотрим основные моменты, касающиеся отчетов....
12 03 2026 7:50:44
Facebook + Instagram, Business Manager + основная бизнес-страница на Facebook, BM + рекламный аккаунт и так далее....
11 03 2026 10:50:40
Что нового, Netpeak? Новые стратегии контекстной рекламы и email-маркетинга, новая рубрика в блоге, а также о специфике работы отдела продаж Netpeak в карантин и о законах построения партнерской программы — всё читайте в материале!...
10 03 2026 4:25:21
Оставить заявку на горячей линии МОЗ — это только вершина айсберга. Необходимо провести опрос среди сотрудников компании. И не один. А ещё подготовить несколько помещений для вакцинации и отдыха. Узнать больше!...
09 03 2026 5:44:34
Работа велась с конца августа прошлого года до конца декабря и включила в себя анализ рынка, конкурентов, целевой аудитории, поиск инсайта, разработку стратегии, подготовку медиаплана, создание промо-сайта и само проведение рекламной кампании, в котором б...
08 03 2026 9:26:11
Междугородние перевозки и их реклама. Кейс Павла Верлана...
07 03 2026 16:33:15
Возможно, вы купили обувь Intertop именно после просмотра нашей рекламы....
06 03 2026 21:52:48
Благодаря внедрению интеpaктивной формы подписки увеличили количество ежемecячных подписок на 100%, доход — на 51%, а коэффициент транзакций — на 71%....
05 03 2026 20:29:27
Впереди ещё черная пятница и новогодние праздники. И успех массовых распродаж можно повторить....
04 03 2026 12:28:25
Список курсов, книг, каналов и пабликов для работы с данными...
03 03 2026 6:32:35
Как купить дешевый трафик из Facebook? Образец работы со структурой рекламного аккаунта...
02 03 2026 21:28:17
Краткая инструкция для новичков. Структура сайта, внутренняя перелинковка, юзабилити, контент, оптимизация тегов и заголовков, HTTPS, скорость загрузки сайта, mobile friendly и другие. Узнать больше!...
01 03 2026 2:46:17
Как борьба с зарплатным неравенством становится трендом...
28 02 2026 16:17:24
Блог на новом движке и с новым дизайном, перетянувший в себя огромное количество постов и комментариев за Х лет своей работы...
27 02 2026 11:23:38
От создания аккаунта до выбора пикселя — просто и понятно про TikTok....
26 02 2026 6:47:25
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::