Как быстро собрать данные из блока People also ask в Google

Всем привет, меня зовут Евгений, я SEO-специалист компании FINOTEC. Сегодня я расскажу, как автоматизировать сбор данных из блока People also ask (Пользователи также ищут). Это блок, который показывается в верхней части страницы результатов поиска. Он нужен, чтобы уточнить запрос пользователя. Отображение этого блока начали тестировать в поисковой системе Google в 2015 году.
People also ask
SEO-специалистам этот блок может быть интересен для решения двух задач:
- Улучшение структуры статей: охват большего количества подтем.
- Идеи для новых статей.
Чтобы собрать список запросов, по которым показывается этот блок, и спарсить информацию, я использовал инструменты: Serpstat, Notepad++, Screaming Frog SEO Spider и разделил работу на четыре этапа.
Как собрать запросы?
Инструмент: SerpstatПример запроса: what is cto
Вводим свой запрос и выбираем регион.
Переходим к списку всех запросов по кнопке «Показать все».
Фильтруем результаты: Фильтр — Наличие элементов в выдаче — Содержит — Связанные вопросы — Применить.
Экспортируем данные.
Список запросов, который мы получили:
Подготовка
Инструменты: Notepad++.Формируем список URL для парсинга по шаблону https://www.google.com/search?q=[ваш+запрос]&hl=[язык]&gl=[ЛОКАЛЬ]. Например. Сделать это в Notepad++ можно в три этапа.
- Найти знак пробела ( ) и заменить на плюс (+).
- Найти начало строки (^) и заменить на: https://www.google.com/search?q=.
Важно: Должны быть включены «Регулярные выражения».
- Найти конец строки ($) и заменить на &hl=[язык]&gl=[ЛОКАЛЬ] (в моем примере: &hl=en&gl=US).
Важно: Должны быть включены «Регулярные выражения».
Получили список:
- https://www.google.com/search?q=what+is+a+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+of+a+company&hl=en&gl=US
- https://www.google.com/search?q=what+is+ctos&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+salary&hl=en&gl=US
- https://www.google.com/search?q=what+is+the+role+of+a+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+in+cardiology&hl=en&gl=US
- https://www.google.com/search?q=what+is+the+meaning+of+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+means&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+filter&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+filter&hl=en&gl=US
Отладка Screaming Frog
Несмотря на типичность задачи, первые попытки спарсить информацию у меня не увенчались успехом. На выходе получал пустой отчет. Поэтому опишу последовательность действий, которая привела меня к желаемому результату. Забегая наперед скажу — проблема заключалась в том, что для User-Agent, установленного в Screaming Frog по умолчанию, этот блок просто не отображался.
Выбираем Mode — List.
Переходим Configuration — Authentication.
Вкладка Forms Based — Add.
Вводим один из сгенерированных нами URL, например: https://www.google.com/search?q=what+is+a+cto&hl=en&gl=US.
Смотрим, как Screaming Frog видит страницу. В данном случае программа не видит нужный нам блок, точнее Google его не показывает.
Пробуем посмотреть под другим User-Agent.
Выбираем из списка. В данном случае мне подошел «Google bot for smartphones (pre April 18th 2016)».
Еще раз проверяем, как Screaming Frog будет видеть страницу, которую мы спарсим.
Парсинг для Screaming frog
Переходим в Configuration — Custom — Extraction.
Указываем, как будем искать элемент на странице (CSSPath, xPath, Regex etc) и нажимаем «Ok».
В данном случае я выбрал такие настройки:
Тип: CSSPath.Селектор: .cUnQKe .ifM9O.
Данные: только текст.
Берем подготовленные нами URL для парсинга.
Вставляем их в программу: Upload — Paste.
Нажимаем «OK».
Смотрим результаты: Custom — Extraction. Экспортируем.
После удаления дублей у нас есть список:
- How can I improve my ctos score?
- How do I register for CTOS?
- How do you use color correction gels?
- How does a GAC filter work?
- How long do charcoal water filters last?
- How much does a startup CTO make?
- What are the duties of a CTO?
- What contaminants do carbon filters remove?
- What does CTO stand for in cardiology?
- What does CTO stand for?
- What does CTO time off mean?
- What does a 5 micron filter remove?
- What does a CTO make?
- What does chronic total occlusion mean?
- What does it take to be a CTO?
- What is CTO gel?
- What is CTO in social media means?
- What is CTO salary?
- What is a CTO of a company?
- What is a CTO salary?
- What is a CTO water filter?
- What is a carbon block filter?
- What is chronic total occlusion of coronary artery?
- What is ctos score Malaysia?
- What is the CTO stand for?
- What is the difference between a CTO and a CIO?
- What is the meaning of CTOS?
- What is the role of a CTO in a company?
- What is the role of a CTO in a startup?
- Which is higher CIO or CTO?
- Who does the CTO report to?
- Why is CTO important?
Осталось удалить нерелевантные результаты, оформить это в статью и опубликовать на блоге Netpeak, всегда так делаю (нет).
Если у вас возникли вопросы, задавайте их в комментариях к посту или лично мне в сообщениях — отвечу.
Мнение авторов гостевых постов может не совпадать с позицией редакции и специалистов агентства Netpeak.
Комментарии:
Фишинговая ссылка означает, что пользователей пытаются ввести в заблуждение в мошеннических целях, имитируя ссылку на авторитетный сайт....
31 05 2026 11:52:10
Как перенести сайт с http на https и сохранить трафик, потратив минимум времени....
30 05 2026 12:23:43
Эти данные пригодятся в составлении медиапланов по продвижению в интернете. Понимания стоимость конверсии и необходимое количество конверсий, вы можете прогнозировать, сколько денег на рекламу нужно выделить. Читать!...
29 05 2026 13:21:31
Как создавать интеpaктивные рассылки-сайты и чем они хороши...
28 05 2026 18:25:45
И как проверить релевантность на своем сайте. Если речь идет о страницах (сайтах), подразумевается соответствие контента запросу. Чем точнее страница отвечает на запрос, решает задачу пользователя, тем (при прочих равных) выше ее позиция в поисковой выдаче....
27 05 2026 6:11:10
Как считать конверсии из Facebook, когда они происходят в Jivosite и Битрикс24....
26 05 2026 23:31:53
Страховка, медицина, корпоративы, английский и оплата спортзала — знакомые плюшки IT-компаний. В этом материале читайте про редкие и необычные бонусы, которые предоставляются в некоторых IT-компаниях Украины....
25 05 2026 0:59:20
Разработка, вёрстка и оптимизация мобильных версий сайтов — популярные темы последнего времени. Мы расскажем, что стоит и что не стоит делать в мобильном SEO....
24 05 2026 3:33:45
Крауд-маркетинг предполагает взаимодействие с целевой аудиторией с помощью рекомендательных комментариев на форумах, сайтах вопросов и ответов, в блогах, на других площадках...
23 05 2026 21:40:33
Почему соотношение данных об использовании приложения важнее, чем количество установок и удалений...
22 05 2026 16:31:45
Мы восстановили репутацию и повысили рейтинг домена за три месяца....
21 05 2026 23:35:15
Оплата покупок в Facebook и Instagram через платежные ссылки...
20 05 2026 13:44:55
Как с помощью ботов ControllerBot и BotFather упростить управление каналами и разнообразить контент....
19 05 2026 22:17:45
Семнадцать крутых шагов к эффективному бренду Заг — это авторский неологизм от слова зигзаг (англ. zigzag). Он подразумевает движение в другом направлении....
18 05 2026 0:41:23
Свежесть и актуальность контента — главные уроки из Google December 2020 Core Update. Почему — читайте в статье....
17 05 2026 2:43:36
Персональный чек-лист автора десятков рассылок: три года опыта и регулярное общение с техподдержкой почтовых сервисов. Всё о том, как не попасть в спам и как из него спасаться. А может и не всё. Можете дополнить этот пост своими фишками? Делитесь!...
16 05 2026 0:14:10
Дублирование контента на разных сайтах, ориентированных на рынки разных стран, например, на публику Канады...
15 05 2026 13:22:52
Технологии решают, но не всегда....
14 05 2026 21:21:13
Наш результат ведения рекламных кампаний в Facebook показывает, что при правильно подобранной стратегии можно даже за короткий период в авральном режиме попасть точно в цель...
13 05 2026 22:13:20
Не все события удобно отслеживать в Google ***ytics, иногда удобнее сделать связку с таблицами Google. А поможет в этом Google Tag Manager...
12 05 2026 11:30:56
Об истории и значении поговорок и других фразеологических оборотов...
11 05 2026 13:31:39
Как избежать скликивания, случайных переходов и «пустых» установок при рекламе мобильного приложения...
10 05 2026 3:23:29
Пора сделать так, чтобы мобильная версия сайта приносила прибыль....
09 05 2026 14:24:57
Наш обзор кинофильма «Социальная сеть» про Facebook и Марка Цукерберга....
08 05 2026 8:24:20
2 любопытные истории и 8 успешных стартапов, которые вас удивят....
07 05 2026 2:36:42
Какие типы звонков отслеживаются? Есть ли интеграция с Google ***ytics? Существуют ли в выбранном сервисе или на платформе инструменты интеграции с другими системами? Больше вопросов и ответов на них — в статье....
06 05 2026 0:51:27
Почти 3 миллиона клика в 24 тематиках в 15 городах Казахстана. Читайте новое исследование нашего аналитика....
05 05 2026 20:51:10
Ошибка на странице 404 может выглядеть креативно. Страница не найдена и не может быть найдена, потому что она в розыске, утеряна, украдена ниндзей, путь заснежен и дороги дальше нет, а принцесса находится в другом замке. О чем это?...
04 05 2026 18:22:42
Увлекательные истории от специалиста по контекстной рекламе....
03 05 2026 16:19:34
Кейсы с наибольшим количеством комментариев, репостов, оценок и дочитываний; по контекстной рекламе, поисковому продвижению, аналитике, SMM и другие. Узнать больше!...
02 05 2026 9:27:15
Зеркалами считаются сайты с разными доменными именами, но идентичным контентом...
01 05 2026 19:25:32
Виктория Игнатьева рассказала про опыт обучения на наших курсах....
30 04 2026 21:11:22
Список курсов, книг, каналов и пабликов для работы с данными...
29 04 2026 2:50:47
Полезные советы для тех, кто делает контекст своими ручками :)...
28 04 2026 22:21:57
Лучшие плагины WordPress для SEO и продвижения сайта в поисковой системе Google и 10 советов для WordPress, которые помогут вам продвигать свой сайт...
27 04 2026 0:36:38
Создатели алгоритмов соцсетей используют слабые места человеческого мозга. Случайно или намеренно, но они это делают. Как нам с этим жить?...
26 04 2026 16:24:11
Исследование Ringostat о самых востребованных CRM-системах в США...
25 04 2026 7:35:38
Данные по более 26 млн кликов в 23 тематиках и 402 городах Украины...
24 04 2026 6:20:38
Как правильно читать отчеты в Панели вебмастеров Google — объясняем на примерах из пpaктики....
23 04 2026 20:51:52
Алгоритм настройки и запуска рекламы для SMM-, PPC-специалистов, блогеров и владельцев бизнеса....
22 04 2026 18:54:23
Старт любых активностей в сфере email-маркетинга — разработка стратегии...
21 04 2026 4:42:23
Чтобы сделать что-то лучше, иногда надо довести это до абсурда. Так думают приверженцы теории «странных изделий» — chindogu...
20 04 2026 22:39:59
Считаем SEO-эффект от нового дизайна сайта и работы над usability...
19 04 2026 14:34:47
Идея, напечатанная в 3Д? Уже сегодня маркетологи могут это делать с успехом. Главное — поменять свой стиль мышления....
18 04 2026 20:21:15
Результаты рейтинга зарплат интернет-маркетологов....
17 04 2026 10:31:54
Примерно 70% конверсий происходит за счет дополнительных источников, их ценность отражается в GA. Разбираемся, какие отчеты использовать для анализа и оценки таких источников. Читайте далее!...
16 04 2026 3:13:26
Ноу-хау, интересные для бизнеса, которые вошли в ежегодный рейтинг журнала Time....
15 04 2026 12:34:25
Email-маркетинг — хороший полицейский, спам — плохой....
14 04 2026 16:33:22
Наличие или отсутствие в карточках отзывов о товарах интернет магазина сказывается на продажах, а также оказывает влияние на SEO. Об этом, а также о пользе автоматизированного сбора отзывов о товарах мы расскажем в этой статье....
13 04 2026 15:50:26
Новая партнерская программа Netpeak agency. Как получить теплого лида, стабильный пассивный доход, разместить свой логотип и ссылку на сайт на сайте Netpeak и другие бонусы партнерской программы. Узнать больше!...
12 04 2026 20:20:54
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::