Как быстро собрать данные из блока People also ask в Google

Всем привет, меня зовут Евгений, я SEO-специалист компании FINOTEC. Сегодня я расскажу, как автоматизировать сбор данных из блока People also ask (Пользователи также ищут). Это блок, который показывается в верхней части страницы результатов поиска. Он нужен, чтобы уточнить запрос пользователя. Отображение этого блока начали тестировать в поисковой системе Google в 2015 году.
People also ask
SEO-специалистам этот блок может быть интересен для решения двух задач:
- Улучшение структуры статей: охват большего количества подтем.
- Идеи для новых статей.
Чтобы собрать список запросов, по которым показывается этот блок, и спарсить информацию, я использовал инструменты: Serpstat, Notepad++, Screaming Frog SEO Spider и разделил работу на четыре этапа.
Как собрать запросы?
Инструмент: SerpstatПример запроса: what is cto
Вводим свой запрос и выбираем регион.
Переходим к списку всех запросов по кнопке «Показать все».
Фильтруем результаты: Фильтр — Наличие элементов в выдаче — Содержит — Связанные вопросы — Применить.
Экспортируем данные.
Список запросов, который мы получили:
Подготовка
Инструменты: Notepad++.Формируем список URL для парсинга по шаблону https://www.google.com/search?q=[ваш+запрос]&hl=[язык]&gl=[ЛОКАЛЬ]. Например. Сделать это в Notepad++ можно в три этапа.
- Найти знак пробела ( ) и заменить на плюс (+).
- Найти начало строки (^) и заменить на: https://www.google.com/search?q=.
Важно: Должны быть включены «Регулярные выражения».
- Найти конец строки ($) и заменить на &hl=[язык]&gl=[ЛОКАЛЬ] (в моем примере: &hl=en&gl=US).
Важно: Должны быть включены «Регулярные выражения».
Получили список:
- https://www.google.com/search?q=what+is+a+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+of+a+company&hl=en&gl=US
- https://www.google.com/search?q=what+is+ctos&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+salary&hl=en&gl=US
- https://www.google.com/search?q=what+is+the+role+of+a+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+in+cardiology&hl=en&gl=US
- https://www.google.com/search?q=what+is+the+meaning+of+cto&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+means&hl=en&gl=US
- https://www.google.com/search?q=what+is+cto+filter&hl=en&gl=US
- https://www.google.com/search?q=what+is+a+cto+filter&hl=en&gl=US
Отладка Screaming Frog
Несмотря на типичность задачи, первые попытки спарсить информацию у меня не увенчались успехом. На выходе получал пустой отчет. Поэтому опишу последовательность действий, которая привела меня к желаемому результату. Забегая наперед скажу — проблема заключалась в том, что для User-Agent, установленного в Screaming Frog по умолчанию, этот блок просто не отображался.
Выбираем Mode — List.
Переходим Configuration — Authentication.
Вкладка Forms Based — Add.
Вводим один из сгенерированных нами URL, например: https://www.google.com/search?q=what+is+a+cto&hl=en&gl=US.
Смотрим, как Screaming Frog видит страницу. В данном случае программа не видит нужный нам блок, точнее Google его не показывает.
Пробуем посмотреть под другим User-Agent.
Выбираем из списка. В данном случае мне подошел «Google bot for smartphones (pre April 18th 2016)».
Еще раз проверяем, как Screaming Frog будет видеть страницу, которую мы спарсим.
Парсинг для Screaming frog
Переходим в Configuration — Custom — Extraction.
Указываем, как будем искать элемент на странице (CSSPath, xPath, Regex etc) и нажимаем «Ok».
В данном случае я выбрал такие настройки:
Тип: CSSPath.Селектор: .cUnQKe .ifM9O.
Данные: только текст.
Берем подготовленные нами URL для парсинга.
Вставляем их в программу: Upload — Paste.
Нажимаем «OK».
Смотрим результаты: Custom — Extraction. Экспортируем.
После удаления дублей у нас есть список:
- How can I improve my ctos score?
- How do I register for CTOS?
- How do you use color correction gels?
- How does a GAC filter work?
- How long do charcoal water filters last?
- How much does a startup CTO make?
- What are the duties of a CTO?
- What contaminants do carbon filters remove?
- What does CTO stand for in cardiology?
- What does CTO stand for?
- What does CTO time off mean?
- What does a 5 micron filter remove?
- What does a CTO make?
- What does chronic total occlusion mean?
- What does it take to be a CTO?
- What is CTO gel?
- What is CTO in social media means?
- What is CTO salary?
- What is a CTO of a company?
- What is a CTO salary?
- What is a CTO water filter?
- What is a carbon block filter?
- What is chronic total occlusion of coronary artery?
- What is ctos score Malaysia?
- What is the CTO stand for?
- What is the difference between a CTO and a CIO?
- What is the meaning of CTOS?
- What is the role of a CTO in a company?
- What is the role of a CTO in a startup?
- Which is higher CIO or CTO?
- Who does the CTO report to?
- Why is CTO important?
Осталось удалить нерелевантные результаты, оформить это в статью и опубликовать на блоге Netpeak, всегда так делаю (нет).
Если у вас возникли вопросы, задавайте их в комментариях к посту или лично мне в сообщениях — отвечу.
Мнение авторов гостевых постов может не совпадать с позицией редакции и специалистов агентства Netpeak.
Комментарии:
Зачем внедрять BI-решение для бизнеса, какие функции отдел может решить с помощью автоматизации? Кейс Netpeak....
09 05 2026 12:52:33
Словарь, которым пользуются SEO-специалисты агентства Netpeak...
08 05 2026 3:59:46
Многие не догадываются о том, что в КМС Google можно разместить и редактировать графические объявления онлайн...
07 05 2026 12:36:23
Facebook + Instagram, Business Manager + основная бизнес-страница на Facebook, BM + рекламный аккаунт и так далее....
06 05 2026 14:48:25
Как построить самостоятельную комaнду и научиться спокойно делегировать...
05 05 2026 19:21:47
Как борьба с зарплатным неравенством становится трендом...
04 05 2026 15:58:10
Можно открыть корпоративную почту с использованием собственного сервера для принятия/отправки и с использованием стороннего сервиса от яндекс или гугл...
03 05 2026 6:51:28
Как создавать интеpaктивные рассылки-сайты и чем они хороши...
02 05 2026 21:55:48
Почему популярность электромобилей растет и как это связан с продажей углеродных квот...
01 05 2026 18:43:50
Самопомощь по тревоге во время карантина и экономического кризиса...
30 04 2026 5:38:53
Грамотный контент важен для всех, но особенно — для аутсорсов и стартапов в B2B. Если вы согласны с этим, давайте делать медиа....
29 04 2026 22:52:49
Как и кто создает новые услуги в Netpeak и что нужно знать, уметь, чтобы это делать? Рассказывает Елена Воскобойник, специалист, которая иногда разpaбатывает их почти с нуля. Читать!...
28 04 2026 23:35:44
Помимо полезного и качественного продукта, услуги, компании нужен мощный маркетинг. И возможно это только благодаря хорошему директору по маркетингу. Только так это работает. Кто лучшие в этой нише в Казахстане? Узнать!...
27 04 2026 11:32:11
Все дело в формате объявлений Instant Experience с подключенным каталогом товаров. Нет, не только в нем. Узнать больше!...
26 04 2026 0:15:12
В статье рассказываем, какие бывают push-уведомления, когда их используют, даем чек-лист и пошаговую инструкцию по созданию успешной push-рассылки....
25 04 2026 16:31:55
Наш результат ведения рекламных кампаний в Facebook показывает, что при правильно подобранной стратегии можно даже за короткий период в авральном режиме попасть точно в цель...
24 04 2026 3:32:47
кмс Google: как достичь поставленной цели с помощью рекламы? Делимся советам по настройке КМС-кампаний....
23 04 2026 3:28:23
Как Netpeak работал с сайтом филиала крупного бренда и добился результатов, несмотря на то, что сервера проекта находятся в другой стране....
22 04 2026 6:28:18
О работе, креативности, мотивации и многом другом....
21 04 2026 8:57:48
Определение и настройка главного зеркала сайта в поисковых системах — первое, что нужно сделать перед раскруткой сайта...
20 04 2026 15:11:33
Сегодня мы открываем новую регулярную серию постов, в которых будем стараться раз в квартал рассказывать про семь важных улучшений Netpeak в работе с клиентами. Сейчас мы максимально сфокусированы на SEO и PPC....
19 04 2026 12:15:12
Кратко об аутрич-продвижении? Размещайте полезный контент с ссылками на ваш сайт на качественных ресурсах. Хотите подробности — читайте новую статью....
18 04 2026 10:18:23
Новости для наших существующих и потенциальных клиентов....
17 04 2026 18:59:41
Инструкция по технической подготовке к продвижению...
16 04 2026 0:39:25
Знакомство с реальным и потенциальным клиентом. Как создать доверительные отношения? Для этого понадобится сделать сегментацию аудитории и определить, кто ваш покупатель: от рода занятий, до его самых сокровенных страхов. Узнайте больше!...
15 04 2026 9:24:35
Четкая структура полноценного письма с примерами из рассылок крупных компаний: Aviasales, LinguaLeo, Rozetka, Yves Rocher, Pich Shop, Эльдорадо и другие....
14 04 2026 4:50:40
Как добиться эффективности и самоорганизации. Читайте о системе тимлида Netpeak Андрея Коваля....
13 04 2026 1:49:42
Несколько фишек Google Tag Manager, чтобы сделать продвинутые списки ремаркетинга....
12 04 2026 9:22:44
Cтоимость просмотра в Google Ads дешевле как минимум в два раза по сравнению со Smart TV...
11 04 2026 13:35:27
У каждого сайта в топе есть страница, о существовании которой знают только роботы и... SEO-специалисты. Это robots.txt или индексный файл....
10 04 2026 8:24:17
Как эффективно выйти из карантина с помощью контекстной рекламы...
09 04 2026 10:27:37
Советы и даже требования SEO-специалистов к разработчикам сайтов....
08 04 2026 12:53:14
Как сделать рекламу в Universal App Campaign 2.0 максимально эффективной...
07 04 2026 1:46:36
Про работу мозга и запоминание из книги Торкеля Клинберга «Информационный поток и пределы рабочей памяти» и обзор игр Lumosity....
06 04 2026 5:25:41
Что значит всемирное обновление DMCA-алгоритма и приведет ли оно к полноценной защите авторских прав?...
05 04 2026 13:41:31
Кейс SEO-продвижения в США: рост трафика сайта с помощью низкочастотных запросов....
04 04 2026 22:45:17
Для работы в интернет-маркетинге нужно хорошо разбираться в аналитике. Рассмотрим, как использовать в работе Google ***ytics 4 и чем он отличается от Universal...
03 04 2026 3:17:20
Как операторы поисковых запросов Google помогают при продвижении сайта и анализе конкурентов....
02 04 2026 2:57:59
Мануал по созданию удобного планировщика повторяющихся действий....
01 04 2026 4:11:10
Инструменты веб-мастера: что может заменить Google ***ytics?...
31 03 2026 1:25:31
Руководство к действию от основателя Netpeak Group....
30 03 2026 23:44:14
Чтобы обезопасить себя и своих клиентов, используйте технологию 3D Secure. Больше рекомендаций — в статье....
29 03 2026 12:32:10
Когда и зачем нужно заказывать сбор семантического ядра, на какие этапы разбит процесс и какие результаты можно получить...
28 03 2026 12:59:47
Большинство рекламодателей знают и используют только 4-5 видов таргетинга, а остальные оставляют без внимания. А ведь правильно подобранная аудитория — это один из залогов успеха рекламной стратегии. Поэтому обязательно тестируйте новые таргетинги...
27 03 2026 5:23:12
И чем этот тип отслеживания событий отличается от Client-side. Узнать!...
26 03 2026 2:17:18
Возможности и перспективы Clubhouse, лайфхаки для пользователей и бонус в конце...
25 03 2026 19:34:39
Вывод информационного сайта из-под алгоритмического YMYL фильтра Google...
24 03 2026 7:16:28
Сколько страниц на самом деле показывает и может перевести поисковик Google?...
23 03 2026 22:24:12
Рассказываем, как обменять свои деньги на действительно полезные знания....
22 03 2026 10:14:42
Как делать большие деньги даже, когда случаются кассовые разрывы и каким образом строить процессы внутри компании, чтобы сотрудники горели своим (вашим) делом? Узнать!...
21 03 2026 21:53:45
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::