Как собрать данные из Google Search Console и построить отчетность с помощью Python и Google BigQuery

Привет! Меня зовут Антон Леонтьев, я руководитель группы веб-аналитики в компании eLama.
В 2017 году вышла моя статья «Как обработать данные по поисковым запросам из органики Google в Google BigQuery». В ней мы вручную выгружали CSV-файлы из Google Search Console, складывали их на хранение в Google BigQuery и строили отчетность. В этой статье мы научимся выгружать автоматически с помощью Python-скрипта больше информации из консоли веб-мастера Google и построим большее количество автоматических отчетов.
Что изменилось с момента выхода прошлой статьи:
Во-первых, данные по поисковым запросам в консоли веб-мастера Google и в Google ***ytics теперь хранятся 16 месяцев, а не 90 дней, как раньше.
Во-вторых, появились данные по отдельным типам поиска: Веб, Изображение, Видео. Если выгружать вручную через CSV-файлы, то количество работы увеличивается в три раза.
В-третьих, теперь консоль веб-мастера поддерживает Ресурс на уровне домена, включающий URL с любыми субдоменами (m, www и др.) и различными префиксами протокола (http, https, ftp).
Также добавлю, что вручную скачивать CSV-файлы из консоли и загружать в BigQuery стало сложнее, поскольку все чаще попадаются громоздкие поисковые запросы на несколько строк с разными разделителями (пользователи копируют куски текста и вставляют в поиск). Стандартное форматирование ломается.
Чтобы построить автоматическую отчетность, мы будем каждый месяц скачивать из консоли веб-мастера статистику за предыдущий месяц и загружать ее в облачную базу данных Google BigQuery с помощью Python-скрипта. Затем построим отчетность SQL-запросами.
Пошаговая инструкция
1. Установим последнюю версию Python3 с официального сайта. Скачиваем дистрибутив, при установке выбираем ‘Customize installation’ и устанавливаем в папку ‘C:\Python37’. Остальные параметры можно не менять. Дальнейшие действия рассмотрим на примере операционной системы семейства Windows.
2. Запустим комaндную строку.
3. Перейдем в папку, куда установился Python, и проверим его работоспособность. Для этого запустим по очереди комaнды:
cd \"C:\Python37\"python --version4. Выполним комaнды для установки библиотек, необходимых для работы скрипта:
cd Scriptspip install --upgrade google-api-python-clientpip install pandaspip install pandas_gbqpip install --upgrade oauth2clientcd ..5. В Google BigQuery создадим dataset, например, ‘search_console_google’. О том, как начать работать с BigQuery, можно прочитать в одной из моих предыдущих статей.
6. Нужно создать сервисный аккаунт в разделе IAM и администрирование в Google Cloud Platform, затем создать для него JSON-ключ и сохранить себе на компьютер, например, в папку ‘C:\Dropbox\gsc\’.
7. Подключите Google Search Console API для приложения в Google API Console в текущем проекте Google Cloud. Затем создайте учетные данные.
Скачайте JSON-файл с учетными данными, переименуйте его в client_secrets.json.
8. Скачайте скрипт google_seo.py себе на компьютер, например, в папку ‘C:\Dropbox\gsc\’.
Здесь скрипт google_seo.py. Важно! Файлы google_seo.py и client_secrets.json должны находиться в одной папке.Замените в коде переменные:
- ‘gcloud_key’ — путь к JSON-ключу от сервисного аккаунта Google Cloud из пункта 6;
- ‘gbq_project_id’ — идентификатор проекта Google BigQuery;
- ‘gbq_dataset’ — название dataset\\\'a в BigQuery, куда вы хотите сохранить данные;
- ‘domains’ — список доменов-ресурсов, подтвержденных в консоли вебмастера;
- ‘first_month’, ‘last_month’ — с какого по какой месяц выгружаем данные;
- ‘dimensions’ — метрики, которые будем выгружать (подробнее об этом поговорим дальше).
9. Запустите скрипт, набрав в комaндной строке:
python \"C:\Dropbox\gsc\google_seo.py\"При первом запуске откроется браузер: нужно будет авторизоваться в Google и выдать разрешение приложению на доступ к вашему аккаунту. Также при первом запуске появится предупреждение об отсутствующем файле webmasters.dat; в этом нет ничего страшного, он будет создан позднее.
Если все пройдет гладко, то в консоли после выполнения скрипта будет суммарная информация по выгрузке. Также лог сохранится в файле google_seo_log.txt в папке со скриптом.
- search_type — тип поиска (Веб, Изображение, Видео) ;
- all_values — сколько всего значений было выгружено (сколько строк) ;
- values with clicks — сколько из них было с кликами (остальные — 0 кликов, то есть были только показы) ;
- clicks sum — сумма кликов;
- impressions sum — сумма показов;
- dimension1 и dimension2 — выгружаемые метрики. Скрипт по умолчанию выгружает восемь метрик, которые я посчитал самыми важными; если каких-то не хватает — просто добавьте их в скрипт. Что это за метрики:
9.1. \"device\": Устройства. Аналогичный отчет из консоли веб-мастера имеет вид:
9.2. \"country\": Страны.
9.3. \"page\": Страницы сайта. Сумма кликов и сумма показов больше, чем, например, по метрике 9.1 device, так как за один результат поиска в Google может выдаваться несколько страниц одного сайта, и все они суммируются.
9.4. \"query\": Поисковые запросы. Обычно самая востребованная метрика. К сожалению, через Google API (так же, как и через обычные CSV-выгрузки в интерфейсе консоли веб-мастера) выгружаются не все поисковые запросы (сумма кликов и показов меньше, чем в нашей выгрузке по метрике 9.1 device, и меньше, чем в суммарной информации в веб-интерфейсе консоли).
9.5. \"query - device\" и 9.6. \"query - country\": Поисковые запросы с разбивкой по устройствам; по странам.
В этих двух метриках сумма кликов совпадает с 9.5 query, но сумма показов может быть больше т.к. добавляются новые запросы с показами, но без кликов (особенности API Google).
9.7. \"query - page\": Поисковые запросы с разбивкой по страницам сайта. Сумма кликов и сумма показов больше, чем, например, по метрике 9.4 query, так как за один результат поиска в Google может выдаваться несколько страниц одного сайта, и все они суммируются.
10. Также в результате выполнения скрипта для каждого домена за каждый месяц создается таблица в Google BigQuery с сырыми данными:
Чтобы посмотреть содержимое таблиц, откройте предварительный просмотр.
Содержание полей:
- clicks — клики;
- ctr — CTR;
- impressions — показы;
- position — позиция в поиске;
- search_type — тип поиска;
- domain — домен;
- period — месяц;
- dimension1 и dimension2 — названия метрик, а value1 и value2 — их значения.
Например, на скриншоте ниже dimension1 содержит ‘query’, а dimension2 — пустое. Значит, это поисковые запросы, которые хранятся в поле value1, а поля value2 — пустые.
11. Чтобы было легче работать с поисковыми запросами (то есть метрикой 9.4 query), создадим виртуальную таблицу (view) search_console_google.queries, содержащую этот SQL-скрипт:
Здесь скрипт queries.sql.В этом скрипте вам нужно заменить ‘gbq_project_id’ — идентификатор проекта BigQuery — и подправить определение брендированных запросов. Затем запустите скрипт и сохраните view (представление). Эта виртуальная таблица будет содержать подробную информацию по каждому поисковому запросу за каждый отчетный месяц по каждому домену-ресурсу.
Посмотрим на результат выполнения этого скрипта (нужно нажать Edit Query, Run Query):
Колонки аналогичны таблице из пункта 10, за исключением:
query — поисковый запрос, уже отдельное поле;
query_type — тип поискового запроса, определяется в SQL-запросе. Он принимает три значения: ‘(other)’, ‘branded’, ‘not branded’.
‘(other)’ — это искусственно созданный поисковый запрос, клики и показы по которому равны сумме кликов и показов, которые не выгрузились из консоли. Рассчитывается это следующим образом: берется сумма кликов и показов по метрике device (эта сумма пpaктически всегда совпадает с общей суммой консоли веб-мастера), и из нее вычитаются суммы кликов и показов по всем выгруженным поисковым запросам. Таким образом, суммы по ‘(other)’, ‘branded’, ‘not branded’ совпадают с общими цифрами в консоли веб-мастера.12. Используя эти данные, можно построить любые отчеты или графики в средствах визуализации или BI-инструментах. Я подготовил пять отчетов в Google Sheets. Откройте документ по ссылке и скопируйте себе, тогда у вас появится доступ на редактирование и изменение графиков. Все цифры в документе демонстрационные.
13. Отчет 1: Queries totals
На графике выводится помecячная динамика указанного показателя по выбранным доменам, типу поиска и типу запроса. Например, динамика кликов по бразильскому домену в типе поиска ‘web’ по всем типам запросов:
Или доля показов по всем доменам во всех типах поиска по поисковым фразам ‘other’ (то есть которые не выгружаются из консоли веб-мастера):
Исходными данными для листа ‘1 Queries totals’ является лист ‘1 source’, в который скопирован результат выполнения SQL-запроса. Чтобы не копировать вручную данные в ‘1 source’, можно воспользоваться аддоном OWOX BI BigQuery Reports, который будет обновлять лист каждый раз по запросу или по расписанию.
Здесь скрипт queries_report_chart.sql.14. Отчет 2: Queries list
Таблица по всем поисковым фразам за каждый месяц: указаны количество кликов и позиция. Исключены поисковые фразы с суммарным количеством кликов за все время меньше десяти. Пользуемся фильтрами, чтобы сфокусироваться на нужных показателях.
Здесь скрипт queries_report_list.sql.15. Отчет 3: Devices
Динамика показателей: CTR, клики, показы в разрезе устройств по доменам и типам поиска. Исходные данные — на листе ‘3 source’.
Здесь запрос devices.sql.16. Отчет 4: Countries
Здесь можно посмотреть статистику по странам. Исходные данные — на листе ‘4 source’.
Здесь запрос countries.sql.17. Отчет 5: Pages
Таблица со статистикой кликов по страницам сайта. Список ограничен страницами с 5 и более кликами за все время.
Здесь скрипт pages.sql.Заключение
В этой статье приведены примеры отчетов по следующим выгруженным метрикам из Google Search Console: 9.1 device, 9.2 country, 9.3 page, 9.4 query. Данные по: 9.6 query - device, 9.7 query - country, 9.8 query - page не используются, иначе статья будет очень громоздкой. Но все данные хранятся в BigQuery, и вы сможете запрашивать оттуда данные, если потребуется. Используйте и модифицируйте приведенные SQL-запросы под свои потребности или стройте отчеты на основе сырых данных в средствах визуализации и BI-инструментах: Google Data Studio, Tableau, Power BI или других.
Таким образом, мы разобрались, как можно сохранить статистику переходов из органики Google, а также автоматизировать отчетность. Если у вас есть вопросы или дополнения — пишите в комментариях.
Комментарии:
Что делать, когда не получается заставить себя написать статью или кейс...
16 04 2026 11:33:58
Цель — трафик facebook. Делимся кейсом проекта «Мой город»....
15 04 2026 5:25:56
Как протестировать MVP мобильного приложения, получить обратную связь и сформировать гипотезы...
14 04 2026 14:26:55
В этой статье мы поговорим про принципы работы СRM-системы. Это базовые моменты, прояснив которые СRM перестанет быть для вас чем-то сложным и непонятным....
13 04 2026 5:13:19
9 тревожных признаков того, что ваши подчиненные могут выгореть и уволиться. Обратите внимание и, возможно, не придется терять ценных для компании людей....
12 04 2026 6:57:36
Оставить заявку на горячей линии МОЗ — это только вершина айсберга. Необходимо провести опрос среди сотрудников компании. И не один. А ещё подготовить несколько помещений для вакцинации и отдыха. Узнать больше!...
11 04 2026 19:29:39
Callback от Ringostat: пример того, как увеличить конверсии с помощью формы заказа обратного звонка...
10 04 2026 13:17:36
А ещё у нас появилась новая стратегия SEO-продвижения для ниши доставки еды и продуктов....
09 04 2026 4:34:32
Артем Шевченко (Epicentr), Михаил Рогальский (Monobank), Максим Дмитров (BSH Hausgeräte), Андрей Чумаченко (Netpeak) и другие участники конференции 8Р о том, как они рассчитывают инвестиции в интернет-маркетинг....
08 04 2026 7:28:17
5 мая в 17:00 — митап в Zoom с Радомиром Новковичем — фаундером RadASO и CEO Tonti Laguna Mobile....
07 04 2026 11:22:52
О важных для разметки сайта тегах — alternate, hreflang, media, — и как их грамотно использовать при продвижении....
06 04 2026 23:33:42
Данные по 43 миллионам кликов в 27 тематиках и 391 городах страны...
05 04 2026 0:22:30
Как поможет Regex Engines в работе с Google ***ytics и преимущества использования Regex в Диспетчере тегов Google. Узнать больше....
04 04 2026 18:12:18
Создаём страницы, которые быстро загружаются на мобильных устройствах....
03 04 2026 7:25:58
Правильная внутренняя перелинковка необходима, чтобы страницы не вылетали из индекса, а также чтобы увеличить ссылочный вес продвигаемых страниц...
02 04 2026 21:51:23
О том как растут доходы при оптовой торговле женской одеждой и обувью, а траты на рекламу остаются на прежнем уровне...
01 04 2026 16:21:56
Для работы в интернет-маркетинге нужно хорошо разбираться в аналитике. Рассмотрим, как использовать в работе Google ***ytics 4 и чем он отличается от Universal...
31 03 2026 5:23:46
Как найти, нарастить и проанализировать ссылочную массу...
30 03 2026 8:51:37
Как быстро создавать и запускать объявления, а также массово вносить правки в кампании с помощью файла Excel...
29 03 2026 23:11:32
Аналитик Netpeak Алексей Селезнев рассказал, как составить и пользоваться сводными таблицами онлайн в excel и за считанные секунды выделить нужные для анализа данные из десятков тысяч строк в отчетах Google ***ytics...
28 03 2026 15:54:45
Как вести рекламные кампании и что делать на разных этапах настройки. Делимся опытом: примерами, кейсами и рекомендациями. Узнать больше и настроить свои РК, как боженька!...
27 03 2026 23:51:55
Создание репутации крутого специалиста — дело рук крутого специалиста....
26 03 2026 18:20:58
Опыт удаленки стартапа lemlist. Как сотрудники работали онлайн в доковидные времена и совмещали профессиональную деятельность с тимбилдингом. Читайте в коротком посте Владимира Поло, основателя AcademyOcean....
25 03 2026 1:12:18
Бета-версия помогает записывать действия пользователей на сайте и благодаря этому улучшать удобство использования сайта и в перспективе растить продажи. Узнать больше!...
24 03 2026 11:17:32
Уже сейчас в Google Play и App Store миллионы приложений. Как сделать так, чтобы приложение получило достаточное количество установок и приносило доход? Читайте об этом далее и изучайте наглядную инфографику!...
23 03 2026 9:26:31
Как сделать приятно подписчику в день его рождения, на Новый год и в любой другой праздник....
22 03 2026 23:56:40
Технологии решают, но не всегда....
21 03 2026 21:32:14
Ссылка с сайта с высоким тИЦ уже не считается качественной. Хороший донор вычисляется по комплексу факторов. Большую часть работы придется делать вручную. Важно найти отличный сайт, с огромным количеством интересного контента, оцененного по достоинству читателями, и гармонично туда вписать свою статью со ссылкой...
20 03 2026 20:44:45
Руководство к действию от основателя Netpeak Group....
19 03 2026 21:58:34
Что ждет новичка в его первый день работы в Netpeak — подарки, первые задачи и традиции компании. Все, что нужно знать, чтобы меньше волноваться и влиться в коллектив. Узнать больше!...
18 03 2026 6:56:42
С помощью этой шпаргалки вы легко распределите акценты и начнете последовательно внедрять маркетинговую стратегию по продвижению мобильного приложения...
17 03 2026 9:14:25
Сериал «Ход королевы» взорвал интерес к шахматам, и вот насколько сильно...
16 03 2026 10:56:47
Что нужно учесть при создании баннеров для разных аудиторий...
15 03 2026 16:46:15
Как снизить стоимость лидов путём использования новых технологий...
14 03 2026 5:53:43
Как использовать сториз для бизнеса на полную? Фишки от пpaктиков SMM-продвижения....
13 03 2026 17:16:37
Украинские реалии того, в каких тематиках трафик из Yandex.Direct дороже Google Ads. Новое исследование Алексея Селезнева....
12 03 2026 2:57:44
Качественные исходящие ссылки и исходящий мусор, который только вредит репутации сайта. Находим и отсеиваем....
11 03 2026 2:26:58
Если хотите, чтобы кампании в контекстно-медийной сети работали эффективно, следует очистить площадки и ввести это в привычку...
10 03 2026 1:26:40
О работе внутреннего и внешнего контент-маркетолога: необходимые знания и навыки для старта, плюшки и головная боль. Все здесь....
09 03 2026 20:35:51
Как разобраться в типах соответствия ключевых слов и определить, что минус-слова блокируют показы нужных ключевых слов....
08 03 2026 11:32:50
4 кейса с шагами, рекомендациями и результатами, которые помогут грамотно распределить средства на рекламу....
07 03 2026 20:19:10
Чек-лист для РРС-специалистов. Всегда быстрее учиться на опыте других людей, а не набивать шишки самостоятельно. А также советы, как исправить рекламные кампании. Обо всем читайте в этой статье!...
06 03 2026 3:36:47
Что такое теневой бан, что о нем известно, как выйти из-под него. Плюс мнение SMM-эксперта Нели Серебро...
05 03 2026 10:40:32
Техника безопасности по безукоризненным рекламным кампаниям...
04 03 2026 21:35:11
Подкаст — это аудиозапись в повествовательном, музыкальном, юмористическом формате. Создается с целью рекламы, увеличения потока посетителей на сайт и роста почитателей определенного продукта...
03 03 2026 9:37:47
Опрос экспертов. Как правильно искать подрядчиков, которые станут партнерами для вашего бизнеса? Как долго работать с партнерами и не испортить отношения? На что обращать внимание в первую очередь, а на что можно закрыть глаза?...
02 03 2026 12:48:54
Краткая инструкция по поиску идеального кандидата, потому что (как видим) многим на рынке все еще сложно найти хорошего маркетолога. Да и понять, стоит ли вкладывать в сотрудника силы, время, средства с первой встречи достаточно сложно....
01 03 2026 13:38:42
И чем этот тип отслеживания событий отличается от Client-side. Узнать!...
28 02 2026 11:27:22
Визуализация данных для новичков. Отвечаем на вопрос читателя....
27 02 2026 7:37:17
Есть восхитительная возможность продвинуть видео на YouTube с минимальными финансовыми потерями!...
26 02 2026 1:37:46
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::