Как собрать данные из Google Search Console и построить отчетность с помощью Python и Google BigQuery
Привет! Меня зовут Антон Леонтьев, я руководитель группы веб-аналитики в компании eLama.
В 2017 году вышла моя статья «Как обработать данные по поисковым запросам из органики Google в Google BigQuery». В ней мы вручную выгружали CSV-файлы из Google Search Console, складывали их на хранение в Google BigQuery и строили отчетность. В этой статье мы научимся выгружать автоматически с помощью Python-скрипта больше информации из консоли веб-мастера Google и построим большее количество автоматических отчетов.
Что изменилось с момента выхода прошлой статьи:
Во-первых, данные по поисковым запросам в консоли веб-мастера Google и в Google ***ytics теперь хранятся 16 месяцев, а не 90 дней, как раньше.
Во-вторых, появились данные по отдельным типам поиска: Веб, Изображение, Видео. Если выгружать вручную через CSV-файлы, то количество работы увеличивается в три раза.
В-третьих, теперь консоль веб-мастера поддерживает Ресурс на уровне домена, включающий URL с любыми субдоменами (m, www и др.) и различными префиксами протокола (http, https, ftp).
Также добавлю, что вручную скачивать CSV-файлы из консоли и загружать в BigQuery стало сложнее, поскольку все чаще попадаются громоздкие поисковые запросы на несколько строк с разными разделителями (пользователи копируют куски текста и вставляют в поиск). Стандартное форматирование ломается.
Чтобы построить автоматическую отчетность, мы будем каждый месяц скачивать из консоли веб-мастера статистику за предыдущий месяц и загружать ее в облачную базу данных Google BigQuery с помощью Python-скрипта. Затем построим отчетность SQL-запросами.
Пошаговая инструкция
1. Установим последнюю версию Python3 с официального сайта. Скачиваем дистрибутив, при установке выбираем ‘Customize installation’ и устанавливаем в папку ‘C:\Python37’. Остальные параметры можно не менять. Дальнейшие действия рассмотрим на примере операционной системы семейства Windows.
2. Запустим комaндную строку.
3. Перейдем в папку, куда установился Python, и проверим его работоспособность. Для этого запустим по очереди комaнды:
cd \"C:\Python37\"python --version
4. Выполним комaнды для установки библиотек, необходимых для работы скрипта:
cd Scriptspip install --upgrade google-api-python-clientpip install pandaspip install pandas_gbqpip install --upgrade oauth2clientcd ..
5. В Google BigQuery создадим dataset, например, ‘search_console_google’. О том, как начать работать с BigQuery, можно прочитать в одной из моих предыдущих статей.
6. Нужно создать сервисный аккаунт в разделе IAM и администрирование в Google Cloud Platform, затем создать для него JSON-ключ и сохранить себе на компьютер, например, в папку ‘C:\Dropbox\gsc\’.
7. Подключите Google Search Console API для приложения в Google API Console в текущем проекте Google Cloud. Затем создайте учетные данные.
Скачайте JSON-файл с учетными данными, переименуйте его в client_secrets.json.
8. Скачайте скрипт google_seo.py себе на компьютер, например, в папку ‘C:\Dropbox\gsc\’.
Здесь скрипт google_seo.py. Важно! Файлы google_seo.py и client_secrets.json должны находиться в одной папке.Замените в коде переменные:
- ‘gcloud_key’ — путь к JSON-ключу от сервисного аккаунта Google Cloud из пункта 6;
- ‘gbq_project_id’ — идентификатор проекта Google BigQuery;
- ‘gbq_dataset’ — название dataset\\\'a в BigQuery, куда вы хотите сохранить данные;
- ‘domains’ — список доменов-ресурсов, подтвержденных в консоли вебмастера;
- ‘first_month’, ‘last_month’ — с какого по какой месяц выгружаем данные;
- ‘dimensions’ — метрики, которые будем выгружать (подробнее об этом поговорим дальше).
9. Запустите скрипт, набрав в комaндной строке:
python \"C:\Dropbox\gsc\google_seo.py\"
При первом запуске откроется браузер: нужно будет авторизоваться в Google и выдать разрешение приложению на доступ к вашему аккаунту. Также при первом запуске появится предупреждение об отсутствующем файле webmasters.dat; в этом нет ничего страшного, он будет создан позднее.
Если все пройдет гладко, то в консоли после выполнения скрипта будет суммарная информация по выгрузке. Также лог сохранится в файле google_seo_log.txt в папке со скриптом.
- search_type — тип поиска (Веб, Изображение, Видео) ;
- all_values — сколько всего значений было выгружено (сколько строк) ;
- values with clicks — сколько из них было с кликами (остальные — 0 кликов, то есть были только показы) ;
- clicks sum — сумма кликов;
- impressions sum — сумма показов;
- dimension1 и dimension2 — выгружаемые метрики. Скрипт по умолчанию выгружает восемь метрик, которые я посчитал самыми важными; если каких-то не хватает — просто добавьте их в скрипт. Что это за метрики:
9.1. \"device\": Устройства. Аналогичный отчет из консоли веб-мастера имеет вид:
9.2. \"country\": Страны.
9.3. \"page\": Страницы сайта. Сумма кликов и сумма показов больше, чем, например, по метрике 9.1 device, так как за один результат поиска в Google может выдаваться несколько страниц одного сайта, и все они суммируются.
9.4. \"query\": Поисковые запросы. Обычно самая востребованная метрика. К сожалению, через Google API (так же, как и через обычные CSV-выгрузки в интерфейсе консоли веб-мастера) выгружаются не все поисковые запросы (сумма кликов и показов меньше, чем в нашей выгрузке по метрике 9.1 device, и меньше, чем в суммарной информации в веб-интерфейсе консоли).
9.5. \"query - device\" и 9.6. \"query - country\": Поисковые запросы с разбивкой по устройствам; по странам.
В этих двух метриках сумма кликов совпадает с 9.5 query, но сумма показов может быть больше т.к. добавляются новые запросы с показами, но без кликов (особенности API Google).
9.7. \"query - page\": Поисковые запросы с разбивкой по страницам сайта. Сумма кликов и сумма показов больше, чем, например, по метрике 9.4 query, так как за один результат поиска в Google может выдаваться несколько страниц одного сайта, и все они суммируются.
10. Также в результате выполнения скрипта для каждого домена за каждый месяц создается таблица в Google BigQuery с сырыми данными:
Чтобы посмотреть содержимое таблиц, откройте предварительный просмотр.
Содержание полей:
- clicks — клики;
- ctr — CTR;
- impressions — показы;
- position — позиция в поиске;
- search_type — тип поиска;
- domain — домен;
- period — месяц;
- dimension1 и dimension2 — названия метрик, а value1 и value2 — их значения.
Например, на скриншоте ниже dimension1 содержит ‘query’, а dimension2 — пустое. Значит, это поисковые запросы, которые хранятся в поле value1, а поля value2 — пустые.
11. Чтобы было легче работать с поисковыми запросами (то есть метрикой 9.4 query), создадим виртуальную таблицу (view) search_console_google.queries, содержащую этот SQL-скрипт:
Здесь скрипт queries.sql.В этом скрипте вам нужно заменить ‘gbq_project_id’ — идентификатор проекта BigQuery — и подправить определение брендированных запросов. Затем запустите скрипт и сохраните view (представление). Эта виртуальная таблица будет содержать подробную информацию по каждому поисковому запросу за каждый отчетный месяц по каждому домену-ресурсу.
Посмотрим на результат выполнения этого скрипта (нужно нажать Edit Query, Run Query):
Колонки аналогичны таблице из пункта 10, за исключением:
query — поисковый запрос, уже отдельное поле;
query_type — тип поискового запроса, определяется в SQL-запросе. Он принимает три значения: ‘(other)’, ‘branded’, ‘not branded’.
‘(other)’ — это искусственно созданный поисковый запрос, клики и показы по которому равны сумме кликов и показов, которые не выгрузились из консоли. Рассчитывается это следующим образом: берется сумма кликов и показов по метрике device (эта сумма пpaктически всегда совпадает с общей суммой консоли веб-мастера), и из нее вычитаются суммы кликов и показов по всем выгруженным поисковым запросам. Таким образом, суммы по ‘(other)’, ‘branded’, ‘not branded’ совпадают с общими цифрами в консоли веб-мастера.12. Используя эти данные, можно построить любые отчеты или графики в средствах визуализации или BI-инструментах. Я подготовил пять отчетов в Google Sheets. Откройте документ по ссылке и скопируйте себе, тогда у вас появится доступ на редактирование и изменение графиков. Все цифры в документе демонстрационные.
13. Отчет 1: Queries totals
На графике выводится помecячная динамика указанного показателя по выбранным доменам, типу поиска и типу запроса. Например, динамика кликов по бразильскому домену в типе поиска ‘web’ по всем типам запросов:
Или доля показов по всем доменам во всех типах поиска по поисковым фразам ‘other’ (то есть которые не выгружаются из консоли веб-мастера):
Исходными данными для листа ‘1 Queries totals’ является лист ‘1 source’, в который скопирован результат выполнения SQL-запроса. Чтобы не копировать вручную данные в ‘1 source’, можно воспользоваться аддоном OWOX BI BigQuery Reports, который будет обновлять лист каждый раз по запросу или по расписанию.
Здесь скрипт queries_report_chart.sql.14. Отчет 2: Queries list
Таблица по всем поисковым фразам за каждый месяц: указаны количество кликов и позиция. Исключены поисковые фразы с суммарным количеством кликов за все время меньше десяти. Пользуемся фильтрами, чтобы сфокусироваться на нужных показателях.
Здесь скрипт queries_report_list.sql.15. Отчет 3: Devices
Динамика показателей: CTR, клики, показы в разрезе устройств по доменам и типам поиска. Исходные данные — на листе ‘3 source’.
Здесь запрос devices.sql.16. Отчет 4: Countries
Здесь можно посмотреть статистику по странам. Исходные данные — на листе ‘4 source’.
Здесь запрос countries.sql.17. Отчет 5: Pages
Таблица со статистикой кликов по страницам сайта. Список ограничен страницами с 5 и более кликами за все время.
Здесь скрипт pages.sql.Заключение
В этой статье приведены примеры отчетов по следующим выгруженным метрикам из Google Search Console: 9.1 device, 9.2 country, 9.3 page, 9.4 query. Данные по: 9.6 query - device, 9.7 query - country, 9.8 query - page не используются, иначе статья будет очень громоздкой. Но все данные хранятся в BigQuery, и вы сможете запрашивать оттуда данные, если потребуется. Используйте и модифицируйте приведенные SQL-запросы под свои потребности или стройте отчеты на основе сырых данных в средствах визуализации и BI-инструментах: Google Data Studio, Tableau, Power BI или других.
Таким образом, мы разобрались, как можно сохранить статистику переходов из органики Google, а также автоматизировать отчетность. Если у вас есть вопросы или дополнения — пишите в комментариях.
Комментарии:
Данные по 42,5 млн кликов в 25 тематиках и 391 городу...
09 02 2025 8:58:58
Как без проблем пересылать данные в Google Покупки....
08 02 2025 20:10:48
Интересные факты про Google Рекламу перевел Сергeй Бахарь для читателей нашего блога....
07 02 2025 11:17:22
Продвижение монобренда: особенности, трудности, подводные камни. Ниша здоровья и красоты....
06 02 2025 20:56:48
Более строгие требования к таким ресурсам обуславливают свои подходы....
05 02 2025 11:53:27
Подробный алгоритм успешного питча на Product Hunt на примере Serpstat...
04 02 2025 1:13:29
Продажа климатического оборудования. Кейс о проекте, который продвигался у нас на услуге «продвижение по позициям» и не демонстрировал хороших результатов как по росту трафика, так и по продажам, не смотря на высокие места в выдаче. Узнать больше!...
03 02 2025 20:37:31
Динамический ремаркетинг: как вернуть посетителя на сайт и продать, когда человеку «надо ещё подумать»....
02 02 2025 16:47:45
Данные по 24 миллионам кликов в 24 тематиках и 391 городу...
01 02 2025 0:29:50
Лучшие маркетинговые ориентиры тем, кто захочет познакомиться с SEO и контекстной рекламе...
31 01 2025 0:11:58
Блиц-инструкция и рекомендации по созданию эффективных описаний для мобильных приложений...
30 01 2025 2:12:12
Как уменьшить время ответа сервера и повысить общий показатель скорости загрузки сайта...
29 01 2025 22:40:32
Зачем амбициозным онлайн-проектам индивидуальные инструменты веб-аналитики....
28 01 2025 12:24:41
Любопытная подборка "маленьких" гигантов: компании и сервисы, чья аудитория превышает 10 миллионов пользователей, а также несколько интересных фактов о каждом из них. Узнать больше!...
27 01 2025 15:24:59
Как работать с Facebook ***ytics — бесплатным инструментом с богатым инструментарием и лучшей из всех существующих решений интеграцией с платформой Facebook...
26 01 2025 6:44:37
Как подготовить фиды в Яндекс.Директ для разных тематик...
25 01 2025 2:46:19
Всё, что вы хотели знать о функциях вычисляемых полей, но боялись спросить....
24 01 2025 17:27:18
Данные по 22,4 миллионам кликов в 46 тематиках и 392 населенных пунктах страны — собрана статистика исключительно по проектам агентства Netpeak. Узнать больше!...
23 01 2025 20:18:26
Получаем реальную статистику эффективности использования AMP-страниц с помощью АМР Client ID API....
22 01 2025 16:28:10
Как завоевать Instagram, задавая правильные цели и вопросы. Также в статье делимся табличкой лучшего времени постинга для различных тематических публикаций. Узнать больше!...
21 01 2025 21:26:44
Можно ли повысить оценку качества целевой страницы , если проставить конечные URL на уровне ключевого слова? Результаты исследования....
20 01 2025 7:58:59
Онлайн-корпоративы стали трендом 2020 года, но останутся с нами надолго если не в чистом, то в гибридном формате. Делимся опытом организации дня рождения компании в Zoom....
19 01 2025 1:25:35
Наибольший эффект по продвижению сайта при минимальных затратах — именно таков принцип SEO growth hacking. Как найти кратные точки роста, читайте статье....
18 01 2025 6:25:49
Грамотно оформленные метатеги презентуют сайт, помогают пользователям быстро найти нужную информацию, а поисковым системам — повысить ресурс в выдаче...
17 01 2025 15:11:21
Персональный чек-лист автора десятков рассылок: три года опыта и регулярное общение с техподдержкой почтовых сервисов. Всё о том, как не попасть в спам и как из него спасаться. А может и не всё. Можете дополнить этот пост своими фишками? Делитесь!...
16 01 2025 23:33:12
Игроков интернета России, Уанета и Казнета зарубежные сайты coблaзняют семизначными результатами продаж во время «черной пятницы» и «киберпонедельника»....
15 01 2025 20:35:11
В ТОПе ошибок — метатеги, разметка, заголовки h1-h6 и внутренние ссылочные факторы....
14 01 2025 4:53:37
При работе с рекламным аккаунтом приходится вносить много однотипных изменений. Рассказываем, как сделать это быстро....
13 01 2025 6:17:17
Инструкция по созданию изображений для сториз, email-рассылок и объявлений в соцсетях...
12 01 2025 5:18:54
Как продвинуть бренд в конкурентной тематике? Читаем новый кейс по видеорекламе....
11 01 2025 14:45:14
Тематический кейс в нише «Фотография и аксессуары»: проделанные работы и полученные результаты...
10 01 2025 7:44:41
Не знаешь как раскрутить сайт? Мы подготовили 11 этапов SEO-продвижения сайтов в поисковых системах....
09 01 2025 17:56:30
Повышение эффективности продаж через звонки с помощью call tracking....
08 01 2025 13:56:42
Как добавить свою рекламу через поисковый сервис с картинками в Google....
07 01 2025 16:26:44
Как изменилось агентство Netpeak c августа по октябрь? Читайте о семи главных нововведениях и улучшениях в работе с клиентами....
06 01 2025 2:27:17
Microsoft, Facebook и другие технологические компании заявляют, что метавселенная — это будущее интернета. Или настоящее? Давайте разберемся...
05 01 2025 10:54:13
Готовые к использованию таргетинговые идеи для мобильных приложений онлайн в Facebook....
04 01 2025 15:31:28
Каковы интересы вашей аудитории, как люди находят ваш контент. Рассказываем обо всех возможностях от Search Console Insights....
03 01 2025 11:24:22
Как операторы поисковых запросов Google помогают при продвижении сайта и анализе конкурентов....
02 01 2025 13:40:52
10 базовых правил оформления онлайн-таблиц. Оформление — основа таблицы. Как работать со столбцами и ячейками, комментариями и примечаниями, делать корректные цветовые выделения. Читайте далее....
01 01 2025 11:10:48
Что нужно учесть при создании баннеров для разных аудиторий...
31 12 2024 18:18:40
Про работу мозга и запоминание из книги Торкеля Клинберга «Информационный поток и пределы рабочей памяти» и обзор игр Lumosity....
30 12 2024 1:58:14
Пишите стоимость товара под постами. Но это не универсальный совет. Если ваша ниша с длинным циклом продаж, можно сделать исключение. Что ещё нужно знать про ответ в директ? Узнать!...
29 12 2024 7:47:50
Тренды, рекомендации, уроки, инструкции, а также вакансии, идеи, кейсы и всё, что поможет оставаться в теме, находить интересные проекты и вдохновляться. Читать дальше....
28 12 2024 10:35:53
Работа велась с конца августа прошлого года до конца декабря и включила в себя анализ рынка, конкурентов, целевой аудитории, поиск инсайта, разработку стратегии, подготовку медиаплана, создание промо-сайта и само проведение рекламной кампании, в котором б...
27 12 2024 21:59:41
Данные о стоимости клика в наиболее популярных рекламных интернет-площадках страны....
26 12 2024 16:14:28
Помимо полезного и качественного продукта, услуги, компании нужен мощный маркетинг. И возможно это только благодаря хорошему директору по маркетингу. Только так это работает. Кто лучшие в этой нише в Казахстане? Узнать!...
25 12 2024 13:59:32
Как визуализировать данные Google BigQuery в Power BI? Пошаговая инструкция от руководителя отдела веб-аналитики Netpeak Алексея Селезнева...
24 12 2024 8:41:39
Как стать востребованным сео оптимизатором: 35+ ссылок для обучения и совершенствования своих знаний, а также советы...
23 12 2024 5:30:20
Повышаем эффективность рекламных кампаний. Как рекламодателю-новичку самостоятельно провести аудит своих кампаний в Google Ads, а также про наиболее частые ошибки новичков, связанные с работой и аудитами кампаний в Google Ads. Читайте дальше!...
22 12 2024 23:13:37
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::