Коммерческое ранжирование Яндекса (перевод)

У нас есть технологический SEO-отдел, который не только инициирует разработку сервисов (Serpstat (ex. Продвигатор), Netpeak Spider, Netpeak Checker и пр.), но и разбирается в алгоритмах и проводит различные эксперименты. Переводы некоторых интересных и важных документов уже есть в сети, но когда мы их проверяли, то периодически находили серьезные фактические ошибки, поэтому всегда работаем с первоисточниками и вот как сейчас делимся своей версией перевода исследования про коммерческое ранжирование Яндекса с читателями блога.
Для чего придумано? Для того, чтобы ранжировать те документы, которые уже высокорелевантны для этих запросов. На что обратили внимание:
- на доверие пользователей;
- юзабилити;
- качество дизайна;
- качество сервиса.
Для ранжирования используется сумма коммерческой и тематической релевантности. Уходя с головой в SEO, многие вебмастера забывают о пользовательских факторах. А удовлетворенность пользователя на коммерческих сайтах может варьироваться очень сильно. В частности, значительное влияние на поведение пользователей оказывают: дизайн, механизм онлайн обратной связи, отзывы пользователей о товарах. Формальные критерии, которые хаpaктеризуют удобство для пользователя, дизайн и уровень доверия, должны быть созданы на базе аспектов качества сайта, которые важны для пользователя. Такими критериями могут быть: длина текста, грамотно написанный контент, читабельность тайтлов, наличие карт, информация о компании, легкие для запоминания телефонные номера, бесплатная доставка и т.д. Есть работы, которые описывают подходы для сбора дополнительных данных о качестве сайтов. Например: агрегация оценок из нескольких источников, таких как мнения пользователей и данные о кликах или текстовая релевантность и время публикации. В своем документе мы предлагаем новый подход, который включает в себя создание новых аспектов релевантности и внедрение некоторых фич, которые позволяют оценивать релевантность по предложенным нами метрикам.
Шкала оценки коммерческой релевантности
В отличие от тех, кто предлагает оценивать данные о кликах и учитывать мнения пользователей, мы предпочитаем использовать оценки асессоров, т.к. такая методика вносит меньше шума в данные, чем сравнение данных о кликах с данными из тулбара. Если использовать только два последних типа данных, то очень сложно определить, остался ли пользователь удовлетворенным результатом поиска. Поведение пользователя, который задал коммерческий запрос, может очень сильно изменяться в зависимости от категории продукта, его стоимости и т.д. (сравните доставку пиццы и покупку линзы для фотоаппарата). В то же время, эти источники могут дать полезные данные, поэтому, мы дали к ним доступ асессорам. Мы выбрали четыре показателя качества, которые, мы уверены, дают всю необходимую информацию. Это означает, что сайт качество которого определено с помощью измерений данных показателей, включает в себя множество различных фич. Список метрик качества сайта включает в себя:
- надежность (trustability) ;
- юзабилити;
- качество дизайна;
- качество обслуживания.
Мы разработали детальные инструкции для асессоров. Согласно этим инструкциям, оценка состоит из двух этапов. На первом этапе асессор должен определить, является ли этот документ тематически релевантным для этого запроса. Мы используем шкалу с пятью оценками релевантности: нерелевантный, релевантный, высокорелевантный, полезный и витальный. Оценка же качества сайта — более сложное, время- и трудозатратное занятие, чем оценка тематической релевантности (а особенно — получение информации из данных о кликах). В нашем случае ситуация частично становится легче за счет того, что нужно оценивать только релевантные сайты. Мы не рассматриваем документы, оцененные как витальные или полезные, так как, зачастую, они оказываются единственным нужным пользователю результатом поиска. Как уже говорилось ранее, мы рассматриваем только пpaктически одинаковые по релевантности результаты. На первой стадии оценки, определяется количество и разнообразие сервисов и продуктов, предлагаемых документом по данному коммерческому запросу. Мы определяем три оценки разнообразия ассортимента: мало, стандартно, много. Оценка разнообразия ассортимента для запроса q и документа d определяется V(q,d). На второй стадии оценки для всего сайта определяются надежность, юзабилити, качество дизайна и обслуживания. У надежности и качества обслуживания есть 4 возможных оценки: спам, стандартно, хорошо и отлично. Сайт получит отметку «спам», если он не позволяет сделать покупку или заказать указанную услугу (фейковый сайт). Сайты с пометкой «стандартно» не плохи сами по себе, но не отличаются ничем особенным от тысяч других похожих коммерческих сайтов. Хорошие сайты предоставляют пользователям стандартный набор услуг, а отлично получают известные лидеры рынка. Надежность и качество обслуживания для сайта обозначаются T(s) и S(s) соответственно. Обратите внимание, что эти показатели не зависят от пары запрос q и документ d. У юзабилити и качества дизайна есть только три оценки: плохо, хорошо, отлично. Эти показатели обозначаются как U(s) и D(s). Все значения для указанных выше показателей варьируются от 0 до 1. Для использования в будущем информации о качестве в течение обучения ранжированию (машинное обучение - прим. переводчика), мы привели четырехмерную оценку к одному показателю коммерческой релевантности: где Rc(q,d,s) — это показатель коммерческой релевантности для запроса q, документа d сайта s. Вес надежности и уровня обслуживания в два раза выше, чем у других показателей. Это сделано по причине того, что мы считаем эти свойства более важными с точки зрения удовлетворенности пользователя, но не рассматриваем такой выбор коэффициентов как единственно возможный).
Обучение ранжированию с новыми показателями
Оценка коммерческой релевантности — это очень сложная задача и, при прочих равных, количество меток коммерческой релевантности будет значительно меньше, чем меток для тематической релевантности. Мы не можем не принимать во внимание оценки для тематической релевантности, у которых нет соответствующих оценок коммерческой релевантности. Это может привести к уменьшению выборки, ухудшению процесса обучения и, как следствие, ухудшению работы функции ранжирования. Таким образом, перед началом обучения процессу ранжирования, мы должны экстраполировать метки коммерческой релевантности на всю обучающую выборку. ПроцеДypa экстраполяции состоит из двух шагов. Во-первых, мы обучаем функцию ранжирования на небольшой выборке, которая содержит только метки коммерческой релевантности. Результирующая функция ранжирования дает нам ожидаемое значение коммерческой релевантности Rc(q,d,s), которое обозначается Rсest(q,d,s): После этого мы применяем функцию ранжирования из первого шага ко всей выборке с метками тематической релевантности. Это возможно, т.к. мы используем одни и те же методы ранжирования для обеих выборок. Т.к. только высокорелевантные документы получат оценки коммерческой релевантности, то эти ожидаемые оценки вычисляются только для пар запрос-документ, у которых очень высокий показатель тематической релевантности. Все остальные пары запрос-документ в обучающей выборке получат нулевое значение коммерческой релевантности. Получив значения для показателей коммерческой релевантности для всех тематически релевантных результатов запросов коммерческой направленности в нашей выборке, мы вычисляем единую оценку релевантности: где Rf(q,d) — это значение тематической релевантности, Ru(q,d,s) — это единая оценка релевантности и альфа — это весовой коэффициент. Используя единую оценку, мы обучаем функцию ранжирования на всей выборке. Весовой коэффициент альфа выбран эмпирически так, чтобы он максимизировал влияние коммерческой релевантности, но не влиял на метрики тематической релевантности. В итоге мы получаем функцию ранжирования, которая предсказывает единую оценку релевантности, которая, в свою очередь, включает тематическую релевантность и коммерческую.
Особенности измерения качества сайта
Для более точного предсказания новых меток релевантности, которые включают тематическую и коммерческую релевантность, мы предлагаем определенные способы, специфические для коммерческих сайтов. Они новы в том смысле, что пpaктически непригодны для ранжирования в терминах тематической релевантности, т.к. метки тематической релевантности не несут никакой информации о релевантности коммерческой. Но для аппроксимации коммерческой релевантности эти способы очень важны, т.к. они дают понимание о качестве страницы. Из некоторых разработок в этой области мы выбрали некоторые многообещающие способы и дополнили их своими разработками. Таблица 1 представляет список некоторых способов, использованных в нашем исследованием. Обратите внимание, что большинство этих методов — доменного уровня, которые агрегируют информацию из всех документов коммерческого сайта. Это согласуется с фактом того, что, согласно формуле (1), коммерческая релевантность зависит от качества сайта в целом. Сравнение обучения ранжированию с и без описанных методов качества дано в разделе результатов. Таблица 1.Параметры, для измерения качества сайта
- Детальная контактная информация.
- Страницы компании в социальных сетях.
- Отсутствие рекламы.
- Количество различных товаров.
- Детальность описания товаров.
- Наличие службы доставки.
- Наличие техподдержки (почта, телефон, форма обратной связи).
- Система онлайн консультаций.
- Скидки.
- Читабельность имени домена.
- Средняя длина URL.
- Средняя длина Title\\\'ов.
- Соответствие заголовка страницы её содержимому.
- Средняя вложенность URL.
Новые метрики для метода оценки
Для оценки своих результатов мы разработали две NDCG-подобные метрики основанные на человеческом мнении о коммерческих сайтах. Первая метрика представляет собой взвешенное качество результатов поиска для данного множества коммерческих запросов. Его значение для запроса q определяется как: где Rc(q, di,si) — это коммерческая релевантность для i-го результата поисковой выдачи для запроса q. Общее значение этой метрики для данного набора запросов — это просто среднее значение Goodness(q) среди всех запросов из множества. Чем выше это значение, тем лучше результат поиска. Наша вторая офлайн метрика показывает соотношение низкокачественных результатов поиска для коммерческих запросов. Аналогично первой метрике, она вычисляется для заданного множества запросов как среднее для запросо-зависимых значений по всему множеству. Выражение для запросозависимых значений выглядит так: где th — это порог минимальной коммерческой релевантности для результатов поиска. Чем меньше это значение, тем лучше результаты работы поисковой системы. Также, мы используем A\B-тестирование и чередуем онлайн эксперименты, чтобы оценивать свои результаты.
Результаты и обсуждения
Мы предложили новый способ измерения качества документов для коммерческих запросов — коммерческую релевантность. Мы разработали несколько свойств ранжирования для оценки качества сайта. Мы предложили метод экстраполяции дополнительных меток релевантности для всей обучающей выборки, что позволяет нам не терять в процессе обучения никакую информацию о тематической релевантности. Мы разработали оффлайн DCG-подобные метрики, наблюдали их изменения на протяжении экспериментов и внедряли информацию о качестве в функцию ранжирования. Рис. 1 показывает изменение метрики Goodness за некоторое время до и после модификации функции ранжирования. Горизонтальная ось — это ось времени, а вертикальная ось показывается относительное значение нашей метрики. Можно увидеть, что значение метрики увеличилось примерно на 30% по сравнению с предыдущим значением. Рис. 2 показывает изменение нашей второй метрики — Badness. Как и в предыдущем графике, горизонтальная ось — это ось времени, а вертикальная показывает относительное изменение значения метрики. Из графика видно, что Badness-метрика уменьшилась примерно на 70%. В то же самое время, значение классической NDCG метрики, вычисляемой только с учетом тематической релевантности, на протяжении всего эксперимента пpaктически не менялось. Мы сравнили наши результаты с обучением без учета новых коммерческих свойств. Улучшение Goodness и Badness метрик было примерно на 20% меньше, чем с учетом новых свойств. Наш онлайн эксперимент показал, что пользователи выбирают новые результаты ранжирования на 1% чаще, чем результаты стандартного ранжирования. При A\B-тестировании, наши результаты, учитывающие качество, показали уменьшение показателя отказов на 5% и увеличение соотношения кликов к показам на 1.5%. В следующей работе в процессе обучения будет использоваться набор меток релевантности вместо единственной суммарной оценки. Другой подход к дальнейшему улучшению коммерческих результатов поиска заключается в разработке новых коммерческих ранжирующих сигналов.
Комментарии:
Продвижение казахстанского онлайн-издания, новостника informburo.kz....
18 05 2026 2:57:25
Адаптивный линкбилдинг: будьте полезны людям, а не поисковикам....
17 05 2026 10:31:42
С каждым годом китайские маркетплейсы увеличивают свое влияние, и покупатели всё активней заказывают товары из Поднебесной. Но не всё скидки да покупки — обладатели интернет-аудитории и маркетологи могут еще и хорошо заработать на этих площадках....
16 05 2026 0:40:16
Сакральные знания о контекстной рекламе для экспертов и тех, кто с ними сотрудничает....
15 05 2026 22:56:32
Образ гармонии, почерк и потребности — рецензия на книгу Яна Чихольда «Облик книги»....
14 05 2026 0:40:49
Полезные советы для тех, кто делает контекст своими ручками :)...
13 05 2026 15:32:40
Кейс: SEO для сайта эpoтического массажа — ROMI 980% за 10 месяцев...
12 05 2026 1:38:16
Страховка, медицина, корпоративы, английский и оплата спортзала — знакомые плюшки IT-компаний. В этом материале читайте про редкие и необычные бонусы, которые предоставляются в некоторых IT-компаниях Украины....
11 05 2026 11:39:30
Сооснователь и главред Forbes Ukraine о вовлечении читателей в смысловое поле бизнеса...
10 05 2026 13:12:36
Если вам нужно быстро изменить небольшой объем контента на сайте без доступа к CMS, можно воспользоваться GTM. Как именно, читайте дальше....
09 05 2026 19:42:58
Знакомство с реальным и потенциальным клиентом. Как создать доверительные отношения? Для этого понадобится сделать сегментацию аудитории и определить, кто ваш покупатель: от рода занятий, до его самых сокровенных страхов. Узнайте больше!...
08 05 2026 15:16:20
Сколько стоил клик в Google Ads и Яндекс.Директ в Казахстане — цифры за первый квартал 2019 года...
07 05 2026 17:19:51
Пошагово подключаем скрипт проверки бюджета аккаунтов Google Ads. Скрипт отправляет уведомление на почту и в Telegram — это поможет вовремя пополнить счет. Узнать больше!...
06 05 2026 17:55:37
Личный опыт маркетинг-директора Serpstat. Внутренняя перелинковка, работа с контентом, настройка email-рассылок и построение качественного комьюнити помогли нам получить стабильный поток читателей и новых пользователей. Обо всем читайте дальше!...
05 05 2026 23:56:15
14 пунктов, которые помогут вам лучше изучить свой бизнес и подготовить эффективную SMM-стратегию...
04 05 2026 10:32:21
То, как вы читаете на мониторе или в смартфоне, значительно отличается от чтения книги или печатного журнала. Когда вы пишете текст для веба, очень важно знать об этой особенности....
03 05 2026 14:51:57
Используйте и интерпретируйте карты знаний Netpeak Group, чтобы экономить свои силы и время на создании собственных карт с нуля. Узнать больше!...
02 05 2026 4:32:22
Человеку стало плохо, он теряет сознание. Те, кто рядом, хотят помочь, но не знают, как это сделать. Давайте разбираться....
01 05 2026 15:32:50
Мы попросили спикеров ответить на острые для многих онлайн-проектов вопросы о развитии мобайла как канала, программатике и строительстве инхаус комaнд...
30 04 2026 6:50:26
Недавно у нас появился свой генератор мемов :) Во многих компаниях смешные слова и фразы стараются запомнить и передать следующим поколениям сотрудников. В Netpeak же долго работали над секретным проектом и... Читайте!...
29 04 2026 10:33:11
Бонус в статье: как собрать аудитории для ремаркетинга на брошенную корзину...
28 04 2026 5:36:23
Бесплатно, быстро и безопасно. Но есть и минусы. Узнать больше!...
27 04 2026 11:49:13
Инсайты от специалистов агентства Netpeak о популярных тематиках, тенденциях, особенностях продвижения в карантин и кризис, новых правилах для контекстной рекламы и других способов продвижения. Чтобы узнать больше, читайте далее!...
26 04 2026 23:15:46
Перво-наперво для мониторинга ошибок SEO-специалист открывает вебмастерку с подсказками Google — она же панель вебмастеров, она же Google Search Console...
25 04 2026 17:21:32
Чтобы создавать удобные отчеты, импортируйте данные из Яндекс.Директ в Microsoft Power BI с помощью язык R...
24 04 2026 17:40:20
Узнаем расширенную информацию о посещениях сайта с помощью языка R — кейс Netpeak...
23 04 2026 19:20:49
В помощь вебмастерам, которые поддерживают работу PBN....
22 04 2026 9:17:36
Блиц-инструкция и рекомендации по созданию эффективных описаний для мобильных приложений...
21 04 2026 4:39:34
Какой эффективный способ использовать для проверки бизнес-возможностей новых проектов ecommerce?...
20 04 2026 18:13:12
То, как мы разговариваем, важно не только в жизни, но и в соцсетях. Зачем нужен tone of voice и как сделать, чтобы ваш голос отличался от других и был эффективен? Читайте наш гайд....
19 04 2026 2:31:28
Простой способ отслеживания как внутренних, так и внешних битых ссылок. Узнать больше!...
18 04 2026 8:45:43
Почему кого-то ругают за плохие тексты, а у кого-то из-за таких же текстов берет интервью Юрий Дудь? И другие особенности контента: авторское право, копирайтинг. Читать!...
17 04 2026 19:53:45
Новости агентства Netpeak за предыдущий квартал. Появление отдела веб-аналитики. Открыли услугу «Создание и ведение блогов». Добавили мультивалютность. Глобально изменили скрипт Netpeak X-Reference. Запустили серию писем. Что еще?...
16 04 2026 20:25:40
Как узнать, что потенциальный сотрудник креативный, умеет убеждать, работать в комaнде, адаптироваться к быстрой смене условий, владеет эмоциональным интеллектом? Вопросы для проверки этих софт-скиллов здесь....
15 04 2026 12:41:19
Услуга уровня элит-класса в конкурентной нише и не в самом простом для продвижения регионе. Рассказываем, как привели целевой трафик по минимальной цене. Узнать!...
14 04 2026 21:41:28
Тренды, рекомендации, уроки, инструкции, а также вакансии, идеи, кейсы и всё, что поможет оставаться в теме, находить интересные проекты и вдохновляться. Читать дальше....
13 04 2026 4:18:39
Как купить дешевый трафик из Facebook? Образец работы со структурой рекламного аккаунта...
12 04 2026 7:33:25
О работе, креативности, мотивации и многом другом....
11 04 2026 21:58:46
Ежегодно в конце ноября начинается ажиотаж вокруг «огромных» скидок на Черную пятницу. Во всем мире этого дня ждут и готовятся покупать выгоднее. Но так ли это на самом деле?...
10 04 2026 12:33:17
Какую связь можно назвать «качественной» и как улучшить работу телефонии — советы от платформы Ringostat в новом посте....
09 04 2026 15:58:18
Техника безопасности по безукоризненным рекламным кампаниям...
08 04 2026 8:51:58
Что постить предпринимателям в соцсетях. Несколько примеров уместной работы SMM- и PR-специалистов, которые прямо и четко помогают озвучить позицию бизнеса в период карантина. Узнайте больше, чем действовать правильно!...
07 04 2026 23:42:40
Простая инструкция для новичков, как легко создать анимированные баннеры для рекламных кампаний с помощью бесплатного инструмента Google Web Designer. При создании баннера сервис предложит создать файл с нуля либо использовать шаблон. Узнайте обо всех возможностях!...
06 04 2026 3:56:27
Тема поста — исследование электронной коммерции в Украине: рынки, статистика, объем продаж, поисковый потенциал....
05 04 2026 3:33:29
Помимо полезного и качественного продукта, услуги, компании нужен мощный маркетинг. И возможно это только благодаря хорошему директору по маркетингу. Только так это работает. Кто лучшие в этой нише в Казахстане? Узнать!...
04 04 2026 0:27:14
И как проверить релевантность на своем сайте. Если речь идет о страницах (сайтах), подразумевается соответствие контента запросу. Чем точнее страница отвечает на запрос, решает задачу пользователя, тем (при прочих равных) выше ее позиция в поисковой выдаче....
03 04 2026 18:21:44
Гениальный математик создал систему, которая вполне может конкурировать с Google — Wolfram|Alpha. Или нет? Это не поисковик, тогда при чем здесь Гугл и теория вычислимости?...
02 04 2026 2:45:45
Представляем Netpeak Journal — новый этап развития блога Netpeak...
01 04 2026 21:42:24
Детальная инструкция по настройке рекламы мобильного приложения в Яндекс.Директ....
31 03 2026 10:18:51
У каждого сайта в топе есть страница, о существовании которой знают только роботы и... SEO-специалисты. Это robots.txt или индексный файл....
30 03 2026 3:32:43
Еще:
понять и запомнить -1 :: понять и запомнить -2 :: понять и запомнить -3 :: понять и запомнить -4 :: понять и запомнить -5 :: понять и запомнить -6 :: понять и запомнить -7 ::