Июл
Как поисковые машины формируют подсказки для поиска
Выбрать нужные слова для поиска не всегда просто. Особенно если вы ищете информацию по малознакомой теме. Но когда вы вводите поисковый запрос, вам довольно часто предлагают аналогичные запросы, которые могут быть релевантны. Подсказки могут располагаться в различных частях страницы, но они все же есть.
Если вы так же любопытны, как и я, то вам наверняка интересно как поисковик находит альтернативные запросы. Если вы ищете что-то, в чем не очень разбираетесь, то вам точно хотелось бы знать помогут ли эти альтернативные запросы. Если же у вас свой сайт, то вас может заинтересовать вопрос о том, что, возможно, стоит оптимизировать сайт и для этих альтернатив.
Недавно опубликованный патент, принадлежащий корпорации Microsoft, раскрывает несколько подходов к формированию поисковых предположений и их представлению.
Многие описания патентов включают в себя раздел, описывающий проблемы, которые данная разработка решит. Вот проблемы, упомянутые в патенте Microsoft:
1) Ограниченное пространство для презентации поисковых предположений.
2) Определение наилучшей организации поисковых предположений и релевантных запросов.
3) Исключение возможности отвлечения пользователя и создания помех в его поиске.
4) Перегрузка пользователей излишним количеством возможностей выбора (в самом патенте это называется «когнитивная нагрузка»).
5) Необходимость убедиться в том, что предоставленные предположения релевантны и могут помочь.
В описании патента более подробно раскрываются способы презентации и организации поисковых предположений. Именно эту информацию мы и рассмотрим далее.
К оптимизации поисковых предположений: Пользовательские интерфейсы и алгоритмы
Изобретатели: Feng Jing, Shuo Wang, Yang Jiangming, Lei Zhang
Принадлежит Microsoft
US Patent Application 20090171929
Опубликовано 2 июля 2009
Подано на рассмотрение 26 декабря 2007
Метод формирования поисковых предположений включает:
1) Использование алгоритмов для поиска возможных запросов связанных с тем, который вводится в данный момент.
2) Вычисление релевантности и частоты использования потенциальных кандидатов.
3) Выдача поисковых предположений, основанная на ранжировании оценок.
4) Организованная группировка поисковых предположений.
5) Описание связей между поисковыми предположениями и текущим запросом для удобства пользователя.
Вот некоторые алгоритмы, которые могут быть использованы Microsoft для определения поисковых предположений:
1) Алгоритм поисковой строки и частоты – определяет запросы-кандидаты, связанные с текущим запросом к поисковой системе. Кандидаты могут быть связаны с текущим запросом, если они содержат все его термины. Для связанных запросов считается, что они более релевантны, если они чаще запрашиваются. Этот алгоритм концентрируется на частоте запросов.
2) Алгоритм лог-сессии запросов – этот алгоритм тоже рассматривает логи запросов, но он также учитывает термины, которые искались в одной сессии с запрашиваемым. Этот алгоритм концентрируется на том, чтобы предоставить пользователю результаты релевантные «его намерениям», и при этом термины в запросе пользователя и поисковом предположении могут не совпадать.
3) Алгоритм контента поисковой выдачи – просматриваются результаты поиска по термину и из них выделяются ключевые термины или фразы. Этот подход может быть использован, если в логах запросов слишком мало данных для использования двух предыдущих алгоритмов.
Поисковыми предположениями могут быть:
1) Единичные ключевые слова
2) Комбинации ключевых слов
3) Популярные фразы
4) Связанные запросы
Запросы считаются связанными, если:
1) Включают в себя термины поданного запроса
2) Встречаются в значительном количестве сессий поиска
3) Содержат высокочастотные термины или фразы из результата выдачи
Поисковое предположение может быть отображено:
1) Вместе с результатами поиска как «похожие запросы»
2) Вместе с результатами поиска как «наиболее часто ищут»
3) В виде списка во время набора поискового запроса под строкой ввода
4) Другими способами
Вот еще несколько «классификаций» поисковых предположений, упоминаемых в патенте Microsoft:
Похожие запросы – запросы, которые считаются наиболее релевантными из наиболее часто используемых запросов с тем же термином.
Наиболее искомые – релевантные термины и фразы из наиболее часто используемых (в отличии от предыдущего случая, здесь ударение ставится на частоту запросов). Их чаще всего располагают вверху страницы выдачи.
Уточнение по запросу – эти предположения сужают область основного поиска. К примеру, запрос «морская рыбалка» может быть сужен до «морская рыбалка Флорида».
Расширение по запросу – противоположные предыдущим предположения, расширяющие область основного поиска. К примеру, запрос «морская рыбалка Флорида» может быть расширен до «морская рыбалка».
«Также попробуйте» – связанные запросы, содержащие лишь одну часть или не содержащие вообще элементов оригинального запроса. Например, поиск по «Derek Jeter» может дать предположение «попробуйте также» поиск по «Alex Rodriguez», так как это игроки одной команды, которые часто упоминаются вместе.
Группировка поисковых предположений
В патенте приводится хороший пример группировки поисковых предположений на основе поиска слова «prada».
Предположения могут быть организованы следующим образом:
[Линии продуктов] prada для женщин, prada спорт, partum spray
[Сумки Prada] женская сумочка, рюкзак, сумка на ремне, prada vela
[Материал] кожа, кожаный ремень, пластик, черная кожа
[Стили] темный, красный
[Prada в культуре] дьявол носит prada, herzog meuron.
Такая организация должна облегчить пользователю понимание поисковых предположений и причин, по которым они были предоставлены.
Мобильный поиск и автозаполнение
В патенте указывается, что для поиска с мобильных устройств было бы оптимальным предоставлять поисковые предположения в выпадающем меню под строкой ввода поискового запроса, так как это позволит уменьшить необходимое время работы с менее удобной, нежели обычная, клавиатурой мобильных устройств.
Впрочем, сейчас этот метод используется практически всеми поисковыми машинами и для всех пользователей.
Выводы
В патенте описываются три алгоритма для определения поисковых предположений. К сожалению, их описание недостаточно детализировано для того, чтобы понять, как они ранжируются между собой.
Поисковые предположения могут быть расположены в различных частях поисковой страницы в зависимости от типа предположения. Предположения, основанные на популярности или частоте выдачи, чаще всего выводятся верху страницы. В то же время предположения, основанные на релевантности или похожести, чаще всего выводятся внизу страницы.
Источник: seonews.ru