Май
Голосовой поиск: новый патент от Google
Можно ли привести поисковый механизм в действие одним или несколькими словами, просто сказав, что искать, без необходимости устанавливать специальное программное обеспечение для распознавания речи? Недавний патент Google посвящен именно этой проблеме.
Продолжая экспансию на просторах сети Интернет, Google пытается сделать всю информацию как можно более доступной и легко находимой. Продвигаясь в этом направлении, Google разработал голосовой интерфейс для поисковых систем. Патент номер 7.027.987, выданный 11 апреля 2006 года Бюро Патентов и Торговых Марок США, стал для SEO-сообщества настоящей сенсацией. Это событие может показаться неожиданным, но для него были серьезные предпосылки.
Во-первых, давайте обратимся к патенту, а именно к его авторам. Моника Хензингер, Александр Франц, Брайан Мильх и Сергей Брин. Эти имена, несомненно, стоит запомнить.
Патент предлагает следующее описание интерфейса: «система, представляющая поисковые результаты по голосовым запросам». Получив устный запрос от пользователя, система выводит одну или несколько гипотез оптимального различения, каждая из которых ассоциируется с весом запроса. После этого формируется взвешенный булевый запрос на основе оптимального различения гипотез. Затем данный запрос адресуется поисковой системе, которая в свою очередь предоставляет возможные результаты поиска пользователю.
Это более сложный процесс, чем описанный в работе Александра Франца и Брайана Мильха – «Голосовой поиск в Сети», появившейся в 2002 г. Тогда авторы проанализировали трудности, возникающие на пути создания интерфейса голосового поиска. Результатом этого труда было утверждение, что интерфейс сможет правильно представить устный запрос в 10 первых гипотезах, т.е. приблизительно в 60% случаев. Для того времени это был прорыв. Прошло 4 года, за которые многое изменилось и усовершенствовалось.
Немного истории
Говоря об истории, хочется сделать небольшой экскурс по фактам, предваряющим данное событие. Начнем, пожалуй, с инструментов преобразующих речь в текст (speech-to-text). На протяжении долгого времени они были весьма популярны. Конечно, на заре своего существования, такие программы не отличались качеством, во многом из-за тонкостей речи (например, акцента). Современные программы для распознавания речи гораздо превосходят своих родоначальников.
В 1999 году IBM заявляет об инструменте voice-in, text-out. В то время Big Blue объясняет этим тенденции уменьшения размеров сотовых телефонов. Тогда сервис 411, который позже эволюционировал в компьютерный сервис voice-in, voice-out, предполагал участие оператора, только в случае, если машина не сможет декодировать запрос.
В 2001 году Google подает заявку на настоящий патент. Приблизительно в это же время Франц и Мильх ведут свою работу над общим трудом «Голосовой поиск в Сети». Интересно и то, что одновременно появляется компания V-ENABLE, позиционирующая себя провайдером мобильного голосового поиска. Не имея никакого отношения к Google, администрация компании скромно считает будущий патент гуру поиска хорошим дополнением к своим технологиям.
Продолжаем путешествие во времени. Google регулярно размещает потенциальный товар на сайте в разделе Google Labs. Никаких широких рекламных акций не проводится, товары просто ждут, когда пользователь откроет их для себя. Именно так случилось с Google Voice, появившимся в 2003 году, который до сих пор можно найти в этом разделе. Он функционировал на основе звонка пользователя, сделанного с автоматизированного номера. Пользователь проговаривал запрос, а затем кликал на ссылку на демо-странице, где находил результаты поиска. Однако позже сервис был дезактивизирован. Тогда в блогах можно было найти следующие отзывы о его работе: «Это удивительно. Машина понимает, что ей говорят, и на экране сразу появляются результаты поиска».
Возможные трудности
Однако работа с поисковым интерфейсом, управляемым голосом только на первый взгляд может показаться простой. Во-первых, большинство поисковых запросов короткие, около 2-3 слов, максимум 6. Во-вторых, важно, чтобы поисковый запрос соответствовал ограниченному словарному запасу системы. Еще Франц и Мильх в своем труде отмечают, вокабуляр в 100 000 слов может покрыть только 80% запросов.
Но эти две проблемы отступают на задний план, если вспомнить, что голосовой поисковый интерфейс должен работать в реальном времени. Пользователи привыкли получать результаты в течение долей секунды; вряд ли их устроит продолжительное ожидание. Еще одной трудностью может стать интерпретация запроса пользователя, вызванная необычным акцентом или присутствием посторонних шумов. С текстом работать значительно легче; даже неправильное написание предполагает ограниченное число возможных вариантов, с которыми пользователь взаимодействует посредством предложения-ссылки «Вы имеете ввиду…», появляющейся в случае неверного написания запроса в Google).
Следует упомянуть, что Google не в одиночку занимается подобной деятельностью. Например, над преобразованием голоса в текст работает компания VoiceSignal; чуть раньше уже упоминалось о V-ENABLE. Деятельность компании Promptu также связана с голосовым поиском в мобильных телефонах. AgileTV разрабатывает программное обеспечение распознавания речи, главным образом, для телепоиска. В настоящее время подобной деятельностью занимается и компания Microsoft.
Зачем это нужно?
Самым наглядным примером применения голосового поискового интерфейса могут служить мобильные устройства, например, сотовые телефоны. По прогнозам специалистов доля рынка мобильных телефонов увеличится к 2008 г. до $11 млрд. Игра стоит свеч, и Google не может отказаться от участия в ней. Только представьте, как счастливы будут рекламодатели, получив дополнительный рынок сбыта контекстной рекламы! В центре событий окажутся компании, занимающиеся беспроводными технологиями, включая мобильный поиск.
Если задуматься, каким образом Google может увеличить область использования своего потенциально интересного предложения, сразу приходит мысль о поиске сделанных телефонных звонков. Вполне востребован будет голосовой интерфейс для карт и навигационных систем автомобилей. И на эту тему можно еще поразмыслить.
Источник: seonews.ru