Овертикализация рунета началась!

Беседовал Аркадий Морейнис. Директор по развитию и разработкам Рамблер Медиа

В чем состоит сегодняшняя проблема с качеством поиска?
Во многих случаях человек хочет получить не список ссылок на сайты, а ответ на свой запрос. И, опять же, во многих случаях не один ответ, а целую выборку, из которой он может выбрать наиболее подходящие ему ответы (списки цен, вакансий, подборку обзоров, расписания движения и т.д.).

Получается, что традиционные поисковики не могут обеспечить выдачу полных и структурированных данных?
Не вполне. Неструктурированный список ссылок не лучший вариант представления ответа на вопрос.

А как вы представляете себе идеальную выдачу?
В идеале пользователь вводит запрос, а система выдает ему информацию по запросу в нескольких разделах, рубриках, которые посвящены разным темам (цены, обзоры, статьи из Википедии и т.д.). Таким образом пользователь получает возможность выбирать информацию по запросу именно в той рубрике, которая наиболее соответствует его ожиданиям, а также смотреть на вопрос с разных углов зрения.

Когда приставку бета можно будет убрать совсем?
Проект продолжает оставаться экспериментом, выход из «закрытого» тестирования не означает, что продукт дошел до своей конечной стадии – «вышли на пьедестал, застыли в гордой позе» – вовсе нет. Например, Gmail до сих пор функционирует с приставкой бета, и в этом состоянии уже давно. Я бы сказал, что «бета» – это некий почетный знак, означающий, что система не застыла, но продолжает развиваться. Мы сознательно назвали свой проект именно так. Сейчас я могу заявить, что Бета – это общее название для целого семейства рамблеровких продуктов, и некоторые из них будут запущены уже в ближайшие месяцы.

Вы не одиноки в подобных начинаниях. В глобальном интернете пионерами этого направления стали Google (Universal Search Model), Ask.com (Ask3D Search Model), Microsoft (Blended Search Model), Yahoo.com (Structured Search Model).
Да, это лишний раз подтверждает, что мы развиваемся в русле основных мировых тенденций. Независимо от того, в какую сторону пошли соотечественники, мы выработали для себя особенный путь развития. И оказалось, в эту сторону идут мировые лидеры поиска. Бум новых алгоритмов начался в прошлом году, мы объявили закрытое тестирование в ноябре 2007, а разработку вертикального поиска начали гораздо раньше.

А как же новости и сообщения из блогов и форумов в основной выдаче Яндекса?
Я не отрицаю, что и Яндекс тоже экспериментировал в этом направлении. Но вопрос в том, кто выдвинет этот принцип во главу угла, кто сфокусируется на этом как на одной из центральных линий своего развития. Вопрос не в том, кто обозначит тенденцию, а в том, кто пойдет в этом направлении и своими разработками позволит людям находить полные ответы на запросы.

А разработки мировых гигантов в этой области повлияли на вертикальный поиск Рамблера?
Каждый из западных коллег, работающих в направлении совершенствования поиска, предлагает свой способ представления информации. У Google – полная мимикрия под результаты традиционного поиска, у Ask.com – вынесение результатов в правую часть экрана, однако пользователи зачастую игнорируют эту область страницы, т.к. она ассоциируется с контекстной рекламой. Microsoft, в своем Blended Search, первыми результатами представляет подборку картинок или ссылок на новости и т.д.

Мы провели юзабилити тестов, повторяя варианты мировых гигантов, но пока остановились на своем. Будем смотреть! Мы «развесили» на весь вертикальный поиск статистику, будем анализировать функциональность продукта не по опросам, а по данным от реальных пользователей.

Получается, западный опыт учитывали, но пошли свои путем – смешивать традиционный и вертикальный не стали. А рассматривается ли в перспективе их полная интеграция?
Именно в этом направлении мы и работаем. Как только мы поймем, что существующий интерфейс вертикального поиска стал понятен пользователям и с его помощью проще получить нужные результаты, мы сразу совместим его с традиционным.

Визуализация результатов
Что Вы подразумеваете под улучшением визуализации результатов поиска?
Здесь мы тоже хотим экспериментировать. Мы сделали то, чего еще нет ни у кого! Наша идея состоит в том, что мы сопровождаем каждый результат «картиночной» цитатой – наиболее релевантной данному запросу картинкой. Например, в документе присутствуют фото Джонни Деппа и Джорджа Клуни, при запросе «Джонни Депп» рядом со ссылкой на данный документ в результатах поиска будет картинка именно этого актера, а не Клуни.

Что-то подобное есть у Google в экспериментальном поиске – возможность показывать картинки из того документа, который нашла поисковая система. Однако сейчас Google не претендует даже на показ релевантных картинок: демонстрируются первые несколько из данного документа.

А вертикальный поиск претендует?
Да, претендуем – хотя не все результаты нас еще устраивает. Но, как я уже говорил, мы все время работаем над улучшением результатов. Просто выдача наиболее релевантной картинки из документа – отдельная сложная задача. К слову говоря, на ум приходит известная программистская поговорка: «Don`t underestimate the perversity of people coding html», т.е. «Нельзя недооценивать извращенности людей, которые пишут html».

Почему решили использовать «картиночные» цитаты?
По двум причинам. Сначала у нас была некая теоретическая гипотеза, которая потом подтвердилась исследованием. Человек воспринимает изображения лучше и быстрее, нежели текст. Это означает, что релевантность или нерелевантность человеку гораздо легче определить по картинке.

Картинки позволяют более равномерно воспринимать поисковую выдачу. Нам кажется, что это очень полезно, но я еще раз подчеркиваю – все, что мы сейчас делаем, носит статус эксперимента.

А о каком исследовании идет речь? Расскажите
Исследование «Google golden triangle», в ходе которого было определено, как распространяется внимание пользователей по поисковой выдаче. «Золотым треугольником» стала левая верхняя часть выдачи от первого до третьего результата, дальше внимание рассеивается.

Несколько позже они провели второе исследование «Search Engines 2008». На этот раз движение глаз пользователей отслеживали по выдаче с картинками. Обнаружили интересную вещь, «золотой треугольник» превратился в «грабли»! От картинок взгляд пользователя направлялся вправо, т.е. пользователь сначала «якорил» картинки и от них уже начинал читать текст.

Загадочные Вертикали
Сейчас в поиске 10 вертикалей. Агрегация материала происходит одинаково для всех или есть свои тонкости?
Все вертикали разные – от типа зависит и способ агрегации. Например, вертикаль первого типа – это просто подбор сайтов по определенной тематике, например, «Обзоры товаров». Буду откровенным, она выросла из Price.ru, который отбирал эти сайты для своих целей. Все эти обзоры давно работают как часть прайсрушного поиска. Вертикаль второго типа – агрегация материала. Мы не просто отбираем хорошие, авторитетные сайты, мы структурируем их информацию. Вертикаль третьего типа – это использование партнерских баз данных. Например, Price.ru, один из самых полных каталогов цен в Интернете. Собирать подобную информацию самим нелогично, если можно найти ее у партнера. И вертикаль четвертого типа – это подключение обезличенного типа данных – таких как курсы валют, погода и т.д.

Вы говорили, что «производство вертикалей» в ближайшее время будет поставлено на поток. Как быстро начнете обрастать вертикалями?
Мы уже работаем над несколькими новыми вертикалями, которые появятся в обозримом будущем. До конца года может появится, например, вертикаль, отвечающая за видеоконтент.

Поясните, что значит, «поисковик сам будет оптимизировать свои вертикали в результатах поиска»?
Не оптимизировать! Система будет выбирать, какие вертикали показывать пользователю, т.е. самостоятельно определять наиболее релевантную вертикаль по данному запросу.
Сейчас вертикали расположены в порядке релевантности (Прим.ред. первая из представленных – наиболее соответствует запросу пользователя) . Мы продолжаем тестировать визуализацию выдачи, в ходе чего поймем, стоит ли остановиться. Или есть другой вариант, например, сначала показывать ссылки на самые релевантные вертикали, а дальше уже предложить пройтись по самим вертикалям.

Финансовая вертикаль
Когда, по Вашим подсчетам, вертикальный поиск сможет полностью окупить себя?
Так как это бета-версия, мы еще немало будем вкладывать в разработку. Поэтому это вопрос, растянутый во времени, и про окупаемость пока говорить рано. Но монетизация вертикального поиска определенно выше, чем у традиционного, по нескольким причинам.

Прежде всего, остается традиционный способ монетизации поиска (контекст). Плюс к этому пользователь щелкает на вертикаль, где ему открывается куча дополнительных предложений на эту тему. Это позволит только ускорить монетизацию проекта. Т.е. мы рассчитываем на увеличение page view, что и является драйвером монетизации. Также часть вертикалей будет монетизироваться контентно, например, классическая вертикаль с теми же ценами – это PPC-система товаров.

Поиск еще не вышел из закрытой беты, а контекстная реклама уже размещалась. Это была первая попытка монетизировать проект?
Вовсе нет. Мы должны тестировать все составляющие, в том числе и контекстную рекламу. Естественно, мы не пытались нажиться на бета-тестерах. Не так вас много и было, а контекст это вещь, рассчитанная на большие объемы.

Традиционный поиск
Как сами оцениваете состояние горизонтального поиска Рамблера?
Продолжая вести разработки в новых направлениях, мы ни в коем случае не будем отказываться от традиционного поиска. Он остается для нас по-прежнему приоритетом номер один.

За последнее время мы очень многое сделали. Летом 2007 года релевантность традиционного поиска была порядка 70%, по сравнению с более чем 90% у конкурентов, но уже в сентябре релевантность навигационного поиска стала 90% – мы уже и по традиционным параметрам вернулись в группу лидеров.

А если вертикалями не будут пользоваться?
Возможно, не отрицаю! Именно поэтому мы и называем этот проект экспериментальным.
Выделенные вертикали могут не понравиться, предоставляемые результаты могут не устроить. Поиск главным образом настраивается на среднестатистического пользователя, потому что любая математическая модель описывает «поведение леммингов». Однако то, что рассчитано на большинство, в конкретном случае может не сработать.

Т.е от нерелевантных результатов по некоторым запросам никуда не деться?
На нерелевантные результаты нужно смотреть как на то, что не укладывается в математическую модель, и вносить изменения, использовать ручную подстройку, плюс нужно изучать обратную реакцию. А это возможно, когда есть объемы данных, сейчас мы в процессе накопления трафика и логов и уже скоро будем в состоянии понимать, что и как анализировать.

Также существуют некие вещи, которые статистические модели практически не покрывают, например, еще некоторое время назад понять, что по запросу «одноклассники» люди ищут сайт, было невозможно. И только когда набрался определенный статистический материал, это стало работать.

Чем обосновано такое упорное воскрешение традиционного поиска, почему не бросить все силы на вертикальный?
В интернете можно найти все, что угодно, поэтому, сколько бы мы ни строили вертикалей, горизонтальный поиск все равно остается тем самым цементом, который скрепляет все вертикали. Мы структурируем наиболее важные результаты, но существует закон «длинного хвоста» (прим.ред. длинный хвост – это шлейф низкочастотных, редко спрашиваемых запросов, объем которых в общей массе незначителен) – существует огромное количество разнообразных запросов, которые не покрыты ничем. Традиционный горизонтальный поиск в интернете всегда будет покрывать те темы, которые мы «неовертикалили», и оставаться дополнительным источником информации. Любая вертикаль конечна по определению, интернет – бесконечен.

Источник: seonews.ru