Окт
Nigma.ru – исследовательский проект: интервью с руководителем команды разработчиков Nigma.ru, Виктором Лавренко
Интеллектуальная поисковая система Nigma, которая была запущена в 2005 году, является первым кластеризующим поисковиком Рунета. Не так давно поисковик провел обновление системы, которое должно улучшить как качество поиска, так и удобство использования.
Редакция Searchengines.ru побеседовала с руководителем команды разработчиков Nigma.ru и основателем проекта, Виктором Лавренко.
1) Nigma – единственное “биологическое” и, тем самым, нестандартное название, почему именно “Nigma”? Не боялись ли вы вызвать у потенциальной аудитории ассоциативное неприятие, ведь пауков вряд ли можно назвать “любимцами” человека?
2) Ваш поисковик везде упоминается исключительно как “интеллектуальный” поисковик; почему так? Остальные поисковики не интеллектуальны?
Позволю себе ответить сразу на оба этих вопроса, так как они взаимосвязаны. Дело в том, что другие поисковые системы на самом деле создают поисковых роботов, и не стараются их сделать более интеллектуальными, а развивают другие сервисы – почты с безразмерным ящиком, спутниковые карты высокой детализации и т.п. Это все очень хорошие проекты, но у нас другие цели – создание новых поисковых алгоритмов, поэтому мы максимально сконцентрированы на том, чтобы создать такую систему, которая хотя бы приближенно пыталась «понять» как запрос пользователя, так и содержимое сайтов, которые она выдает в ответ. Именно поэтому мы назвали нашу систему, которая структурирует Всемирную Паутину (World Wide Web), как один из видов пауков, что кажется нам очень логичным.
Относительно неприятия могу сказать, что насколько мне известно, словосочетания «человек-паук», «всемирная паутина» и т.п. неприятия не вызывают, но наоборот – выражают одни из самых положительных современных образов, поэтому мы тем более не боимся, что слово «Nigma» может вызвать какое-то неприятие.
3) Насколько я знаю, интеллектуальный поисковик Nigma является совместной разработкой факультетов МГУ: факультета вычислительной математики и кибернетики и факультета психологии. Какой вклад в развитие поисковой системы может сделать факультет кибернетики, понятно, но какова роль факультета психологии? Что привнесли в поисковик психологи?
У нас исследовательский проект, целью которого является облегчить поиск информации даже для тех, кто точно не знает, что хочет найти. Таких довольно много (см. результаты нашего опроса*) и психологи помогают создавать алгоритмы и для таких пользователей. Многие из этих идей еще не реализованы, какие-то находятся в процессе кодирования.
4) Кто является аудиторией Nigma? Каков среднестатистический пользователь вашей системы? Что он ищет?
Мы не позиционируемся на какую-то особенную аудиторию и поэтому, на самом деле, несмотря на студенческое происхождение проекта, не оптимизируем наши алгоритмы как-то специально на молодежную аудиторию, хотя, скорее всего, концентрация студентов в нашей поисковой системе больше, чем в других поисковиках. Маркетинговых исследований нашей аудитории мы не проводили, т.к. рекламу на результатах поиска мы (по крайней мере сами) не продаем, а основной наш фокус – это технологии. Поэтому, высчитывать какой-то среднестатистический портрет пользователя нам кажется бессмысленным – мы стараемся сделать поисковую систему так, чтобы она могла ответить на вопросы любого пользователя.
5) В пресс-релизе, посвященном обновлению системы Nigma, говорится, что поисковик поместил на главную страницу ссылки на ресурсы, которые наиболее интересны пользователям. Как проводился отбор? Не боялись ли Вы, что “вкус толпы” может повредить имиджу системы?
Научность нашего проекта (особенно в части изучения психологии пользователей) в том числе заключается в подобных экспериментальных исследованиях, а не в работе на имидж. Если пользователям панель со ссылками понравится, мы ее оставим и будем считать эксперимент удачным. Если нет – уберем и будем продолжать проводить другие эксперименты.
В данный момент отбор проводился путем анализа кликов пользователей по ссылкам в результатах поиска, популярности сайтов по аудитории и индексу цитирования. По мере сбора статистики использования этой панели мы, возможно, будем менять используемые сейчас алгоритмы.
6) Какие цели ставит перед собой Nigma? Как оценивает свои шансы?
Наша цель – дать возможность любому человеку, вне зависимости от его навыков работы с компьютером, найти любую интересующую его информацию и помочь ему даже в тех случаях, когда он не только не может четко сформулировать свой запрос, используя сложные языки запросов традиционных поисковых систем, но и выдать интересные результаты даже тогда, когда пользователь сам не знает, что он хочет искать.
Для достижения этой цели наш коллектив занимается разработкой новых поисковых алгоритмов и с учетом того, что в ближайшее время наш штат, вероятнее всего, удвоится, мы сможем двигаться к нашей цели еще быстрее.
7) В недавнем времени появилась новая версия поисковика, которая сейчас находится в стадии тестирования, чем она отличается от старой?
Во-первых, мы переписали всю интерфейсную часть кода Нигмы, поэтому теперь будет легче и быстрее вносить модификации в алгоритм работы поисковика, делая его еще более удобным для пользователей.
Во-вторых, в новой версии упрощено использование системы кластеризации. Теперь пользователи смогут не только исключать сразу несколько кластеров из результатов поиска, но и наоборот – включать только нужные им.
В-третьих, добавлена возможность расширенного поиска и создан алгоритм, который умеет преобразовывать расширенный запрос в запрос с синтаксисом языка запросов.
В-четвертых, теперь при исправлении слов учитывается частотность исправляемых слов, а также исправляются составные слова и слова с приставками.
В-пятых, новая версия Nigma.ru содержит обновленный алгоритм поиска по электронным библиотекам. Список доступных сайтов был тщательно отфильтрован, неработающие и устаревшие библиотеки из результатов поиска исключены. Помимо стандартных электронных библиотек и дополнительных баз данных по юриспруденции, психологии и философии, добавились базы данных и по компьютерной тематике.
Если верить данным, предоставленным на сайте проекта, над ним работает 15 человек. Насколько велика нагрузка на команду? Как распределены роли?
В настоящий момент у нас работает 7 программистов, 1 системный администратор, и технический директор, который ими руководит. Три человека работают в службе поддержки пользователей. Также в штате состоит один человек, в данный момент являющийся студентом Стэнфорда, который координирует разработку нашего американского поисковика, и один человек, который помогает нам создавать китайскую версию. Остальные сотрудники обеспечивают инфраструктуру проекта.
Кроме того, у Нигма.ру есть еще и дочерняя компания, которая занимается инвестициями в стартапы.
9)Насколько Вы планируете расширять свой штат? Какими качествами должны обладать потенциальные сотрудники Nigma?
Мы планируем примерно удвоить наш штат, т.к. это необходимо для разработок нашего собственного индекса, который будет построен на совершенно иных, нежели у традиционных поисковиков, принципах, а также альфа-релиза американского и китайского поисковика.
Чтобы стать сотрудником Nigma.ru нужно иметь желание придумывать новые алгоритмы и способности их реализовывать.
10) Расскажите, пожалуйста о Ваших планах. Система обновляется очень динамично, что ждет ваших пользователей в недалеком будущем?
Мы по-прежнему будем продолжать улучшать наши поисковые алгоритмы и по-прежнему вряд ли будем удивлять наших пользователей какими-то непоисковыми проектами. В начале декабря мы объявим о наших разработках экспериментальной версии американского поисковика и, возможно, внедрим часть этих алгоритмов в российской версии Nigma.ru
* Результаты опроса пользователей, проведенного исследователями Nigma.ru:
Когда вы заходите на поисковую систему, чаще всего вы:
- точно знаете, что хотите найти; можете это сформулировать – 52%
- примерно представляете, что вам нужно; необходима помощь в формулировании – 40%
- вообще не знаете что искать; хотите просто найти что-то интересное – 7%
- плохо понимаете, что вы ищете; нужен совет, что и как найти – 2%
Источник: www.searchengines.ru