Есть два основных вида интерфейсов: пользовательские и инженерные. Первые предполагают открытость, интуитивность и удобство. Вторые — точность, гибкость и большие возможности для контроля, но требуют обучения и не прощают ошибок. МКПП и АКПП в автомобиле, любительские «цифромыльницы» и профессиональные камеры, Windows и Linux — вот примеры подобных пар.

Когда Интернет стал достоянием не только учёных и военных, для точного поиска информации потребовались более совершенные алгоритмы, способные находить то, что пользователь хочет, а не то, что он написал в запросе. Проще говоря, уже нельзя было требовать от обычного пользователя (как правило — клерка крупной компании) соблюдения дисциплины. Именно формализованность действий и дисциплина отличают инструменты для специалистов от «публичных».

Требовалось, чтобы система работала, даже когда пользователь вводит данные «неправильно», то есть более чем размыто: никто из пользователей не стал бы учить язык запросов, чтобы искать нужную информацию — как никто сейчас не использует конструкции вида: «SEO && форум /(-3 +2) ~блог» для поиска в Яндексе.

Первая проблема, стоящая перед поиском по документам состояла в обработке форм слова. В английском языке всё относительно просто — ведь там нет падежей и склонений. Намного интереснее ситуация обстоит с русским, славящимся на весь мир своей сложностью.

Запрос преобразован по форме слова, что хорошо видно по выделения в сниппетах. Яндекс нашел, что вы хотели, а не то, что вы набрали.

Ночной кошмар лингвопрограммистов — слова, имеющие разные значения при одинаковом написании. Обратите внимания, что картинки идут про сосуды, а первое место в выдаче — уже про автомобили.

Там, где не помогает формальная логика и поиск по словарю, как правило, предлагаются связные запросы (например, так работает Гугл-Орион). «Вольфрам» делает несколько иначе, пытаясь сразу же построить нечто подобное ассоциативной цепочке:

Научная система «с человеческим лицом»: пользовательский запрос интерпретируется в математически-предсказуемую форму, по которой ВольфрамАльфа уже и проводит исследование. Это пример того, насколько бывает нужной интерпретация по смыслу, а не по форме слова.

Если продолжать тему интерпретаций, то обязательно стоит коснуться синонимов: к примеру, по смыслу запросы «Метафест» и «Метафестиваль» очень и очень похожи — и выдача, в идеале, должна соответствовать именно смыслу, а не вхождениям. Тем не менее, сегодня мало какая из систем сможет это обработать. Приходится выкручиваться, прибегая к инженерному интерфейсу, или же надеяться на труды SEO-специалистов, упоминающих обе формы.

Когда поисковые системы начнут учитывать синонимы, главное — не строить слишком длинные ассоциативные цепочки.

Для русского поиска в какой-то момент стало важным разбирать слова, набранные на другом языке. В первую очередь это касалось торговых марок и названий компании — ведь раньше по запросу «Феррари» и «Ferrari» можно было получить две совершенно разных выдачи, тогда как по идее должна быть только одна.

Неважно, на каком языке вы говорите.

Следующая проблема поиска — это неверно набранный запрос. Когда Яндекс ввёл исправление опечаток и ошибок в запросах, по Рунету даже ходила шутка, что более половины пользователей используют его теперь для проверки орфографии.

Яндекс исправляет опечатки на основе данных по словарю и результатам поиска по исходному запросу.

А Google не ленится исправлять несколько опечаток, когда как Яндекс химией явно не интересуется.

Нигма предлагает исправлять опечатки, выбирая варианты вручную. В данном случае — не лучший вариант, но в качестве совмещения инженерного и пользовательского интерфейса выглядит очень интересно.

Google ищет прямое вхождение — и даже находит его. Как видно из следующего рисунка, «местный» Яндекс лучше знаком с реалиями отечественного поиска и сразу подсказывает, кого именно следует искать.

Автоматическое переключение кодировки плюс исправление опечаток позволяют пользователю совершенно не задумываться о дисциплине при наборе запроса — то есть система делает ещё один «шаг к народу».

Ещё одна важная ступень – это интерактивная помощь пользователям. Почти каждая поисковая система уже «научилась» давать подсказки пользователю, сразу же снимая необходимость набирать запрос полностью. Предполагается, что подобная система даёт возможность не только сократить время на ввод запроса (что очень актуально для неопытных пользователей), но и дать возможность использовать тот конкретный и популярный запрос, который даст заведомо хороший результат.

Для медленных каналов (dial-up, GPRS) это не лучший вариант, но если скорость достаточна – всё становится на порядок удобнее.

Поисковые системы помогают вам точнее и быстрее сформулировать запрос. Иногда предположение оказывается настолько захватывающим, что вы забываете, что хотели найти изначально.

Ещё один из интересных вариантов поиска «на лету» – это сервис fastgoogle.ru, ищущий прямо в процессе набора. Он помогает конкретизировать запрос, уже опираясь на данные поиска – так же как Нигма помогает подсказками прямо в строке поиска.

Нигма даёт просто неоценимые сведения из самых разных областей знания.

Резюмируя, можно отметить, что, поскольку поисковые системы относятся к одним из самых массовых ресурсов Сети (и, как правило, самым дорогостоящим), следует ждать дальнейшего повышения удобства и приближения к человечности.

Вершина цепочки последовательных улучшений – общие запросы, требующие интеллектуального анализа, например: «ей, компьютер, найти мне что-нибудь интересное» или «поищи под настроение этой музыки». Остаётся надеяться, что поисковые системы, приблизившиеся к пользователю по уровню мышления (или симуляции мышления) настолько, не захватят мир.

 

Источникseonews.ru

Поделиться в соц. сетях

Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Одноклассники
Опубликовать в Яндекс
Опубликовать в Мой Мир

Рекомендуем ещё