Мар
Руководство по оценке качества поиска Google
В начале марта 2013 года Google официально опубликовал версию 1.0 руководства для асессоров по оценке качества поиска. Документ насчитывает 43 страницы и является официальной сокращенной версией руководства, утвержденного в ноябре 2012 года. Любопытно, что ранее в интернет уже просачивалась версия 3.27 General Guidelines. Она была датирована 22 июня 2012 г. и содержала 161 страницу.
«Общее руководство по оценке качества поиска», прежде всего, предназначено для асессоров Google, работающих по всему миру, и оценивающих качество веб-страниц и поиска в целом. В документе приводится подробное изложение основных принципов, которыми должны руководствоваться асессоры Google в ходе своей работы. Руководство включает в себя инструкции по оценке качества поиска, кроме того, в нем рассматриваются подробные примеры оценки страниц, перечислены наиболее распространенные случаи сложностей, возникающих у асессоров при оценке сайта.
Основное, что следует усвоить веб-мастерам из приведенного документа: асессоры оценивают не домен в целом, а каждую страницу сайта в отдельности, присваивая ей определенный рейтинг. Далее, исходя из общего рейтинга страниц, сайту присваивается их усреденный рейтинг. Кроме того, в настоящее время все поисковые запросы Google делит на: навигационные – если пользователь осуществляет поиск конкретной веб-страницы по ссылке; информационные – когда ищут информацию по определенной теме; и деловые – когда пользователь ищет конкретный продукт или услугу.
Также представители Google напоминают, что весь основной контент интернет-гигант делит на следующие категории:
1. Основной контент: новостные статьи, записи в блогах, информация о продуктах и услугах, видео, поисковые блоки или области для ввода логина и пароля при входе на сайт.
2. Дополнительный контент: элементы внутренней навигации, ссылки на похожие продукты или ссылки на видео.
3. Рекламный контент: рекламные объявления, ссылки на спонсоров, списки спонсоров и т.п.
При этом, участники команды Google заявляют, что ни один из перечисленных типов контента не является доминирующим для поисковой системы. Это значит, что ни одному из типов контента автоматически не присваивается ни высокое, ни низкое качество. Также рейтинговая оценка не может быть выставлена только исходя из соответствия запросу. Асессоры обязаны выставлять оценки исключительно, исходя из качества контента опубликованного на странице.
Теперь рассмотрим документ Google подробнее:
Первая глава первой части Руководства посвящена оценке страниц сайтов в целом. В ней приводится руководство по работе с интерфейсом для асессоров, руководство по оценке URL, информация о безопасности в интернете, напоминания о том, каким критериям должны соответствовать асессоры Google.
Во второй главе даются более подробные инструкции по изучению и рассмотрению поисковых запросов и оценке контента на предмет соответствия запросам пользователей. Приводится классификация запросов, рассматриваются проблемы многозначных, информационных, локальных, навигационных и других наиболее «проблемных» поисковых запросов.
Третья глава «Общего руководства по оценке качества поиска» посвящена работе асессоров с языковой классификацией главных страниц сайтов (Landing page).
В главе 4 речь идет о присвоении страницам специальных категорий, исходя из их полезности для пользователей. На сегодняшний день в Google разработано 6 таких категорий: Vital, Useful, Relevant, Slightly Relevant, Off-Topic (Useless), Unratable.
Расскажем о каждой категории подробнее:
Категория Vital – присваивается страницам, когда поисковый запрос пользователя, связанный с ними, может быть многозначным. При этом одно из значений должно быть явно доминантным и превалировать над остальными. Запросы подобного рода часто задаются пользователями в отношении компаний, мест, продуктов, персон, организаций и т.п.
К категории Useful может быть отнесена релевантная страница с большой вероятностью полезности для пользователей, перешедших на нее из результатов поиска по конкретным запросам.
Категория Relevant – присваивается релевантным страницам, которые могут быть полезны для достаточно большого количества пользователей. Ее основное отличие от категории Useful заключается в том, что страница категории Relevant может быть несколько менее свежей или находиться на менее авторитетном ресурсе.
Категория Slightly Relevant (буквально: слабо соответствующая страница) присваивается странице, которая в соответствии с косвенными признаками могла бы быть полезной большинству пользователей и напрямую не связана с поисковым запросом. При этом, все же такие страницы должны присутствовать в выдаче, поскольку отдельные пользователи могут найти на них информацию, соответствующую именно их потребностям.
Категория Off-Topic (Useless) присваивается страницам, нерелевантным большинству поисковых запросов, а значит, и малополезным для пользователей страницам. Заключительная категория
Категория Unratable присваивается страницам, в случаях, если их невозможно оценить. Данный статус присуждается страницам в двух случаях: если страница не загружается или если она при запросе на одном языке (к примеру, на французском) она загружается на другом (к примеру, на итальянском). Важно, что страницы на английском языке не считаются иностранными ни для каких запросов. Также в качестве иноязычных не рассматриваются страницы, содержащие изображение, понятное человеку, говорящему на любом языке; страницы со ссылкой для скачивания любого программного продукта; многоязычные страницы, если на них содержится большой объем информации на языке запроса.
Отдельная инструкция посвящена невозможности загрузки страницы: так, если страница открывается в виде пустого бланка; содержит неработающие коды перенаправления (редиректы); выдает сообщение об ошибке или при ее открытии появляется уведомление о наличии вредоносной программы – асессор должен присвоить ей категорию Unratable.
Глава 5 Руководства посвящена «общим проблемам ранжирования» и «содействию улучшению интернета в целом». В ней даются общие рекомендации асессорам относительно оценки релевантности страницы с точки зрения языка запроса, приводятся дополнительные примеры многозначных запросов. Приводятся примеры интерпретации запросов с точки зрения их соответствия информации, содержащейся на главных страницах различных компаний:
Здесь Google призывает асессров руководствоваться принципом максимальной полезности для пользователя той или иной страницы, а также обращать внимание на даты ее создания и последнего обновления. Более свежий контент следует расценивать как более полезный пользователю.
В главе 6 рассматривается еще один тип меток – это метки, указывающие на спам, «сомнительное содержание» сайта или наличие вредоносных программ.
В Google существует следующая классификация спам-меток:
1. Метка Not Spam устанавливается если страница полностью соответствует всем требованиям к публикации веб-страниц.
2. Метка Maybe Spam применяется если у асессора возникает подозрение в том, что страница является спамной.
3. Метка Spam должна использоваться асессором в том случае, если на странице замечены явные признаки спама.
Еще одна разновидность меток – порно-метки. Асессоры в обязательном порядке должны применять их, если страница содержит какие-либо признаки наличия порнографического содержания. Это могут быть изображения, тексты, видео, рекламные сообщения соответствующего характера. Важно отметить, что данная отметка может иметь региональный характер: так контент, не считающийся порнографическим в одной стране, может быть признан таковым в другой. Это связано с культурно-историческими особенностями отдельных стран.
Классификация меток для порно-контента выглядит следующим образом:
1. Метка Clear Non-Porn Intent присваивается страницам, если пользователь попадает на них по обычным явно не порнографическим, запросам. Кроме того, такой контент автоматически признается Off-Topic (Useless).
2. Метка Possible Porn Intent присваиваются в случаях, когда запрос может иметь как порнографическую, так и не порнографическую интерпретацию. В качестве примера приводятся следующие англоязычные запросы: [girls], [gay], [thong], [breast], [sex], [spanking]. В Google их называют Possible Porn Inten (возможно, порнографические намерения). В таких случаях асессоры должны считать приоритетными непорнографические запросы и рассматривать страницы с «сомнительным содержанием» как порнографические.
3. Метка Clear Porn Intent присваивается откровенно порнографическим страницам, релевантным порно-запросам.
Еще один тип меток касается зараженных страниц. К этому вопросу подходит следующим образом: даже если на странице есть качественный, свежий и релевантный контент, но она содержит вредоносное ПО, следы вируса или трояна – ее позиции в выдаче будут очень низкими.
Исходя из этого правила, Google применяет метку «Malicious». Она присваивается страницам, если на них появляются незакрывающиеся всплывающие окна или, когда открытие страницы повлекло за собой попытку загрузки вредоносной программы. При этом важно знать, что если на странице появилось окно браузера с предупреждением о наличии вредоносного ПО, то статус «Malicious» ей не присваивается рейтинг Unratable – невозможно загрузить страницу.
Во второй части «Общего руководство по оценке качества поиска» приводятся разнообразные задания для асессоров и рассматриваются примеры их решения. В большинстве своем они направлены на оценку URL.
Часть 3 посвящена аспектам ранжирования геозависимых и геонезависимых запросов. Здесь асессорам рекомендуется присваивать более высокие рейтинги как геозависимым, так и геонезависимым запросам, которые могут быть полезны пользователям. При этом, если пользователи ищут определенные места, адреса, объекты наивысшие позиции в результатах выдачи будут получать официальные сайты и страницы этих объектов. В свою очередь, страницы справочников и сайтов с упоминаниями адресов этих организаций будут ранжироваться хуже. Также Руководство советует асессорам придерживаться общего правила: если у специалиста возникает трудность с определением, является ли запрос геозависимым, то страницы, содержащие релевантную информацию нужно ранжировать как по геонезависимому запросу.
В остальных частях Руководства рассматриваются вопросы рекламного контента и поискового спама. Здесь интернет-гигант советует асессорам опираться на рекомендации по обеспечению качества поиска, данные ранее веб-мастерам и разработчикам сайтов.
Google напоминает, что поисковая система строго наказывает за использование:
- Автоматически сгенерированного содержания;
- Участие в схемах обмена (а также купли/продажи) ссылок;
- Маскировок (клоакинга);
- Скрытой переадресации;
- Скрытого текста и скрытых ссылок;
- Дорвеев;
- Дублированного содержания;
- Участия партнерских программах при полном игнорировании качественного контента на сайте;
- «Накачивания» страниц нерелевантными ключевиками;
- Создание фишинговых страниц;
- Злоупотребление разметкой для создания расширенных описаний страниц в результатах поиска. При этом, нарушением считается, если разметка не видна пользователям, а также, если она не соответствует контенту или вводит пользователей в заблуждение;
- Отправки автоматических запросов в Google.
Вместо этого Google рекомендует веб-мастерам тщательно отслеживать все попытки взлома сайта и удаления его содержания. Оперативно удалять спам, созданный пользователями, и не допускать возможности его проникновения на ресурс.
Говоря об отличии спам-страниц от качественных, представители гиганта поиска напоминают: если страница в полной мере соответствует критериям полезности для пользователей и содержит некоторое количество PPC-объявлений, она вполне может быть признана качественной.
Асессорам следует оценивать, удовлетворяет ли страница требованиям полезности для пользователя. Иными словами, присутствует ли на ней:
- обмен полезной информацией;
- обмен мнениями реальных людей;
- возможность публикации вопросов и ответов, отзывов о товаре;
- развлекательная составляющая;
- возможность обмена медиа-контентом;
- возможность обмена пользователей файлами;
- наличие контактной информации о продавце и производителе товара;
- наличие купонов, скидок, спецпредложений.
Как видно из приведенного материала, руководство Google уделяет все более пристальное внимание работе над качеством собственной поисковой выдачи, привлекая к этому процессу не только огромный штат корпорации, но и асессоров со стороны. Еще одним доказательством данному утверждению является и то, что Google на днях рассказал своим пользователям о том, что происходит между нажатием кнопки «Поиск» и появлением страницы с результатами на специально созданном сайте «Как работает поиск».
Источник: www.searchengines.ru