Искусственный интеллект поисковых машин

Главная задача любой поисковой машины — это дать ответ, на вопрос который задал ей пользователь. И не простой ответ – а такой, который смог бы удовлетворить интерес пользователя, и при этом чтобы он приложил как можно меньше своих усилий.

Когда пользователь пишет какой-то запрос, то поисковая машина даже не заходит на сайт, а просто ищет по своей базе сайтов. В этой базе поисковик находит все те странички, которые полностью ну или хотя бы частично совпадают с тем самым поисковым запросом, который ввел пользователь, после чего она пытается расположить найденную информацию, (ссылки на те страницы которые имеют какое-то отношения к самому запросу). Таким образом, что бы они лучше всего отвечали на запрос того самого пользователя. В результате те страницы, которые больше всего отвечают запросу, те и находятся на первых местах поисковой выдачи.

Такая сортировка результатов поисковой машины, называется ранжированием. Собственно с ранжированием и связано, даже можно сказать, очень тесно связано само качество поиска. А получил ли пользователь ответ на свой вопрос, после того как посетил сайт который ему предложила поисковая система, или не получил? Откуда это знать поисковой системе. Именно для этого и нужен искусственный интеллект, чтобы поисковик сам мог принимать решения, о том была ли предложенная им страница, интересна гостю. И при всем этом еще и учится.

Вы наверняка скажете. Как поисковая машина может сама учиться? Ответ будет примерно такой. Ну для начала учитываем поведенческие факторы. Например, если наш пользователь задал поисковой системе какой то вопрос, и после открыл парочку сайтов и на страницах одного из них провел больше времени чем на других, то можно думать, что на том сайте, или на той странице была найдена та информация которую искал наш гость. И в будущем страницу этого сайта можно будет поднимать выше, по этому запросу.

Есть конечно и другие факторы, но эта тема будет раскрыта в следующих статьях.

А в 2009 году в поисковике Яндекс появился еще один новый метод самостоятельного обучения, которому дали название MatrixNet.

Особенность этого метода обучения заключается в том, что поисковик, или вернее поисковая машина может учитывать большее количество факторов ранжирования, а также она поддается обучению. Благодаря такому методу, отсеиваются нерелевантные и нетематические страницы. Так же эта система умеет еще менять для различных запросов саму формулу ранжирования, благодаря чему и получаются точные поисковые результаты.

Так что как мы видим, выдумки писателей фантастики начинают сбываться. Но конечно очень хочется верить в то что, этот искусственный интеллект не перерастет и не продаст своего творца и не станет над ним хозяином.

Оставьте комментарий