Май
20

Скрытая сторона графа знаний

На прошлой неделе Google начал использовать алгоритмы семантического поиска и выдавать их результаты на главной странице поисковой выдачи. Этот функционал получил название «графы знаний». В настоящее время Google создал индекс семантического поиска, включающий упоминание по более чем полумиллиарда объектов и 3,5 млрд. фактов, событий, упоминаний, связанных с ними. В качестве исходника для формирования графа были использованы такие источники данных, как Freebase, Wikipedia и Книга фактов ЦРУ, данные Всемерного банка и т.п..

Теперь Google вместе с основной поисковой выдачей предоставляет короткую справку в стиле WolframAlfa и список объектов, обозначаемых поисковым словом или запросом. Например, введя поисковый запрос Леонардо Да Винчи, можно получить объекты – художник, корабль, кинофильм, книга и даже одноименное казино, существующее в одной из стран.

Вообще надо сказать, что пионером такого подхода к поиску была российская система Nigma.ru. Эта система в удобном для пользователя виде реализовала подход к семантической фильтрации объектов, позволяющий значительно повысить релевантность поиска. Однако вот уже несколько лет система практически не развивается также как и другие российские поисковики, за исключением Яндекса.

Интересно отметить, что семантический поиск Google доступен только на английском языке, исключительно для жителей США и Великобритании. При этом руководители компании отказались отвечать на вопрос, собираются ли они реализовать семантический поиск на других языках.

Поисковый инженер Google Бен Гомес сказал: «Наша цель – помочь вам более глубоко изучить тему. Мы обеспечим вас основой, которую можно использовать для организации информации. Если же вы захотите более глубоко разобраться в теме, мы предоставим вам ссылки на страницы в интернете». Подавляющая часть экспертов отметила, что новый подход к поиску позволяет Google на большее время задерживать пользователей на странице поисковой выдачи. Соответственно, резко возрастает и стоимость рекламы на ней.

Надо сказать, что Google мог реализовать этот подход еще пять лет назад. Уже в 2007 году Google были частично разработаны, частично приобретены патенты, позволяющие осуществлять семантическую фильтрацию и выделять классы объектов в рамках общего наименования.

Возникает вопрос, почему Google ждал столько лет и запустил эту систему только сейчас. Существует несколько вариантов ответа. Мне представляется, что одной из главных причин является огромная популярность в Америке вопрос-ответных сервисов, аналогичных мобильных приложений и успехи WolframAlfa.

Вопрос-ответный подход отличается от поиска тем, что сразу же выдает пользователю концентрированные как правило, релевантные, сведения о том или ином объекте, субъекте, товаре, услуге и т.п. В принципе, как представляется, неявный переход на вопрос-ответную систему стал причиной того, что вот уже несколько лет поисковые алгоритмы Яндекса практически не совершенствуются. В отличие от американцев руководители Яндекса, отвечая на соответствующий вопрос, откровенно высказались относительно запросов и уровня пользователей. Смысл ответа был в том, что раньше в интернете жили продвинутые юзеры, а теперь сидят беспросветные ламеры, которые не хотят ничего искать, а желают получить все готовое и «на блюдечке».

В связи с графом знаний хотела бы обратить внимание на скрытую сторону этой новации. С одной стороны, очевидно, что Google заинтересован в большем времени пребывании на своих страницах. Он вынужден отвечать на запросы пользователей, требующих облегчения поиска, а точнее, желающих вообще отказаться от каких-либо усилий. Однако, в перспективе понятно, что главное богатство Google – это не только и не столько пользователи, сколько владельцы сайтов, блогов и других ресурсов. Вся экономика  корпорации построена не на плате пользователя, а на оплате со стороны тех, к чьему ресурсу Google доставляет этих самых пользователей.

Как будут развиваться события дальше?  Очевидно, что в любом деле по мере его развития идет процесс перехода от универсальных систем к дифференцированным. Самый яркий пример – это дифференциация товаров и услуг по ценовым нишам. Соответственно в самые ближайшие годы можно ждать дифференцирования поисковиков по уровню продвинутости или, о чем не принято говорить, интеллекта пользователей. Одних будут удовлетворять элементарные вопрос-ответные машины и приложения, для других будет сохраняться усовершенствованный современный поиск, для третьих, вероятно,  будут созданы поисковые машины, позволяющие использовать в автоматическом режиме гибкие языки запросов и многообразный функционал поиска. Думаю, что Google запустив свой граф знаний, сделал первый шаг в этом направлении. Как мне кажется, поисковый гигант отнюдь не захочет делиться никакой частью своих пользователей с другими поисковиками. А соответственно весьма вероятно, что в  скором времени в рамках единой поисковой платформы Google предложит несколько отличающихся алгоритмами, функционалом  и способом организации поисковой выдачи поисковых машин, рассчитанных на различные категории пользователей.


Прокомментировать

ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы