В ожидании Холмса. Часть вторая
Прошлое и настоящее проекта Watson.
Следующий принципиальный шаг во взаимодействии человека и машины был сделан в 2007 году, когда согласно официальным данным IBM приступила к проекту Watson. Конечно, за десятилетие, прошедшее с победы Deep Blue над Каспаровым IBM не стояла на месте и не только совершенствовала свои суперкомпьютеры и мейнфреймы, но и исследовала новые возможности взаимодействия с пользователем на естественном языке и моделирования функций человеческого мышления.
Во главе проекта встал Дэвид Феруччи, которого можно назвать своеобразным отцом Watson. Публике проект был с блеском представлен в феврале текущего года, когда Watson обыграл двух чемпионов Jeopardy.
Игра была выбрана по той простой причине, что предусматривала не только взаимодействие компьютера с человеком на обычном английском языке, но и требовала для выигрыша не просто распознавания речи и полнотекстового поиска заложенных в памяти данных, но и алгоритмов, имитирующих понимание метафор, контекста задаваемых вопросов, различных смыслов произносимых слов и предложений.
В итоге, на глазах у всего мира, как вы знаете, Watson победил. Что же представляет собой Watson? На телевидении был представлен аватар Watsonа. Вообще-то Watson это 750 серверов POWER7, соединенных в систему с объемом в 15 терабайтов памяти. Следует особо подчеркнуть, что это абсолютно типовые сервера, которые используются корпорацией для различных нужд и не представляют собой топ суперкомпьютер, которых IBM изготовила тоже достаточно. Данное обстоятельство очень важно. А почему, напишем дальше. Кстати, принципиально интересно, что Watson никогда не был подключен к интернету.
Еще более важным, чем «железная» начинка, является уникальное программное обеспечение. Собственно оно-то и представляет собой проект Watson. Это программное обеспечение получило название DeepQA. Оно включает в себя не имеющую аналогов интеграцию машинной обработки естественного языка NLP, поиска информации IR, машинного обучения M, множественно-параллельных вычислений и представления знаний и рассуждений KP&R. Вот железные мозги вместе с этим программным комплексом собственно и взяли верх над двумя чемпионами.
Несложно увидеть, что практически все интегрированные в Watson технологии используются или собираются использоваться в поисковых машинах. Но там они только собираются использоваться в полном объеме, а в Watsonе они уже реализованы.
Есть и еще одно принципиальное отличие, о котором прямо не говорится. Но оно без сомнения присутствует. Авторы Watsonа назвали его реализацией не поисковой, а ответ-вопросной технологии. Т.е., происходит не поиск каких-либо источников, по которым сам человек должен искать ответ, а сначала распознавание вопроса или в более широком смысле – проблемы, ситуации, затем поиск в базах данных и отбор при помощи комбинации множества алгоритмов наиболее релевантного ответа.
Сами разработчики главный упор делают на распознавание естественных языков, сложных множественных алгоритмов поиска, ранжирования и т.п. Но, как я понимаю, совершенно недаром сначала Deep Blue обыграла Каспарова, потом стали активно развиваться семантические разработки, а затем появился Watson. Наряду с интеграцией всех упомянутых выше технологий, в Watsonе без сомнения присутствуют мощнейшие средства моделирования и распознавания не только речи, но и образов, причем не только визуальных, но и проблем и ситуаций, а также семантические технологии. Семантический веб пока в полном объеме не появился. Существуют лишь первые его инструменты (кстати, и в России типа Nigma) и элементы семантического веба, а Watson уже работает.
Когда же придет Холмс?
Сразу же после выигрыша в Jeopardy, IBM сделала несколько важных заявлений. В их числе, пожалуй, самое прямое отношение к нашей теме имеет следующее. Параллельно с подготовкой Watson к Jeopardy группа Watsonа активно работала с одним из наиболее продвинутых в технологическом и информационном отношении медицинских учреждений США – Кливлендским госпиталем по применению Watsonа для помощи врачам в постановке диагноза, лечении и наблюдении за пациентами. По мнению корпорации и ее партнеров-медиков уже скоро такое применение будет реализовано в полном объеме в жизнь.
Одновременно IBM заявила, что она начинает отрабатывать применение Watsonа для нужд правительства (хотя я думаю, что она не начинает, а давно и успешно это делает), для финансовых рынков и (внимание!) для расследований. Как мы с вами понимаем, между intelligence и investigation грань лежит не шире лезвия хорошо заточенного ножа.
Я думаю, ни у кого не возникнет сомнений, что применение проекта Watson для правительства и расследований просто с неизбежностью приведет к его использованию для нужд конкурентной разведки. Правда, может возникнуть вопрос, чего об этом писать, если стоимость проекта, по данным американской прессы, составила почти 1,9 млрд. долларов.
Так вот я думаю, вполне стоит. Прежде всего, учитывая объем рынка и сделанный прорыв, указанные инвестиции представляются не слишком большими и, вероятно, будут в скором времени возвращены с заметной прибылью.
И еще, я бы очень рекомендовала внимательно прислушаться к заявлению одного из руководителей разработок IBM Джона Келли, сделанному на прошлой неделе. А сказал он следующее: в течение ближайшего десятилетия применение Watsonа будет доступно для нужд крупного и среднего бизнеса, а еще через несколько лет Watson сможет уместиться в персональный компьютер. Как показывает прошлое, если руководители IBM и ошибались в сроках, то, как правило, в сторону их преувеличения, а не приуменьшения. Кстати, знаменитый Закон Мура, сформулированный опять же работником IBM, говорит о том же. Причем, несмотря на ряд публикаций в Рунете, нет никаких оснований ожидать прекращения действий этого эмпирического закона. Кстати, меня еще вот какая мысль посетила. Здорово, конечно, что Watson будет реализован на персоналке, но Закон Мура будет действовать и в отношении самого Watsonа. По этому поводу мне вспомнился гениальный провидец Станислав Лем. У него есть повесть «Голем ХIV». Так вот там суперкомпьютер, начиная с определенного момента, перестал отвечать на запросы пользователей, вероятно, потому, что ему это было просто «неинтересно».
О том, что Watsonоподобные технологии будут все шире входить в жизнь позволяет говорить еще несколько обстоятельств. Вроде бы не самый значительный факт, но в последнее время Google активно занялся разработкой собственных масштабируемых серверов. А буквально на прошлой неделе в свою компанию переманил одного из основателей компании Sun, которая собиралась разработать так называемый терминальный или сетевой компьютер. Сам IBM, как сообщают айтишные американские издания, опять сделал предложение Oracle приобрести Sun, а гениальный Вольфрам – создатель уникальной WolframAlpha в своем последнем посте написал, что проект Watson и эволюция WolframAlpha двигаются схожими путями и он видит точку их пересечения.
Судя по всему, конкурентная разведка, как наука, искусство и практика поиска, анализа и применения информации стоит на пороге собственной революции, связанной с появлением принципиально новых программных средств и инструментов.
В заключение скажу, чего пока ни WolframAlpha, ни Watson не могут. Они не способны отвечать на неправильно поставленные вопросы, некорректно сформулированные проблемы и пока, как говорят их создатели, не способны к предсказаниям с высокой точностью. Впрочем, и подавляющая часть людей к этому тоже не способна.
Прокомментировать
Последние записи
- Рецензия на книгу Р.В.Ромачева «История частной разведки США»
- Новое на блоге
- Воспоминание о будущем — 2050
- Новая среда обитания
- Главная технология ближайшего будущего. Битва за кванты
Архивы
- Март 2022
- Февраль 2022
- Март 2021
- Январь 2021
- Декабрь 2020
- Ноябрь 2020
- Октябрь 2020
- Сентябрь 2020
- Август 2020
- Июнь 2020
- Май 2020
- Апрель 2020
- Март 2020
- Февраль 2020
- Январь 2020
- Декабрь 2019
- Ноябрь 2019
- Август 2019
- Июль 2019
- Май 2019
- Апрель 2019
- Март 2019
- Февраль 2019
- Декабрь 2018
- Октябрь 2018
- Сентябрь 2018
- Август 2018
- Июль 2018
- Июнь 2018
- Апрель 2018
- Март 2018
- Январь 2018
- Декабрь 2017
- Ноябрь 2017
- Октябрь 2017
- Сентябрь 2017
- Август 2017
- Июль 2017
- Июнь 2017
- Май 2017
- Апрель 2017
- Март 2017
- Февраль 2017
- Январь 2017
- Декабрь 2016
- Ноябрь 2016
- Октябрь 2016
- Сентябрь 2016
- Август 2016
- Июль 2016
- Июнь 2016
- Май 2016
- Апрель 2016
- Март 2016
- Февраль 2016
- Январь 2016
- Декабрь 2015
- Ноябрь 2015
- Октябрь 2015
- Сентябрь 2015
- Август 2015
- Июль 2015
- Июнь 2015
- Май 2015
- Апрель 2015
- Март 2015
- Февраль 2015
- Январь 2015
- Декабрь 2014
- Ноябрь 2014
- Октябрь 2014
- Сентябрь 2014
- Июль 2014
- Июнь 2014
- Май 2014
- Апрель 2014
- Март 2014
- Февраль 2014
- Январь 2014
- Декабрь 2013
- Ноябрь 2013
- Октябрь 2013
- Сентябрь 2013
- Август 2013
- Июль 2013
- Июнь 2013
- Май 2013
- Апрель 2013
- Март 2013
- Февраль 2013
- Январь 2013
- Декабрь 2012
- Ноябрь 2012
- Октябрь 2012
- Сентябрь 2012
- Август 2012
- Июль 2012
- Июнь 2012
- Май 2012
- Апрель 2012
- Март 2012
- Февраль 2012
- Январь 2012
- Декабрь 2011
- Ноябрь 2011
- Октябрь 2011
- Сентябрь 2011
- Август 2011
- Июль 2011
- Июнь 2011
- Май 2011
- Апрель 2011
- Март 2011
- Февраль 2011
- Январь 2011
- Декабрь 2010