Янв
19

Приключения интеллектуальных агентов на российских просторах

В разделе «Программы и сервисы» текст с заголовком «Агенты» появился не случайно. Агенты бывают разные. В данном случае речь пойдет не о коварных агентах ЦРУ, МИ-6, Моссада и прочих  шимбетов и нативов, а об интеллектуальных агентах. Интеллектуальные агенты – это программы, приложения, платформы, которые берут на себя в интернете и других сетях функции человека и успешно выполняют их. В основном речь идет о рутинных функциях, связанных с поиском, обработкой и анализом информации.

В последнее время появилась мода лепить бирку «Искусственный интеллект» куда не попади. Если вспомнить, что все программы так называемого  «Искусственного интеллекта», написаны, по крайней мере, на сегодняшний день, программистами, то лейбл «Искусственный интеллект» является не более чем маркетинговым ходом. Однако с появлением  глубоких или как еще их называют, многослойных нейронных сетей, можно говорить о вычислительном интеллекте.

Если открыть книгу великого российского психолога В.Брушлинского «Субъект. Мышление. Учение. Воображение», то в ней можно прочитать несколько глав, посвященных человеческому мышлению. Эти главы написаны не на основе умозрений, а на основе тысяч экспериментов, проведенных советскими психологами, включая Л.Выгодского, С.Рубинштейна, В.Брушлинского и др. Выяснилось, что мышление включает в себя два типа, причем не таких, как у Канемана. Д.Канеман делит мышление на быстрое и медленное. Это, безусловно, правильно, поскольку подтверждено огромным массивом экспериментальных данных. Брушлинский же делит мышление на дезъюнктивное и недезъюнктивное. С определенным огрублением их можно назвать алгоритмическим и неалгоритмическим.

Первый тип мышления уже сегодня можно формализовать, превратив в программы и приложения. Второй тип формализовать пока никому не удалось. Однако, первый тип мышления, будучи формализованным, становится полноценным вычислительным интеллектом, способным в ограниченный период времени переработать такие массивы разнородных данных, которые неподвластны дезъюнктивной обработке человеческой психикой.

Интеллектуальные агенты представляют собой программную реализацию  дезъюнктивного мышления или вычислительного интеллекта. С горечью приходится констатировать, что не только в области психологии, но и алгоритмики, мы  не так давно были впереди планеты всей. На рубеже девяностых – нулевых годов основатель известной компании Айкумена Сергей Шумский едва ли не первым в мире не только попытался создать компанию, специализирующуюся на глубоких нейронных сетках НейроОК (поглощенную потом американцами) , но и  подготовил большой доклад по перспективам интеллектуальных агентов.

В докладе содержалось подробное обоснование этого нового вида программ, расписывались ставшие сегодня явью перспективы, а главное, имелось выложенное в открытый доступ алгоритмическое ядро. В последующем оно было использовано многими ведущими компаниями мира в гонке по созданию интеллектуальных агентов, в которой наша страна и бизнес в настоящее время все более сильно отстает.

Вот такая грустная история. Для тех, кто хочет попробовать свои силы в создании интеллектуальных агентов, можно порекомендовать одно из немногих открытых решений IBM Watson  Content Analytics, использующих русский язык. Руководство можно скачать здесь, а программное решение – здесь.

IBM Watson Content Analytics – решение для обработки больших объемов неструктурированных текстовых данных. Оно способно выделить из входной информации факты, найти между ними взаимосвязи, сделать выводы, и визуализировать их в удобной для заказчика форме. Отметим, что Watson Content Analytics понимает русский язык, в том числе в особенностях русской морфологии и работы с синонимами.

Система, получив задание, непрерывно ищет упоминания компании в открытых источниках, автоматически определяя тональность сообщений, географию источников, авторитетность автора. Причем при анализе тональности Watson умеет определять в сообщениях сарказм. Вся эта информация сводится в отчеты, но при необходимости сотрудник компании может просмотреть исходные данные вплоть до отдельных сообщений с метаданными, собранными системой. Ценнейшей возможностью является автоматическое выявление наиболее важных и весомых сообщений, требующих непосредственной реакции компании.

Отчеты Watson Content Analytics позволяют выявить корреляцию между любыми факторами – географией, типами услуг, биометрическими и социальными данными клиентов, вывести из этого точное заключение и принять решение. И, что важно, нет никакой задержки – система работает в реальном времени. А ведь это то самое свойство, которое в традиционных системах аналитики обходится дороже всего.

Ключевые умения IBM Watson можно свести в четыре пункта:

Понимание естественного языка.

Построение гипотез на основе обработанных данных.

Обучение в процессе работы.

Вынесение рекомендации, сопровождая ее фактами, на которых основан вывод.

Решение было адаптировано к русскому языку в начале 2014 года и до сих пор поддерживается. После весны 2014 г.по известным причинам IBM перестало поддерживать русский язык в приложениях Watson, хотя продолжает развивать языковую гамму. Наряду с английским, французским, испанским, она включила немецкий, португальский, корейский и китайский и готовится к новым языкам. К сожалению, своих Watson в закрытом виде, а тем более с API мы пока не создали


Прокомментировать

ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы