Сен
25

Калев Литару по-русски

Сначала о революционном подходе Калева Литару написали ведущие зарубежные средства массовой информации, включая New York Times, Financial Times, журнал компьютерных наук МТИ, Всемирный вестник информационных технологий. Публикации о тех или иных  результатах применения подхода опубликовали такие авторитетные российские интернет СМИ, как Компьютерра и Толкователь. Но везде речь шла прежде всего о о результатах применения метода. Я же как и обещала, выкладываю первую часть сокращенного оригинального перевода работы Калева Литару, посвященной его методу – Сulturomics  2.0.

Несколько слов от себя. В появившихся публикациях по-русски этот метод называется либо культурономика, либо культуромика. На самом деле, на мой взгляд,  неправильно ни то, ни другое. Сам автор характеризовал свой метод, как прогнозирование и классификация человеческого поведения, используя глобальные новостные медиа, распределенные во времени и пространстве при помощи сложных алгоритмов. По сути, речь идет о скрещивании прогнозирования, культуры и математики. Поэтому, если уж переводить, то на русский более точно было бы перевести культуроматика 2.0.

Итак…

Часть 1. Введение.

Культуроматика  2.0 стремится спрогнозировать культурные и другие тенденции через компьютерный анализ огромных архивов. Традиционная культуроматика имела дело с использованием оцифрованных книг. Иными словами, она занималась исследованием того, что уже было или попросту историей.

Люди осуществляют свои действия, основываясь на неполной информации, которая доступна для них в момент действия, а также исходя из своего прошлого опыта и знаний. Средства массовой информации представляют собой своего рода снимок событий в режиме реального времени. Чем более разнообразные средства информации и новые социальные СМИ используются, тем больше фрагментов попадает в мозаику нашего моментального снимка. Кроме того, новости сами по себе оказывают влияние и формируют действия людей. Появившиеся в последнее время исследования показывают, что электронные СМИ все в большей степени формируют индивидуальное и коллективное сознание и позволяют делать прогнозы в самых различных сферах, начиная от продаж на фондовом рынке, заканчивая политическими событиями.

В своем исследовании я задался вопросом, позволяют ли архивы СМИ, включая оцифрованные архивы бумажных СМИ и новых интернет СМИ прогнозировать тенденции и события. В качестве событий я интересовался местонахождением террористов, а в качестве тенденций я прогнозировал политические события в разных странах и взаимоотношения между ними. Для этого я использовал архив новостей из СМИ всех видов и политических оттенков, практически из всех стран мира за последние 30 лет.

Традиционная культуроматика рассматривает каждое слово или фразу в качестве обособленного объекта, вне связи с другими, и анализирует только изменение частоты их использования в течение долгого времени. Мой подход существенно меняет эту модель. Он использует совершенно другие алгоритмы, которые, во-первых, позволяют устанавливать неявные связи между фразами и словами, характеризующими события, объекты и субъекты, делает акцент на географическое расположение источника новостей, а также на тон или оценочные суждения об этом событии. (Фактически Литару использует сложные математические алгоритмы в комбинации с элементами семантического веба. Есть только  один прецедент движения в том же направлении, отличающийся по алгоритмической базе и привлекаемым источникам, – это Recorded Future, о котором мы уже писали – Е.Л.).

В своем исследовании нам удалось также обеспечить визуализацию результатов. В итоге получен подход, который позволяет осуществлять раннее распознавание конфликтов различного рода и их взаимное влияние. Конфликты могут относиться к глобальному уровню, уровню отдельной страны, региона, к различным предметным областям – культуре, политике, экономике. Принципиально новый подход позволяет делать высокоточные краткосрочные прогнозы и, как я надеюсь, достаточно достоверные среднесрочные прогнозы.

В качестве подтверждения надежности алгоритма можно отметить, что он позволил предсказать революции в Египте, Тунисе и Ливии, а также конфликт в населенной сербами части Косово. Алгоритм также позволил обнаружить местонахождение Бен Ладана с точностью до 200 км.


Прокомментировать

 
ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы