Фев
12

ВААЛ возвращается

ВААЛ -  божество шумерского пантеона. А еще – российский проект, который в 90-е – начале 2000 годов создал линейку уникальных продуктов для  контент-анализа и работы с текстами. Последние 10 лет новых продуктов в линейке не появлялось. Создавалось впечатление, что еще одна уникальная отечественная программная разработка канула в лету или безвозвратно покинула рубежи страны.

Каково же было мое удивление, когда на днях выяснилось, что разработчики проекта запустили принципиально новый продукт в линейке инструментальных программных средств для проведения контент-анализа интернет-источников информации. Еще, честно говоря, больше я изумилась, когда выяснилось, что теперь ВААЛ работает в рамках Фонда «Сколково».

Scai4Twi – это инструмент профессионального контент-анализа микроблогов Twitter. Казалось бы, зачем создавать еще одну систему, коль скоро таких систем и в мире, и в России сделано уже немало. Лучшие из них представлены в разделе Web 2 Разведнета.

Дело в том, что запущен продукт, чей функционал качественно превосходит имеющиеся не только в России, но и за рубежом аналитические и прогностические системы на основе микроблоггинга.

Twitter для стартового продукта выбран прежде всего потому, что именно микроблоги сегодня являются наиболее быстро растущим сегментом текстового веба. Одновременно они наиболее оперативно реагируют на любые события и изменения, практически не подвергаются никакой цензуре, включая, кстати, и самоцензуру, и в силу этого представляют собой идеальное информационное поле для извлечения фактов, определения тенденций, проведения событийного и средового анализа.

В настоящее время продукт реализован для русскоязычного и англоязычного сегментов Twitter. Принципиально может быть расширен и на другие языковые сегменты. Кроме того, очевидно, хотя разработчики об этом пока не пишут, предлагаемый подход может быть применен не только к анализу Twitter, но и открытых страниц соцсетей, полноценных блогов, социальных СМИ и т.п.

Хотела бы напомнить, что все уже существующие инструменты анализа Twitter-пространства наряду с анализом по ключевым словам, кластерам или темам включают так называемый эмоциональный анализ, который сводится к двоичному отображению отношений (в большинстве случаев сервисы показывают отношения – положительное или отрицательное, максимум, вводится третье отношение – нейтральное).

Новый продукт вобрал в себя все достижения VAAL, реализованные в ранних версиях, плюс, добавил принципиально новые возможности и гораздо более дружественный и удобный для пользователя интерфейс.

Надо сказать, что российская школа филологии, лингвистики и семиотики являлась и является одной из наиболее сильных в мире. Более того, в значительном смысле вся современная семиотика, а соответственно и анализ знаковых сообщений «вышла из шинели» именно российской школы семиотики. Поэтому далеко не случаен всемирный успех программных продуктов Promt, ABBY и т.п.

Проект ВААЛ по сути является аккумуляцией достижений отечественной лингвистики и семиотики и их конвертацией в программные продукты, имеющие сугубо практическую направленность. Основные принципы и возможности Scai4Twi наглядно представлены на схемах и пояснениях проекта ВААЛ.

Основные понятия

Структура

Категории

Пользователям системы ВААЛ хорошо известно понятие категории. Это группы слов, объединенные в один список по тому или иному признаку. Например, категории слов с позитивной окраской, с негативной окраской, с агрессивной окраской, категории слов – названий наркотиков, матерных выражений и пр. Назначение категорий заключается в том, чтобы использовать их для оценки интересующих нас текстов.

Категории в Scai4Twi, как и в ВААЛе, делятся на системные и пользовательские. Системные категории составлены экспертами и включены в комплект поставки. Пользовательские категории формирует сам пользователь в зависимости от решаемых им задач.

В комплект поставки Scai4Twi включены следующие системные категории:

Категории семантического дифференциала

  • Позитив
  • Негатив
  • Сила
  • Слабость
  • Активность
  • Пассивность

Категории репрезентативных систем НЛП

  • Зрительная
  • Рациональная
  • Слуховая
  • Чувственная

Категории систем ценностей

  • Гностические
  • Практические
  • Эстетические
  • Этические

Категории мотивов

  • Власти
  • Достижения
  • Физиологический

Категории валентности

  • Общая
  • Положительная
  • Отрицательная

Категории потребностей

  • Общая
  • Внешняя
  • Внутренняя

Дополнительные категории

  • Агрессивность
  • Глупость
  • Ум

Список системных категорий не является окончательным и будет пополняться. Новые наборы системных категорий пользователям Scai4Twi будут предоставляться бесплатно.

Виды анализа
В системе Scai4Twi предусмотрены следующие виды анализа.

Поисковый анализ (онлайн)

  • Выделение новых тем (онлайн)
  • Анализ трендов (оффлайн)
  • Анализ связей меду категориями (оффлайн)
  • Выделение тем (оффлайн)

В качестве иллюстрации к анализу трендов приведем скриншот сравнительных оценок выраженности мотива Власти в твиттах трех влиятельных либеральных СМИ – газеты «Ведомости», «Новой газеты» и радиостанции «Эхо Москвы».

Очевидно, что возможности и функционал Scai4Twi на порядок превосходят возможности и функционал уже имеющихся отечественных и зарубежных сервисов и программ. В ближайшее время новый продукт будет запущен в коммерческую эксплуатацию и станет доступен как в виде сервиса, так и программы для индивидуальных и корпоративных пользователей. Этот отечественный продукт без сомнения станет мощным инструментом в арсенале корпоративной разведки.


Прокомментировать

 
ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы