Май
28

Сервисы для аналитическо-расследовательской работы

Все большему числу специалистов приходится иметь дело с огромными массивами неструктурированной информации на русском, английском и иных языках. Из тысяч страниц текста требуется вычленить важные персоны, события, объекты и т.п. и установить между ними не только очевидные, но и скрытые связи.

В последнее время появился ряд сервисов, которые позволяют специалистам в области конкурентной разведки, экономической безопасности, расследовательской журналистики и т.п. на порядок более эффективно, чем раньше, работать с большими массивами неструктурированных данных. Из множества появившихся в последние два-три года сервисов и программных решения я выбрала лучшие по соотношению цена/качество, или даже вообще до определенного объема неструктурированных данных – бесплатные ресурсы.

Для извлечения из неструктурированных данных именованных сущностей, таких, как физические и юридические лица, объекты, местоположение, события, предметы, товары, услуги и т.п. при работе с русскими и англоязычными текстами, едва ли не наилучшим решением является Eureka Engine. Помимо извлечения сущностей, модули системы позволяют вести анализ тональностей, проводить классификацию текстов, лингвистический анализ и многое другое.  Огромным достоинством сервиса является тот факт, что он может быть подключен к собственной системе пользователя через API.

Если  анализировать необходимо  массивы текстов на английском языке, то, пожалуй, лучшим решением будет использование Open Calais http://www.opencalais.com/.  Система способна выполнить все те же функции, что и предыдущая, но имеет несомненное достоинство. Оно – в ее бесплатности.  Thomson Reuters недавно принял решение предоставлять API бесплатно. Более того, решение является продуктом с открытым кодом. Ряд российских компаний русифицировали систему, и она сегодня эффективно используется для обработки не только англо-, франко-, испано-, но и русскоязычных текстов. Коммерческих решений на русскоязычном рынке нет. Но при наличии одного-двух квалифицированных программистов задача русификации может быть решена в сжатые сроки.

Информация, добытая при помощи вышеозначенных систем, может быть эффективно обработана и визуализирована, включая неявные связи, при помощи нового продукта, созданного по инициативе НАСА и Международного консорциума журналистов-расследователей, – Linkurious.

В мире, где текстовой контент все более и более вытесняет фото и видео контент, особое значение приобретают эффективные инструменты поиска и анализа фото и видео изображений. Едва ли не наилучшим решением в настоящее время является Amazon Rekognition – сервис распознавания фотоконтента на основе глубокого изучения. Начиная с четвертого квартала т.г. сервис распознавания фотографий Amazon дополнит сервисом распознавания субъектов, объектов в YouTube или даже в потоковом видео.

Уже сегодня сервис Amazon позволяет находить фотографии людей, предметов, архитектурных сооружений и объектов, деталей ландшафтов даже в тех случаях, когда фотографии сделаны в неблагоприятных условиях или под необычными ракурсами.  До определенного объема поиска сервис бесплатный, а свыше – платный, но с чрезвычайно низкими ценами.


Прокомментировать

 
ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы