Июнь
2

Семантик – русские семантические технологии

Надо сказать, что в последние годы за рубежом, будь то на Востоке или на Западе появились десятки компаний, специализирующихся на обработке неструктурированной информации на основе семантических методов. Такое количество компаний, которое к тому же ежемесячно прирастает новыми, показывает, что обработка неструктурированной информации востребована как бизнесом, так и государственными структурами.
В России с семантическими технологиями, в отличие от интернет-магазинов и различного рода рекомендательных веб-сервисов просто беда, в прямом и переносном смысле. В прямом, потому что их число можно, занимающихся этими технологиями, пересчитать по пальцам. К тому же часть из компаний находится в нерабочем состоянии. А в переносном, беда состоит в том, что российская школа структурной лингвистики была и в определенных аспектах остается лидирующей в мире. Поэтому западные компании с большой охотой берут российских лингвистов, специалистов по обработке так называемых натуральных языков и т.п. для решения своих задач. Т.е. наши работают там, и работают успешно.


Между тем, построить реально работающую поисково-аналитическую разведывательную платформу, крайне необходимую и большому, и среднему, и даже малому российскому бизнесу без эффективных инструментов обработки неструктурированной информации невозможно. В сложившейся, почти безвыходной ситуации эффективным решением становится обращение к технологиям и программам компании Семантик.

Ее технологии, например, позволяют из любых веб-страниц, включая динамические, не просто извлекать именованные объекты, такие как:

Персоны и их атрибуты (должности, профессии и т.п.);
Организации и подразделения;
Географические объекты и адреса;
Транспортные объекты;
Ссылки на нормативно-правовые акты и их части;
Даты, телефоны, e-mail, url и пр.;
но и устанавливать взаимосвязи между ними. Вот что получилось после обработки некоего произвольного текста.

Кроме того, программное решение по выделенным сущностям позволяет автоматически построить граф взаимосвязей.

Особую гордость разработчиков представляет собой модуль анализа происшествий, который может быть легко преобразован с модуль анализа любых ситуаций. В модуле происшествий предусматривается автоматическое выделение следующих атрибутов:

Что случилось (класс происшествия);
Где (географический объект, адрес);
Когда;
Артефакты: оружие, наркотики, денежные суммы и др.;
Фигуранты:
 Класс фигуранта (злоумышленник, потерпевший, сотрудник…)
 Количество фигурантов
 Что с ним(и) случилось (пострадали, погибли, госпитализированы…)

Для того чтобы преобразовать анализ происшествия в анализ ситуации надо расписать классы ситуации, классы артефактов, т.е. вокруг чего происходит событие, и классы фигурантов, применительно к тем ситуациям, которые будут подвергаться автоматизированной обработке.

Программа, не уступающая по своим возможностям передовым зарубежным разработкам, вполне доступна не только крупному и среднему, но и небольшому бизнесу. При использовании разработки в исследовательских и образовательных проектах подписывается соответствующее соглашение, и софт предоставляется бесплатно. Кроме того, разработчики с удовольствием готовы интегрировать свои модули в сторонние комплексные программы и поисково-аналитические системы. Они также готовы поработать и над новыми задачами, для решения которых требуется применение семантических технологий.

По моему мнению, если в России все же будет создана собственная поисково-аналитическая разведывательная платформа, то модули компании Семантик станут одними из ключевых ее элементов.


Прокомментировать

ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы