Июль
17

Анализ текста с помощью SAPLO

Шведская компания Saplo, возглавляемая Матиасом Тубергом,  сделала линейку продуктов с API, позволяющую  создавать пользователям инструменты анализа текста, встраиваемые  в уже имеющиеся программные продукты.  В отличие от других систем продукты Saplo ориентируются в информации не на ключевые слова и теги, а на контекст.

Saplo позволяет автоматически извлекать из текста различные заданные объекты. В качестве объектов могут быть месторасположение, компании, персоны, URL, e-mail или другие заданные параметры.

С помощью Saplo можно автоматически классифицировать большие объемы текста. Наряду с классификацией по контексту можно прогнозировать, являются ли тексты спамом, содержат ли новую информацию и т.п.

Saplo способно также устанавливать взаимоотношения между текстами по степени их  схожести, смысловой близости. Saplo может работать на текстах, размещенных на сайтах, блогах, новостных лентах, в  Twitter, патентных документах.

В настоящее время Saplo завершает разработку автоматического извлечения и оценки отношения текстов к заданным объектам по различным установленным шкалам (типа, позитив-негатив, полезный-неполезный и т.п.)

В данный момент Saplo поддерживает английский и шведский языки. Однако за короткий срок система может быть настроена на любой язык мира, имеющий свою национальную редакцию Википедии. Я обращалась к г-ну Тубергу относительно русского языка, и он ответил, что при наличии заинтересованности русскоязычных пользователей готов разработать версию для русского языка. Никаких сложностей для компании это не представляет.

Так что, если кого-то программа заинтересует, пишите мне.


2 коммент. к записи “Анализ текста с помощью SAPLO”

  • Trashmajor 16 Июнь 2013 - 15:50

    И чем в итоге всё закончилась? Будет ли русская версия?

    • elarina 16 Июнь 2013 - 19:48

      Авторы по-прежнему готовы русифицировать программу, но нет заявок из России. Чтобы сделать русскую версию нужно чуть более чем 72 часа и хотя бы 10 заявок из России.

Прокомментировать

 
ОБО МНЕ

Последние записи

Сообщество Практиков Конкурентной разведки (СПКР)

Архивы