COSOC.AI

Основной класс:

04.13 Системы сбора, хранения, обработки, анализа, моделирования и визуализации массивов данных

Состав и назначение решения

Программное решение для работы с текстовыми документами COSOC.AI входит в состав программной платформы COSOC и предназначено для работы с официальными текстовыми документами, в том числе помогает:

  1. Определить ответственного исполнителя
  2. Сформировать краткую аннотацию входящего документа
  3. Подготовить проект резолюции
  4. Определить перечень сотрудников, которые должны получить копию входящего документа
  5. Добавить необходимые метаданные в карточку документа
  6. Выбрать регламент обработки документа в системе электронного документооборота

Система разбивается на следующие подсистемы:

  • подсистема распознавания;
  • подсистема обучения;
  • подсистема управления метаданными;
  • подсистема формирования отчетности.

Подсистема распознавания предназначена для  обработки документов, передаваемых на ее вход и формирования выходного набора данных включающего информацию о отнесении документа к той или иной рубрике классификатора с указанием вероятности для каждого из вариантов, наборов извлекаемых из текста сущностей и аннотации документа.

Подсистема обучения предназначена для  изменения настроек нейронной сети , решающей задачу обработки документов в составе подсистемы распознавания.

Подсистема управления метаданными предназначена для управления структурой и составом данных классификаторов.

Подсистема формирования отчетности предназначена для  формирования отчетности о работе системы и контроля лицензионного соглашения.

Порядок развертывания COSOC.AI

Проведение обследования и подготовка технического задания на систему - 1–3 мес

  • Формирование загрузочного массива на документах Заказчика
  • Разработка архитектуры интеграции решения с существующим системным ландшафтом заказчика
  • проведение пробных обработок документов

Техническое проектирование - 1-2 мес

Разработка и ввод в эксплуатацию - 1-2 мес

  • Разработка рабочей и эксплуатационной документации  
  • Развертывание решения
  • Проведение опытной эксплуатации

 

Источники информации

В качестве источников информации могут использоваться:

  1. документы в электронном структурированном виде (в том числе из систем СМЭВ и МЭДО)
  2. сканированные и распознанные OCR решениями документы

Описание решения

Подсистема распознавания представляет собой REST сервис и обеспечивает выполнение следующих функций:

  • классификацию документов, подаваемых на вход в соответствии с несколькими заранее настроенными справочниками;
  • формирование аннотации документа;
  • извлечение из текста набора сущностей;
  • формирование проекта резолюции и проекта маршрутизации документа с учетом его истории.

 Подсистема распознавания представляет собой REST сервис и обеспечивает выполнение следующих функций:

  • изменение состава и структуры справочников в процессе работы и переобучение и дообучение системы для работы с измененным составом и структурой справочников;
  • переобучение системы при необходимости на исходном загрузочном файле и массиве данных.

Подсистема управления метаданными обеспечивает возможность изменения состава и структуры справочников в процессе работы с использованием REST API.

Подсистема формирования отчетности предназначена для создания и формирования отчетов в виде удобном для вывода(pdf, xml) в одном из существующих шаблонов, проектирования и разработки шаблонов, настройки планового формирования и доставки отчетов, формирования и предоставления по запросам пользователей аналитических и статистических отчетов в различных форматах (включая графические), отображения отчетов с помощью веб-интерфейса, вывода подготовленных отчетных форм на печать(pdf).

В системе поддерживаются  несколько базовых шаблонных видов отчетности:   

  1. Отчет сессии - формируется по окончанию каждой  сессии и включает в себя информацию о времени .
  2. Отчет за период - формируется в конце заданного периода(день), содержит информацию о событиях со всех камер, подключенных к системе.

Также подсистема обеспечивает контроль выполнения лицензионного соглашения путем формирования отчета о объеме выполненных транзакций с формированием криптоотчета, который должен предъявляться заказчиком при продлении контракта на поддержку системы.

Аппаратное обеспечение

Для обучения нейросетевых алгоритмов должны использоваться GUPU с поддержкой CUDA 10. 
Оценка количества CUDA ядер    производится по заказу Заказчика 

Публикации

Применение нейросетевых технологий для автоматической классификации и маршрутизации текстовых сообщений и документов в работе ЕЦОР и служб эксплуатации и ремонта

Хельвас А.В., Овчинников А.Д., Кузнецова А.А., Гиля-Зетинов А.А.

в сборнике ”Имитационное и комплексное моделирование морской техникии морских транспортных систем” Материалы пятой международной научно - практической конференции ИКМ МТМТС-2019, место издания М: ”Издательство Перо”, с. 191-196

 

Презентации