Разделы

Цифровизация Бизнес-приложения

«Атоллис» выпустила программного робота для файловых архивов

«Техноинтеллект», входящий в группу компаний «Атоллис», выполняющий разработку сервисов искусственного интеллекта (роботов) для управления данными (ПО «Датиум»), выпустил первого в серии программного робота «Датиум.смарт файл» по цифровизации неструктурированных источников данных.

Назначение робота класса RPA (Robotic process automation) – автоматическая обработка, идентификация и классификация файловых архивов разных отраслей по элементам онтологической модели под управлением обученной нейросети.

Результатом работы робота является оцифрованный источник неструктурированных данных в виде реестра цифровых паспортов документов с заполненными атрибутами из содержимого файлов и распределенными файлами по структурам цифровых паспортов без изменения физической схемы хранения файлов.

По исследованиям корпорации Microfocus, компании в течение 3-5 лет снижают долю обращений в соотношении к объему данных с 65% до 5% из-за невозможности быстрого извлечения бизнес-критичной информации. Оцифрованный роботом источник неструктурированных данных становится доступным для использования шинами данных, обогащая формируемые запросы по онтологической модели информацией, хранящейся в оцифрованном файловом архиве.

При регламентном применении робот минимизирует время специалистов по классификации вновь появляющихся файлов и по поиску бизнес-значимых данных в файловых архивах.

Вместе с «Датиум.смарт файл» выпущена обученная нейросеть для предприятий ТЭК, позволяющая автоматически обрабатывать более 90% типовых документов в файловых архивах. Оставшиеся 10% выполняются в автоматизированном режиме, дообучая модель на варианты классификации, специфичные для каждого предприятия. Для иных отраслей первоначальное обучение нейросети может занимать несколько месяцев.

Обучение нейросети выполнялось бизнес-экспертами компании «От-ойл», входящей в группу «Атоллис», на более чем 1 ТБ файлов по недропользованию из источников в свободном доступе Росгеолфонда. В процессе 23 итераций на 188 узлах онтологической модели было обработано 2348 объектов. Использование предоставленного компанией IBM высокопроизводительного стенда (в рамках технологического партнерства) позволило сократить время каждой итерации полного обучения модели с 2,5 месяцев до 10 суток.

Первые применения робота успешно выполнялись компанией «От-ойл» при реализации проектов управления проектной документацией на предприятиях нефтяной отрасли.

В настоящее время «Техноинтеллект» ведет разработку сразу нескольких роботов из серии управления данными: робот когнитивного поиска по структурированным и неструктурированным источникам данных на основе онтологической модели; робот по унификации данных, позволяющий автоматически формировать перекодировочные таблицы справочных значений, имеющих разные коды в разных системах; робот-помощник, поддерживающий выполнение регламентных задач сотрудников при работе в процессных ИТ-решениях.

Модуль «Датиум» с любым набором создаваемых роботов создан на технологиях Open Source и может быть встроен в любую продукцию управления данными. В частности, в «От-ойл» он применяется в линейках приложений «Платформа Атолл» и «Эльдока» для решения задач ведения реестра цифровых паспортов документов и объектов, поиска данных и их просмотра.