Разделы

Цифровизация Искусственный интеллект axenix

Искусственный интеллект упростил добавление новых типов документов в IDP-платформу ContentCapture

Content AI, российский разработчик решений для интеллектуальной обработки информации, продолжает расширять функциональность своих продуктов с помощью искусственного интеллекта. Компания выпустила релиз IDP-платформы ContentCapture 14.2 с усовершенствованным инструментом добавления новых типов документов. Начиная с этой версии, обучение распознаванию новых типов документов, с которыми планирует работать пользователь, реализовано на основе технологий машинного обучения. Теперь достаточно показать системе несколько примеров документов и разметить в них необходимые для извлечения поля. Далее ContentCapture сможет автоматически обрабатывать аналогичные файлы, извлекая данные из указанных ранее полей. Об этом CNews сообщили представители Content AI.

Данная функциональность доступна как для Windows, так и для и Linux.

«Удобство добавления новых типов документов позволит ускорить настройку комплекса и значительно упростить работу с платформой, так как заказчики смогут делать это самостоятельно, не обращаясь к вендору и не привлекая дорогостоящих специалистов, – сказала Светлана Дергачева, генеральный директор Content AI. – Развивая ContentCapture, мы думаем не только над принципиально новыми функциями, но и учитываем персональный опыт сотрудников, взаимодействующих с системой. Большое внимание уделяется таким факторам как простота «входа» в продукт новых пользователей и удобство выполнения различных операций».

«Технологии на основе машинного обучения и нейронных сетей открывают широкие возможности для улучшения продуктов. Мы выбираем только такие решения, которые, действительно, работают и несут наибольшую практическую пользу нашим заказчикам», – отметил Иван Волков, директор по продуктам Content AI.

IDP-платформа ContentCapture предназначена для автоматизации обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение востребовано крупными компаниями из различных сфер бизнеса и государственными организациями, которые в ежедневном режиме принимают большой поток документов. ContentCapture распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.

Вместе с тем в новом релизе продукта команде разработки Content AI удалось качественно оптимизировать технологию распознавания русского рукописного текста. Для этого были задействованы нейронные сети. ContentCapture научилась распознавать рукописный текст в полнотекстовом формате и в документах с многострочными полями. Система стала лучше считывать сложный почерк и в целом увеличила качество распознавания на 5%. Кроме того, в версии 14.2 появилась поддержка распознавания печатного и рукописного текста в одном поле, что позволяет в едином потоке обрабатывать документы, содержащие такие виды текста, например, паспорта. Также система научилась распознавать рукописные слова, содержащие буквы и цифры, – артикулы деталей или номера автомобилей.

IDP-платформа ContentCapture включена в реестр российского ПО, работает на отечественных ОС и на Windows. Подходит для импортозамещения ABBYY FlexiСapture, Kofax Capture, IBM Datacap.