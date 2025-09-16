CNews Аналитика Конференции Маркет Техника ТВ

Ученые Smart Engines создали «зеленый» ИИ, который распознает текст в 10 раз точнее и на 20% быстрее прошлых моделей

Smart Engines представила GreenOCR 2.0 – новое поколение «зеленого» ИИ для распознавания текста. Применяемые в нем сверхлегкие вычислительные архитектуры – 4,6-битные и усредняющие 8-битные нейросети – позволили считывать данные быстрее на 20%, а также снизить энергопотребление при распознавании. При этом число ошибок по сравнению с предыдущей версией снизилось в 10 раз. Об этом CNews сообщили представители Smart Engines.

В основе GreenOCR лежит технология замены вещественных чисел на целые – это позволяет развернуть всю функциональность ИИ даже на устройствах без GPU. Во втором поколении (версии 2.0) комбинируются две технологии – 4,6-битных и усредняющих 8-битных сетей, созданных специально для современных мобильных устройств архитектуры ARM. Фильтры 4,6-битных нейронных сетей квантуются таким образом, чтобы промежуточные данные обладали ограниченной разрядностью, давая возможность более эффективно использовать векторные операции процессора. А в вычислительном ядре усредняющих 8-битных нейронных сетей применяется скалярное произведение на основе древовидного усреднения, что позволяет использовать регистры вдвое интенсивнее. Одновременное использование двух этих идей позволило добиться непревзойденной скорости распознавания.

Улучшения в скорости и энергоэффективности были произведены не в ущерб качеству. Более того, новая модель ошибается в 10 раз меньше при распознавании документов относительно предыдущей версии. Эти показатели были обеспечены нейросетями с расширенным алфавитным пространством, обученными понимать не только сами символы, но и их структурные взаимосвязи: соседство фрагментов букв, точки соединения элементов и другие графические особенности. Система работает с печатным и рукописным текстом на 103 языках.

«GreenOCR 2.0 соответствует ключевым критериям Green AI, принятым в научной литературе: низкому энергопотреблению, минимальной эмиссии углекислого газа и “зеленым” подходам к обучению. За счет полностью локальной работы технологии не нужны датацентры и мегаватты энергии: все распознавания клиентов компании за год выделяют меньшее количество CO2, чем nhb уличных газовых обогревателя за аналогичный период», – отметил Владимир Арлазаров, генеральный директор Smart Engines, доктор технических наук.

Выпуск GreenOCR 2.0 стал частью реализации комплексной ESG-стратегии, утвержденной советом директоров компании в 2020 г. В том же году Smart Engines стала первой OCR-компанией, присоединившейся к инициативе Устойчивого развития ООН.

GreenOCR 2.0 интегрирован во все программные решения Smart Engines – Smart ID Engine 2.0 для распознавания и проверки подлинности документов, Smart Code Engine для считывания QR-кодов, банковских карт и номеров телефонов, Smart Document Engine для распознавания первичных, бухгалтерских документов, анкет и форм.

Программные продукты Smart Engines включены в Единый реестр российского программного обеспечения Минцифры России и относятся к классу искусственного интеллекта. В настоящее время GreenOCR 2.0 используется аэропортами «Шереметьево», «Внуково» и «Кольцово», РЖД, ФНС, ВТБ, «Альфа-Банком», «Т-Банком», а также большой тройкой сотовых операторов и другими заказчиками из госсектора, промышленности и бизнеса.

