Российские ученые научили видеокамеры распознавать лица в 30 раз быстрее, чем раньше
В МИСИС, ВШЭ и Sber AI Lab разработали новый метод распознавания лиц и эмоций на видео. Технология уменьшает стоимость и значительно увеличивает скорость идентификации.
Новый метод уже тестируется
В МИСИС, ВШЭ и Sber AI Lab разработали новый метод распознавания лиц и эмоций на видео, пишут «Известиям». По словам разработчиков, этот способ до 30 раз быстрее по сравнению с классическими подходами в этой сфере. В настоящее время система проходит этап тестирования в вузах и лаборатории искусственного интеллекта Сбербанка.
«Наш подход основан на последовательном анализе входных видеоданных с различной детализацией (частотой кадров). Этот метод спроектирован так, чтобы быть очень быстрым и применяться к любому способу извлечения характерных признаков лиц на основе глубоких нейросетей без дополнительного обучения всей модели», — сказал заместитель директора центра искусственного интеллекта НИТУ МИСИС Андрей Савченко.
Новый способ не только распознает лица, но и эмоции человека. Например, он умеет сравнивать выражение лица в кадре и находить похожие во всем видео.
Отличие от существующих систем
Главная проблема традиционных методов распознавания лиц людей заключается в том, что они анализируют каждый кадр видео в отдельности, разъяснили изданию разработчики. Такое решение становится неэффективным, особенно когда дело доходит до систем, работающих в режиме реального времени, например систем видеонаблюдения или беспилотных автомобилей, где скорость распознавания критична.
«Для оптимизации метода важно не просто собирать информацию со всех кадров видео, но и уметь правильно выстраивать последовательность принятия решений, то есть сразу отсеивать ненужную информацию, чтобы оставались только необходимые для классификации данные», — объяснил Савченко.
Новое решение сначала анализируется два кадра — первый и последний. Если нейросеть может сделать правильный вывод, то алгоритм останавливается. В противном случае добавляется еще несколько кадров в середине, а затем снова проверяется правильность выводов. Например, для простых видео, где выражения лиц хорошо распознаются, решение принимается практически мгновенно, а для более сложных требуется обработать намного больше видеокадров.
Область применения
Распознавание лиц позволяет идентифицировать человеческие лица на изображениях или видео. Камеры с распознаванием лиц применяют в ситуациях, когда, например, требуется найти пропавшего человека или преступника.
Новый метод не требователен к вычислительным ресурсам, его можно использовать на бюджетном смартфоне, ноутбуке, умной камере и др. При этом не нужно пересылать видео на удаленный вычислительный сервер, а это, как отметил Савченко, повышает уровень защиты персональных данных.
Модель также позволит упростить внедрение ИИ в системы видеоаналитики, отключенные от мощных графических процессоров или лишенные стабильного интернет-соединения, что может быть важно для систем контроля безопасности в метро. Вполне вероятно, что данный подход также найдет свое применение в сфере разработки бортовых систем видеоаналитики беспилотных автомобилей, где задача скорого реагирования на внешние обстоятельства является одной из основных, добавил эксперт по обработке и анализу данных Центра компетенций НТИ по большим данным на базе МГУ имени М.В. Ломоносова Максим Доронькин.
Появление новых способов, направленных на снижение «цены» классификации без потери его качества, последовательно происходит и будет применяться в ближайшие годы, считает ведущий эксперт центра компетенций Национальной технологической инициативы (НТИ) «Искусственный интеллект» на базе МФТИ Александр Родин. Однако конкуренция в этой сфере высокая.