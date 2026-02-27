Российские ученые ускорили обучение ИИ с помощью моделирования человеческого взгляда

Научные сотрудники Исследовательского центра в сфере ИИ университета «Иннополис» представили новый способ повышения эффективности обучения с подкреплением на основе отзывов людей RLHF — ключевого метода для согласования больших языковых моделей с предпочтениями пользователей. Об этом CNews сообщили представители университета «Иннополис».

По словам ученых, основные проблемы современных методов RLHF — их высокая вычислительная стоимость и медленная сходимость из-за разреженности сигналов обратной связи: модель наград анализирует весь сгенерированный текст одной общей оценкой, не указывая, какие именно его части были хорошими или неудачными. Авторы исследования предложили использовать для решения этих проблем данные о взгляде человека, изучающего текст: на какие части текста он обращает внимание, в какой последовательности и как долго задерживает взгляд на каждой из них.

Карим Галлямов, программист-математик Лаборатории искусственного интеллекта в медицине университета «Иннополис»: «Сбор большого набора данных о предпочтениях людей для обучения нейросетей — дорогостоящая процедура. Обычно исследователи собирают маленький набор данных и обучают модель наград, которую затем используют для дообучения основной модели. Модель наград предсказывает одно значение — награду — то, насколько ответ основной модели соответствует предпочтениям людей. Это малоинформативно, потому что множество факторов влияют на предпочтения, а при таком подходе мы пытаемся сжать их до одного числа. Недавно международные ученые представили подход с плотной наградой, когда награда распределяется между каждыми частями ответа модели на основе внимания самой модели — это дает больше полезной информации в процессе дообучения основной модели. Мы же сделали шаг вперед и стали использовать данные о взгляде человека при изучении текста, что более естественно».

Данные взгляда можно получить, если в основании монитора компьютера закрепить айтрекер — устройство для отслеживания взгляда и провести эксперименты с несколькими пользователями. Эти исследования дорогие, долгие и не позволяют быстро получать информацию при замене текста на новый. В таких случаях ученые используют модели предсказания взгляда человека, читающего текст, — на основе синтетических данных они рассчитывают награду по каждой части текста для использования в RLHF.

Научные сотрудники Исследовательского центра в сфере ИИ ИТ-вуза провели эксперименты на англоязычных текстах с языковыми моделями LLaMa и Mistral, в которых протестировали два метода интеграции взгляда. Первый применяет модели наград, изначально обученные с учетом спрогнозированных признаков человеческого взгляда. Второй — новый метод, предложенный авторами из университета «Иннополис». Он не меняет саму модель награды, а накладывается поверх нее и использует предсказания человеческого взгляда для распределения единой итоговой оценки по отдельным словам сгенерированного текста.

Эксперименты показали, что оба метода в полтора-два раза быстрее обучают модели по сравнению со стандартными подходами, но вариант исследователей — более адаптивный и простой, так как можно использовать любую модель наград без внутренних изменений в самой модели. В обоих случаях ускорение обучения достигается без ухудшения итоговой производительности языковой модели и сокращает время и ресурсы, необходимые для оптимизации параметров модели. При этом результаты универсальны — устойчивы для разных больших языковых моделей, наборов данных и алгоритмов обучения с подкреплением.

Илья Першин, руководитель Лаборатории искусственного интеллекта в медицине университета «Иннополис»: «Исследование доказывает, что человеческий взгляд является значимым и ранее недооцененным сигналом в обучении ИИ-моделей. Использование данных взгляда позволяет создавать более эффективные и экономичные методы согласования языковых моделей. Это не просто ускоряет процесс, а делает его целенаправленнее, подобно тому, как учитель вместо “двойки” за работу указывает ученику на конкретные фразы, требующие доработки. Кроме того, наша работа показала, что данные взгляда человека могут быть заменены синтетическими, чтобы решить главные проблемы подобных исследований — острую нехватку информации о взгляде и сложность с получением новых данных».

Научные сотрудники отмечают, что текущее исследование они провели только для онлайн-методов RLHF — PPO, GRPO — и на английском языке. В будущем эксперты планируют изучить применимость подхода к офлайн-методам, например, DPO, а также расширить эксперименты на другие языки и модели.

Статья «Улучшение RLHF с помощью моделирования человеческого взгляда» (Enhancing RLHF with Human Gaze Modeling) опубликована в сборнике научных работ международной конференции по обработке естественного языка EMNLP. Ее авторы — исследователи Лаборатории искусственного интеллекта в медицине Исследовательского центра в сфере ИИ университета «Иннополис» Карим Галлямов, Иван Титов и Илья Першин.