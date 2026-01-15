ИИ поможет сохранить народное наследие Ивановской области

Преподаватели и студенты Ивановского государственного университета (ИвГУ) с помощью технологий искусственного интеллекта упорядочат фольклорный архив региона, содержащий материалы с 1974 по 1990 гг. Проект поможет сравнить ивановский фольклор с народным творчеством России в целом, а также даст широкому кругу исследователей доступ к ценным записям. Об этом CNews сообщили представители Университетского консорциума исследователей больших данных (Консорциум Big Data).

Проект стал результатом участия команды ИвГУ во всероссийской «Школе прикладного анализа данных», где участники без навыков программирования учились применять ИИ и Big Data для научных и прикладных работ. Обучение проходило с 4 по 23 декабря 2025 г. в смешанных форматах: онлайн на базе Института анализа больших данных и ИИ Томского госуниверситета (ТГУ) и офлайне.

В течение месяца команда из ИвГУ осваивала различные цифровые инструменты, в том числе нейросетевые алгоритмы и платформу PolyAnalyst. Для практики ивановские участники выбрали проект, посвященный фольклорному архиву ИвГУ за период 1974-1990 гг. Эти ценные записи существуют в единственном экземпляре в рукописном виде, что делает их недоступными для исследователей и невозможными для современной машинной обработки. Специалисты вуза постепенно оцифровывают тексты, чтобы предотвратить безвозвратную утрату культурного наследия региона вследствие физического износа бумажных носителей. Оцифрованные записи необходимо кластеризовать, чтобы полученная база данных была удобной для пользования.

«Работа над оцифровкой фольклорного архива началась летом в рамках выполнения задания по внутреннему гранту ИвГУ. Студенты в течение лета и осени переносили данные с печатного формата в цифровой. В декабре началась работа по анализу полученных данных. Мы поставили цель применить знания, полученные во время обучения в “Школе прикладного анализа данных”, для университетского проекта: использовать нейронные технологии и платформу PolyAnalyst для автоматизированной кластеризации оцифрованных текстов из фольклорного архива, выявления жанровых и тематических групп, а также семантического анализа героев и сюжетов», – сказала во время защиты проекта в «Школе прикладного анализа данных» представитель команды ИвГУ, директор Института гуманитарных наук Светлана Маник.

По ее словам, кластеризация подготовленного датасета позволит выделить ключевые темы фольклорных текстов Ивановской области. Итогом проекта должна стать структурированная база данных, которая будет доступна на сайте библиотеки вуза. Пользоваться базой смогут исследователи со всей России, в том числе для изучения жанров диалектизма, сравнения народного наследия своих регионов с общими традициями фольклора в России и конкретно с материалами Ивановской области. Пользователями могут быть студенты, преподаватели и все научное сообщество, которому интересны региональные истории».

В планах на 2026 г. — продолжить переводить тексты в цифровой вид и выполнить кластеризацию всего датасета. В январе предварительные результаты проекта представят университетской общественности и региональным властям, после чего специалисты приступят к разработке сайта.