Новое исследование МГУ: искусственный интеллект точнее распознаёт туберкулёз по рентгеновским снимкам

Представители НОШ «Мозг, когнитивные системы, искуственный интеллект» разработали метод увеличения данных для обучения нейросетей, позволяющий повысить точность диагностики туберкулеза по рентгеновским снимкам. Результаты опубликованы в сборнике ISPRS International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. Об этом CNews сообщили представители МГУ.

Туберкулез остается одной из главных инфекций в мире, ежегодно унося более миллиона жизней. Несмотря на успехи медицины, ранняя диагностика по-прежнему затруднена, особенно в регионах, где не хватает квалифицированных рентгенологов. Современные алгоритмы машинного обучения могут помогать врачам в распознавании болезни по снимкам грудной клетки, однако их качество сильно зависит от объема и качества данных для обучения.

Коллектив студентов и сотрудников МГУ – Ю.Д. Сенотова, к.ф.-м.н. Я.А. Пчелинцев и проф. А.С. Крылов, предложили использовать алгоритм Fast and Adaptive Bidimensional Empirical Mode Decomposition (FABEMD) для «увеличения данных» — создания новых вариантов рентгеновских изображений путем адаптивного удаления фоновых структур. Этот метод позволяет получить дополнительные снимки, сохраняющие диагностически важные особенности, но разнообразные по структуре, что повышает устойчивость и точность работы нейросетей.

Тестирование проводилось на нескольких открытых международных наборах данных (Montgomery, Shenzhen, TBX11K, Sakha-TB и др.), включающих тысячи рентгеновских снимков. Эксперименты показали, что добавление таких синтетических изображений в обучающие выборки повышает диагностическую точность моделей, особенно на сложных наборах с ограниченным числом данных.

«Мы показали, что использование FABEMD позволяет не только улучшить качество классификации снимков, но и сделать модели более устойчивыми к изменениям качества данных. Это особенно важно в медицинских задачах, где наборы изображений часто ограничены, а их характеристики зависят от оборудования и условий съемки», — сказал Андрей Крылов, профессор кафедры математической физики ВМК МГУ.

Авторы отмечают, что разработанный подход может применяться и в других медицинских задачах анализа изображений, где есть нехватка данных и требуется высокая точность — от диагностики легочных заболеваний до офтальмологии и онкологии.