Туберкулёз остаётся одной из главных инфекций в мире, ежегодно унося более миллиона жизней. Несмотря на успехи медицины, ранняя диагностика по-прежнему затруднена, особенно в регионах, где не хватает квалифицированных рентгенологов. Современные алгоритмы машинного обучения могут помогать врачам в распознавании болезни по снимкам грудной клетки, однако их качество сильно зависит от объёма и качества данных для обучения.
Коллектив студентов и сотрудников МГУ предложили использовать алгоритм Fast and Adaptive Bidimensional Empirical Mode Decomposition (FABEMD) для «увеличения данных» — создания новых вариантов рентгеновских изображений путём адаптивного удаления фоновых структур. Этот метод позволяет получить дополнительные снимки, сохраняющие диагностически важные особенности, но разнообразные по структуре, что повышает устойчивость и точность работы нейросетей.
Тестирование проводилось на нескольких открытых международных наборах данных (Montgomery, Shenzhen, TBX11K, Sakha-TB и др.), включающих тысячи рентгеновских снимков. Эксперименты показали, что добавление таких синтетических изображений в обучающие выборки повышает диагностическую точность моделей, особенно на сложных наборах с ограниченным числом данных.
«Мы показали, что использование FABEMD позволяет не только улучшить качество классификации снимков, но и сделать модели более устойчивыми к изменениям качества данных. Это особенно важно в медицинских задачах, где наборы изображений часто ограничены, а их характеристики зависят от оборудования и условий съёмки», — подчёркивает Андрей Крылов, профессор кафедры математической физики ВМК МГУ.
Авторы отмечают, что разработанный подход может применяться и в других медицинских задачах анализа изображений, где есть нехватка данных и требуется высокая точность — от диагностики лёгочных заболеваний до офтальмологии и онкологии.







































