Подход искусственного интеллекта (ИИ), основанный на сверточной нейронной сети (CNN) с глубоким обучением, может идентифицировать нюансы маммографической визуализации, характерные для отозванных, но доброкачественных (ложноположительных) маммограмм, и отличать такие маммограммы от тех, которые определены как злокачественные или отрицательные.
Исследование опубликовано в журнале Clinical Cancer Research, Американской ассоциации исследований рака, Шаньдун Ву, доктор философии.D., доцент кафедры радиологии, биомедицинской информатики, биоинженерии, интеллектуальных систем, клинических и трансляционных наук, а также директор лаборатории интеллектуальных вычислений для клинической визуализации отделения радиологии Университета Питтсбурга, штат Пенсильвания
"Для раннего выявления рака груди и снижения смертности маммография является важным скрининговым обследованием; однако в настоящее время он страдает от высокого уровня ложных отзывов," сказал Ву. "Эти ложные отзывы приводят к чрезмерному психологическому стрессу у пациентов и значительному увеличению клинической нагрузки и медицинских расходов. Таким образом, исследование возможных способов уменьшения количества ложных отзывов при скрининговой маммографии является важной темой для изучения."
Ву и его коллеги изучали, можно ли применить метод искусственного интеллекта, называемый глубоким обучением, для анализа большого набора маммограмм, чтобы различать изображения женщин со злокачественным диагнозом, изображения женщин, которые были отозваны и позже были определены как имеющие доброкачественные образования ( ложные отзывы), а также изображения женщин, у которых на момент скрининга было установлено, что у них нет рака груди.
"Предполагается, что могут быть некоторые нюансы визуализации, связанные с некоторыми изображениями маммограммы, которые могут привести к ложному / ненужному воспоминанию, когда изображения интерпретируются радиологами-людьми, и наша цель – использовать метод глубокого обучения на основе CNN для построения компьютерный набор инструментов для определения этих потенциальных изображений маммограммы," Ву сказал.
Исследователи использовали в общей сложности 14 860 изображений 3715 пациентов из двух независимых наборов данных маммографии, набора данных полноформатной цифровой маммографии (FFDM – 1303 пациента) и цифрового набора данных скрининговой маммографии (DDSM – 2412 пациентов). Они построили модели CNN и использовали усовершенствованные подходы к обучению моделей, чтобы исследовать шесть сценариев классификации, которые помогли бы различать изображения доброкачественных, злокачественных и вспоминанных доброкачественных маммограмм.
Когда наборы данных из FFDM и DDSM были объединены, площадь под кривой (AUC) для различения доброкачественных, злокачественных и восстановленных доброкачественных изображений варьировалась от 0.76 к 0.91. Ву объяснил, что чем выше AUC, тем лучше производительность, максимум 1. "AUC – это показатель, который суммирует сравнение истинных положительных результатов с ложными, поэтому он дает указание не только на точность (сколько было правильно идентифицировано), но и сколько было идентифицировано ложно," он сказал.
Ву сказал, "Мы показали, что существуют особенности визуализации, уникальные для восстановленных доброкачественных изображений, которые глубокое обучение может идентифицировать и потенциально помочь рентгенологам в принятии более правильных решений о том, следует ли отозвать пациента или, что более вероятно, является ложным отзывом."
"Основываясь на последовательной способности нашего алгоритма различать все категории изображений маммографии, наши результаты показывают, что действительно есть некоторые отличительные особенности / характеристики, уникальные для изображений, которые вызываются без надобности," Ву отметил. "Наши модели искусственного интеллекта могут помочь рентгенологам в чтении этих изображений и в конечном итоге принести пользу пациентам, помогая уменьшить количество ненужных отзывов."
В качестве ограничений исследования Ву отметил, что дополнительные независимые наборы данных могут помочь в дальнейшей оценке точности и надежности алгоритмов, а использование альтернативных моделей глубокого обучения, архитектур и стратегий обучения моделей может помочь повысить производительность.
