Недостаточно доказательств того, что скрининг на рак груди на ИИ является достаточно точным, чтобы заменить человеческое наблюдение

Люди по-прежнему кажутся лучше, чем технологии, когда дело доходит до точности выявления возможных случаев рака груди во время скрининга, – говорится в обзоре, опубликованном сегодня в BMJ.

Исследователи говорят, что в настоящее время отсутствуют качественные доказательства в поддержку политики замены людей-радиологов технологиями искусственного интеллекта (ИИ) при скрининге на рак груди.

Рак груди является основной причиной смерти женщин во всем мире, и многие страны ввели программы маммографического скрининга для раннего выявления и лечения. Но исследование маммограмм на предмет ранних признаков рака – это повторяющаяся работа большого объема для радиологов, а некоторые виды рака упускаются из виду.

Предыдущие исследования показали, что системы искусственного интеллекта превосходят людей и вскоре могут быть использованы вместо опытных радиологов. Тем не менее, недавний обзор 23 исследований выявил пробелы в доказательствах и озабоченность по поводу используемых методов.

Чтобы устранить эту неопределенность, Национальный скрининговый комитет Великобритании поручил группе исследователей из Уорикского университета изучить точность ИИ для выявления рака груди в практике маммографического скрининга.

Исследователи проанализировали 12 исследований, проведенных с 2010 года, с участием 131822 женщин, прошедших скрининг, в Швеции, США, Германии, Нидерландах и Испании.

В целом качество методов, использованных в 12 исследованиях, было низким, а их применимость к европейским или британским программам скрининга рака груди была низкой.

Три крупных исследования с участием 79 910 женщин сравнивали системы искусственного интеллекта с клиническими решениями первоначального радиолога. Из них у 1878 был обнаружен рак или интервальный рак (рак был диагностирован между назначениями на плановый скрининг) в течение 12 месяцев после скрининга.

Большинство (34 из 36 или 94%) систем искусственного интеллекта, оцененных в этих трех исследованиях, были менее точными, чем один радиолог, и все они были менее точными, чем консенсус двух или более радиологов, что является стандартной практикой в ​​Европе.

Напротив, пять небольших исследований с участием 1086 женщин показали, что все оцениваемые системы искусственного интеллекта были более точными, чем у одного радиолога. Но исследователи отмечают, что эти исследования подвергались высокому риску предвзятости, и их многообещающие результаты не воспроизводятся в более крупных исследованиях.

В трех исследованиях ИИ использовался в качестве предварительного скрининга для определения того, какие маммограммы должны быть исследованы радиологом, а какие не проверяли 53%, 45% и 50% женщин с низким риском, но также 10%, 4%, и 0% раковых заболеваний, обнаруженных радиологами.

Авторы указывают на некоторые ограничения исследования, такие как исключение неанглийских исследований, которые могли бы содержать соответствующие доказательства, и они признают, что алгоритмы ИИ недолговечны и постоянно улучшаются, поэтому опубликованные оценки систем ИИ могут быть устаревшими к моменту исследования. публикация.

Тем не менее, использование строгих критериев включения в исследование вместе со строгой и систематической оценкой качества исследования предполагает, что их выводы являются надежными.

Таким образом, они говорят: "Текущие данные об использовании систем искусственного интеллекта при скрининге рака молочной железы далеки от качества и количества, необходимых для их внедрения в клиническую практику."

Они добавляют: "Необходимы хорошо спланированные сравнительные исследования точности тестов, рандомизированные контролируемые исследования и когортные исследования в больших скрининговых группах, которые оценивают коммерчески доступные системы искусственного интеллекта в сочетании с радиологами в клинической практике."