Самый смертоносный рак кожи – это меланома, от которой в 2017 году в США погибло более 9000 человек. Меланома уникальна среди видов рака тем, что возникает как видимый и идентифицируемый след на поверхности кожи – в отличие от рака груди, легких или толстой кишки, который развивается скрыто от нашего взгляда. Это предполагает, что компьютерное зрение, которое продемонстрировало человеческую эквивалентность в задачах визуального распознавания, таких как идентификация лица и объектов, идеально подходит для помощи в раннем обнаружении меланомы. Однако врачи и пациенты продолжают полагаться на невооруженный глаз, чтобы распознать меланому. Возникает очевидный вопрос: почему компьютеры не помогают человеческому глазу в обнаружении меланомы??
Причина, на мой взгляд, не в недостатке технологий компьютерного зрения или врожденной сложности обнаружения меланомы. Скорее, самым большим препятствием на сегодняшний день является неспособность медицинского сообщества создавать большие, хорошо спроектированные общедоступные наборы данных изображений кожи с необходимыми метаданными для обучения систем точному обнаружению. Это узкое место в наборе данных препятствовало изучению компьютерного обнаружения меланомы в крупном и значимом масштабе и не позволило провести сравнительные исследования нескольких алгоритмов, разработанных этими исследователями, которым посчастливилось иметь доступ к закрытым наборам данных изображений кожи. Исследования, опубликованные в этой среде, вносят свой вклад в текущую "кризис репликации" что существует в медицине сегодня; результаты невозможно воспроизвести (или улучшить) независимыми исследователями, если наборы данных скрыты в частных хранилищах.
Международное сотрудничество в области визуализации кожи (ISIC) начинает удовлетворять эту неудовлетворенную потребность путем создания большого общедоступного архива с открытым исходным кодом высококачественных аннотированных изображений кожи. В настоящее время архив ISIC содержит более 13 000 изображений кожных поражений, в том числе более 1000 изображений меланом, с долгосрочной целью – разместить миллионы изображений, полученных с использованием различных методов визуализации, для использования: (а) врачами и преподавателями для улучшения преподавания и выявление рака кожи, (б) широкая публика для самообразования, и (в) ученые, занимающиеся компьютерным зрением, для разработки и тестирования алгоритмов обнаружения рака кожи.
Используя набор данных, собранный из архива ISIC, наша академическая и промышленная группа из Memorial Sloan Kettering Cancer, Университета Эмори, IBM Research и Kitware, Inc. организовал первую международную задачу по обнаружению изображений меланомы на Международном симпозиуме по биомедицинской визуализации 2016 г. в Праге, Чешская Республика. Участвовали двадцать пять команд, и мы недавно опубликовали наши результаты в Журнале Американской академии дерматологии, сравнивая производительность автоматизированных компьютерных алгоритмов с дерматологами, специализирующимися на обнаружении рака кожи. В этой задаче средняя производительность дерматологов сравнялась с точностью диагностики меланомы лучших индивидуальных компьютерных алгоритмов, но была превзойдена алгоритмом слияния машинного обучения с использованием прогнозов из 16 алгоритмов.
Основываясь на этих результатах, ожидаю ли я замены компьютера в течение следующих 5-10 лет?? Нет, по двум причинам: 1) исследование имело ряд ограничений, включая отсутствие полного разнообразия представлений о человеческой популяции и возможных заболеваниях, и 2) врачи используют и применяют навыки, не связанные с распознаванием изображений. Наше исследование имело множество ограничений и проводилось в искусственно созданной обстановке, которая не приближается к повседневной клинической практике с участием пациентов.
Например, при обследовании подозрительного поражения кожи дерматолог будет учитывать не только соответствующие клинические данные, такие как возраст, история / симптомы поражения, прошлый личный или семейный анамнез рака кожи, а также контекст поражения относительно внешнего вида пациента. другие поражения кожи, но также можно прощупать ее текстуру, протереть спиртом, отрегулировать освещение или изменить положение пациента. Вклад этих дополнительных факторов анамнеза и физического осмотра в диагностику меланомы неизвестен, но, вероятно, будет значительным, и, к сожалению, мы не смогли включить эти данные в наше исследование. Дерматологи также рассматривают десятки возможных диагнозов (а также возможные медицинские, психосоциальные, косметические, финансовые и юридические последствия своих решений) во время обследования пациента, и мы проверили только два диагноза, меланома и родинки, в компьютерной задаче.
Тем не менее, сделав наш набор данных доступным для более широкого научного сообщества, я надеюсь, что наши усилия представляют собой новый, прозрачный путь вперед, который стимулирует интерес к обнаружению меланомы среди сообщества компьютерного зрения. Тем временем я продолжу работать с моими коллегами над созданием более крупных и разнообразных наборов данных в архиве ISIC, которые ускорят разработку методов глубокого обучения для обнаружения меланомы и более точно воспроизводят проблемы, возникающие при обследовании кожных повреждений у пациентов. Наша недавно завершенная задача 2017 года – небольшой шаг в этом направлении, но предстоит еще много работы.