Цель исследования
Изучить эффективность системы машинного обучения (МО) для прогнозирования рецидива после операции по поводу почечно-клеточного рака (КР) и сравнить их с текущими проверенными моделями.
Дизайн исследования
В этом обсервационном исследовании были разработали и протестированы несколько моделей на основе МО ("случайный лес" выживаемости [RSF], машины опорных векторов выживаемости [S-SVM] и экстремальный градиентый бустинг [XG boost]), для прогнозирования рецидива локализованного ПКР у пациентов после резекции почки или радикальной нефрэктомии в период с 2013 по 2020 год в 21 французском медицинском центре.
Измерение результатов и статистический анализ
Первичной конечной точкой была безрецидивная выживаемость. Дискриминацию модели оценивали с использованием индекса конкордации (с-индекс), а калибровку оценивали с помощью шкалы Бриера. Модели МО сравнивали с четырьмя обычными прогностическими моделями с использованием анализа кривых решений (DCA).
Результаты и ограничения
Всего в это исследование было включено 4067 пациентов (3253 в когорту разработки и 814 в когорту валидации). Большинство опухолей (69%) представляли собой светлоклеточный ПКР, 40% имели высокую степень злокачественности, 24% имели некроз. У 4% пациентов было выявлено метастатическое поражение лимфатических узлов. После медианы наблюдения 57 мес (межквартильный размах 29–76) рецидив возник у 523 (13%) пациентов. Модели МО получили более высокие значения c-индекса, чем обычные модели. Самые высокие значения c-индекса (0,794) были поучены в модели RFS, с-индекс для модели S-SVM составил 0,784, а для XG-boost c-индекс 0,782. Кроме того, все модели показали хорошую калибровку с низкими интегрированными баллами Бриера (все интегральные баллы Бриера <0,1). Однако мы обнаружили дрейф калибровки со временем для всех моделей, хотя и с меньшей величиной для моделей МО. Наконец, DCA продемонстрировала дополнительную преимущество всех моделей машинного обучения по сравнению с традиционными моделями, которые в настоящее время используются на практике.
(А) Меры дискриминации моделей машинного обучения и стандартных прогностических моделей для каждого момента времени t.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
(B) Кривые ошибки прогноза показывают оценку Бриера для каждого времени t.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
Анализ кривой решений, показывающий чистую выгоду, связанную с использованием моделей МО и классических прогностических моделей в возрасте 60 месяцев для прогнозирования безрецидивной выживаемости. Ось Y измеряет чистую выгоду, а ось x представляет собой порог риска. коричневый
линия представляет собой предположение, что ни у одного пациент не случится рецидив, а фиолетовая
линия представляет собой предположение, что все пациенты будут рецидивировать.
Прогностическая ценность для каждой модели рассчитывается по диапазону риска пороговых вероятностей. Например, для порога принятия решения 30% использование модели RSF позволило бы приблизительно определить десять дополнительных истинных рецидивов на 100 человек, без увеличения числа ложных положительных прогнозов. Соответствующая чистая выгода от использования модели RSF
по сравнению с классической моделью пять дополнительных истинных повторений.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
линия представляет собой предположение, что ни у одного пациент не случится рецидив, а фиолетовая
линия представляет собой предположение, что все пациенты будут рецидивировать.
Прогностическая ценность для каждой модели рассчитывается по диапазону риска пороговых вероятностей. Например, для порога принятия решения 30% использование модели RSF позволило бы приблизительно определить десять дополнительных истинных рецидивов на 100 человек, без увеличения числа ложных положительных прогнозов. Соответствующая чистая выгода от использования модели RSF
по сравнению с классической моделью пять дополнительных истинных повторений.
Random Survival Forest - "случайный лес" выживаемости, Extreme Gradient Boosting - экстремальный градиентый бустинг, Survival Support Vector Machine - машины опорных векторов выживаемости
GRANT = класс, возраст, узлы и опухоль; SSIGN = стадия, размер, степень и некроз; UISS = Калифорнийский университет в Лос-Анджелесе. Интегрированная система стадирования.
Выводы
Применение подходов МО для прогнозирования рецидива после хирургической резекции почечно-клеточного рака привело к лучшему прогнозу, чем у современных проверенных моделей, доступных в клинической практике. Тем не менее, еще есть возможности для улучшения, которые могут быть связаны с интеграцией новых биологических и/или визуализирующих биомаркеров.