Федеративное обучение – относительно новая методика, которая впервые была реализована Google для создания функции автозамены клавиатуры – она обучает алгоритм на нескольких децентрализованных устройствах или серверах, содержащих локальные выборки данных, без обмена ими.
Этот подход потенциально может быть использован для ответа на многие медицинские вопросы, однако, исследователи из Penn Medicine (Система здравоохранения Университета Пенсильвании) показали, что федеративное обучение является особенно эффективным анализе магнитно-резонансной томографии (МРТ) пациентов с опухолями головного мозга и способна выделять здоровую мозговую ткань в раковых областях.
Чтобы ответить на медицинские вопросы, которые могут быть применены к широкому кругу пациентов, модели машинного обучения опираются на большие, разнообразные наборы данных из различных учреждений. Тем не менее, системы здравоохранения и больницы часто не могут делиться данными пациентов из-за юридических, личных и культурных проблем.
По данным исследования под руководством доктора Спиридона Бакаса (Spyridon Bakas), преподавателя радиологии, патологии и лабораторной медицины в школе Перельмана (Perelman School), новая методика федеративного обучения, может применятся в больницах по всему миру. Врачи могут обучаться на основе общей модели, вводя свои данные сканирования мозга пациента. Их данные будут перенесены на централизованный сервер. Различные модели в конечном итоге будут согласованы в консенсусную модель, которая интегрирует в себе данные каждой из больниц и поэтому является клинически полезной для всех.
«Чем больше данных видит вычислительная модель, тем лучше она изучает проблему и тем лучше может ответить на вопрос, на который она была разработана», - утверждает Бакас.
Модель федеративного обучения должна быть утверждена и одобрена Управлением по контролю за продуктами и лекарствами США, прежде чем ее можно будет лицензировать и коммерциализировать в качестве клинического инструмента для врачей. Но если и когда модель будет коммерциализирована, это поможет радиологам, радиационным онкологам и нейрохирургам принять важные решения относительно ухода за пациентами.
Чтобы проверить эффективность федеративного обучения и сравнить его с другими методами машинного обучения, Бакас сотрудничал с исследователями из Онкологического центра доктора медицины Андерсона при Университете штата Техас (University of Texas MD Anderson Cancer Center), Университета Вашингтона (Washington University) и Онкологического центра Хиллмана в Университете Питтсбурга (Hillman Cancer Center, University of Pittsburgh), в то время как корпорация Intel внесла вклад в обеспечение конфиденциальности и защиту программного обеспечения для проекта.
Исследование началось с модели, которая была предварительно обучена на многоинституциональных данных из открытого хранилища, известного как «Международная сегментация опухолей головного мозга, или BraTS» (International Brain Tumor Segmentation). В настоящее время BraTS предоставляет набор данных, который включает более 2600 сканирований головного мозга, полученных с помощью магнитно-резонансной томографии (МРТ) от 660 пациентов. Затем в исследовании приняли участие 10 больниц, обучивших модели ИИ своим собственным данным пациентов. Техника федеративного обучения была затем использована для агрегирования данных и создания консенсусной модели.
Исследователи сравнили федеративное обучение с моделями, подготовленными отдельными учреждениями, а также с другими подходами совместного обучения. Эффективность каждого метода была измерена путем тестирования их на сканирование, которое было аннотировано вручную неврологами. По сравнению с моделью, обученной централизованным данным, которая не защищала конфиденциальность пациентов, федеративное обучение могло выполнять почти (99%) идентично. Результаты также показали, что расширение доступа к данным за счет частного, многоучрежденческого сотрудничества может повысить производительность модели.
Результаты этого исследования проложили путь к гораздо более масштабному, амбициозному сотрудничеству между Penn Medicine, Intel и 30 партнерскими учреждениями при поддержке гранта в размере 1,2 млн. долл. от Национального института рака Национального института здравоохранения (National Cancer Institute of the National Institutes of Health), который получила команда Бакаса.
В мае Intel объявила, что Бакас возглавит проект, в котором 30 учреждений в девяти странах будут использовать федеративный подход к обучению для обучения модели AI на основе консенсуса по данным опухоли головного мозга. Конечной целью проекта будет создание инструмента с открытым исходным кодом, который может использовать любой врач в любой больнице.
Евгений Новожилов
Элемент не найден