Яндекс на практике применил федеративное машинное обучение
Компания Яндекс заявила, что она вместе с Институтом системного программирования имени В. П. Иванникова РАН и Сеченовским Университетом впервые в России на практике применила федеративное машинное обучение. Его также называют совместным: оно предназначено для проектов, где есть несколько участников с собственными наборами данных (датасетами). Федеративный подход позволяет участникам коллективно обучать нейросети, никому не передавая свои данные.
Изображение: Flux
Сперва модель обучается на каждом из датасетов участников проекта. На центральный сервер передаются не сами датасеты, а результаты их обработки. Именно на них затем обучается глобальная модель. Таким образом, датасеты на протяжении всего процесса обучения не покидают контуры организаций — и никто, кроме владельцев, не может получить к ним доступ. Яндекс отмечает, что в таких проектах смогут участвовать компании из отраслей, где имеют дело с «чувствительной» информацией: например, финансов, медицины или промышленности.
Яндекс, ИСП РАН и Сеченовский Университет Минздрава России, используя федеративный подход, создали нейросеть, которая по данным электрокардиограмм выявляет фибрилляцию предсердий — одну из наиболее распространённых патологий сердца. Для обучения использовались два независимых датасета с электрокардиограммами: от Сеченовского университета и от ИСП РАН. Оба партнёра провели раунды обучения на своей стороне, а затем передали результаты в общий контур.
В будущем воспользоваться федеративным машинным обучением смогут клиенты Yandex Cloud. Новый подход позволит участвовать в совместных проектах организациям, которые раньше не могли сотрудничать из-за рисков, связанных с передачей конфиденциальных данных. В Яндексе считают, что это повысит качество итоговых моделей — чем больше партнёров в проекте, тем больше данных для обучения. Кроме того, федеративный метод будет полезен тем, которых разделяют большие расстояния.