Un groupe d’industriels utilise l’apprentissage fédéré pour accélérer la découverte de médicaments

L'Usine Digitale - Extraits - Juillet 2022

Comment collaborer sans partager des données sensibles ? C’est sur cette problématique qu’a voulu se pencher un consortium d’entreprises pharmaceutiques, de start-up et d’universités pour découvrir des molécules prometteuses grâce à l’IA. Ils ont développé une plateforme, dans le cadre d’un projet financé par l’UE, reposant sur l’apprentissage fédéré : la division des tâches d’entraînement d’un algorithme sur plusieurs machines tout en conservant la confidentialité des données. En trois ans, elle a permis d’élaborer plusieurs modèles.

Lancé en 2019, le projet « Melloddy » présente ce 13 juillet ses résultats dans le développement et l’exploitation d’une plateforme sécurisée permettant l’apprentissage fédéré sans partager les données de chaque partenaire pour la découverte de molécules prometteuses.

17 PARTENAIRES
Financé à hauteur de 18 millions d’euros sur trois ans par l’Union européenne dans le cadre de l’Initiative pour les médicaments innovants (IMI2), ce projet a rassemblé 10 industriels pharmaceutiques (Novartis, Servier, Janssen, Merck…), quatre start-up et PME ainsi que deux universités. Nvidia était également membre du consortium.

Le constat était le suivant : les entreprises pharmaceutiques disposent de librairies de molécules sur lesquelles des expériences sont menées. « C’est leur trésor de guerre », déclare Mathieu Galtier, chief product officer au sein de la start-up française Owkin, membre du projet, à L’Usine Digitale. Or, en combinant leurs forces, elles pourraient considérablement accélérer la découverte de molécules prometteuses et donc de médicaments. D’où la naissance du projet Melloddy.

LE RECOURS À L’APPRENTISSAGE FÉDÉRÉ
Melloddy a « permis de faire une collaboration d’un nouveau type : nous avons rassemblé 10 entreprises habituellement en compétition pour les faire travailler ensemble », explique Mathieu Galtier. En effet, ces entreprises ne veulent pas partager leurs données stratégiques avec leurs concurrents. Raison pour laquelle la plateforme développée repose sur l’apprentissage fédéré qui permet « d’entraîner un modèle de machine learning sur toutes les données des entreprises pharmaceutiques sans avoir à partager ces données ».

C’est Owkin qui a apporté la brique technologique relative à l’apprentissage fédéré. « Au lieu de faire circuler les données, ce sont les algorithmes et les modèles qui vont bouger entre les différents serveurs, détaille le chief product officer. Les données sont ainsi sanctuarisées et restent derrière les firewalls au sein des entreprises pharmaceutiques. » Ce système permet de s’assurer que « les données rentrent dans les modèles uniquement en tant qu’informations agrégées ».

En trois ans, le projet Melloddy a ainsi permis d’élaborer des modèles qui se basent sur des milliards de points de données expérimentales issues de l’industrie, documentant le comportement de plus de 20 millions de petites molécules chimiques dans le cadre de plus de 40 000 essais biologiques.

UNE MEILLEURE PERFORMANCE GRÂCE À LA COLLABORATION
Le résultat est clair : le recours à cette technologie permet d’obtenir des modèles plus performants. Pour évaluer l’amélioration des modèles tout en tenant compte de la grande variété des essais, pour chaque modèle multipartenaire, la proximité d’un score parfait a été comparée avec celle du modèle correspondant élaboré par un partenaire unique. Dans les détails, pour l’ensemble des partenaires pharmaceutiques, la performance des modèles collaboratifs affichait une supériorité moyenne de 4% pour la classification des molécules comme soit actives, soit inactives sur le plan pharmacologique ou toxicologique.

Reste la question de la paternité de la découverte d’une molécule. « Nous avons décidé de fixer le principe suivant : le modèle entraîné par les données revient à toutes les entreprises pharmaceutiques, indique Mathieu Galtier. En revanche, toute la recherche à partir de ce modèle appartient à l’entreprise concernée. »

DE NOMBREUX CAS D’USAGE DANS LA SANTÉ

Le projet Melloddy est mis « sur pause » quelques temps puis reprendra « avec des consortiums différents ». En effet, les cas d’usages sont multiples : les anticorps, les données patients, la génomique… Le but est évidemment de pouvoir commercialiser ce système.

Newsletter

Inscrivez-vous pour recevoir nos dernières actualités.