Big Data : à l’heure des patients artificiels
Le Livre Blanc sur les données de santé artificielles fait le point sur ces technologies conjuguant l’IA et les mathématiques et susceptibles de bouleverser le champ de la santé, en particulier celui de la recherche clinique. Et il appelle à la constitution d’un écosystème d’évaluation et de régulation propice à leur déploiement.
L’écosystème de la donnée progresse à grand pas, au fil des ruptures technologiques portées par les outils d’Intelligence Artificielle. Et de nouveaux usages se profilent, offrant des possibilités inédites pour accélérer la mise au point de thérapies innovantes. Le 30 avril dernier, la présentation du Livre Blanc « Données de santé artificielles : analyse et pistes de réflexion » en témoignait. Sous la houlette du Pr Stéphanie Allassonnière, enseignante en mathématiques à l’Université Paris-Cité et directrice-adjointe de la Chaire PR(AI)RIE, et du Dr Jean-Louis Fraysse, co-fondateur de BOTdesign, une vingtaine d’experts se sont associés pour éclairer un concept appelé à un bel avenir : le recours aux « cohortes augmentées ». « Les cohortes augmentées sont constituées de patients réels, mais également de patients artificiels, explique Stéphanie Allassonnière. Les données de ces patients artificiels sont générées de toute pièce par des modèles de Machine Learning s’appuyant sur les données réelles de la cohorte, provenant des patients recrutés pour l’étude concernée. » Ces cohortes augmentées sont à distinguer des cohortes dites « synthétiques » (tels les bras de contrôle synthétique), qui, elles, sont composées de données réelles « recyclées » provenant de patients inclus dans des cohortes antérieures.
Accélérer la recherche clinique
Cette « donnée augmentée », donc, permet en quelque sorte de créer un « jumeau numérique » collectif. Elle est produite à partir d’algorithmes implémentant des modélisations mathématiques. Sans les détailler, il faut retenir l’intérêt de cette approche dans de nombreux champs de la santé : l’assistance aux professionnels de santé dans la pose du diagnostic, l’aide à la personnalisation des traitements, l’identification des populations sensibles à un traitement donné, le soutien à la formation médicale, la simulation de propagation d’épidémies, le test de robustesse et de sécurité des systèmes informatiques et, bien entendu, la mise en œuvre d’essais cliniques à partir de ces patients artificiels pour évaluer l’efficacité et la sécurité de nouvelles molécules ou de dispositifs médicaux. « Dans un essai clinique, les cohortes augmentées peuvent permettre d’accélérer considérablement les différentes étapes, illustre Stéphanie Allassonnière. C’est le cas par exemple pour les études qui portent sur des dispositifs médicaux, qui nécessitent des cohortes multicentriques à partir d’entrepôts de données de santé localisés sur des sites différents. C’est long, complexe et coûteux. » Grâce à la méthode des patients artificiels, les données restent dans les entrepôts, et elles sont augmentées dans le respect des critères RGPD.
Evaluer, valider, valoriser
Où en est-on aujourd’hui du développement de cette technologie ? « Nous n’en sommes qu’au tout début, signale Jean-Louis Fraysse. A défaut de guide-lines en matière d’évaluation, elles sont autorisées au cas par cas. La FDA en a validé 10, l’EMA seulement trois. » Les auteurs du Livre Blanc appellent donc à engager des travaux pour définir des critères d’évaluation de ces études, en conformité avec l’exigence de protection des données des patients. La donnée augmentée appelle à revoir les règles de conformité posées par l’essor des algorithmes, sur des questions-clé comme le traitement des données à caractère personnel, la notion d’anonymisation, la maîtrise de l’outil IA entraîné à partir de données personnelles… « Outre les limites éthiques, il faut déterminer le contexte d’usage de ces cohortes, précise Jean-Louis Fraysse, car elles n’auront pas vocation à concerner toutes les études cliniques. » « La technologie est prête, les opérateurs technologiques et les entreprises également, conclut Stéphanie Allassonnière. A présent, il faut avancer dans l’élaboration d’un écosystème propice au développement des données de santé artificielles. Outre l’enjeu pour le progrès scientifique, le défi est également économique. Les spécialistes français sont plutôt en avance, mais ils ont besoin d’un cadre plus précis pour réussir. »
Hervé Requillart