Fin janvier, l’Assistance publique-Hôpitaux de Paris (AP-HP) a organisé son tout premier “datathon”. L’événement n’a pas fait les gros titres, il en dit pourtant long sur le potentiel incroyable de l’intelligence artificielle (IA) pour améliorer la façon dont nous serons soignés demain, mais aussi sur le retard accumulé par la France.

Pendant tout un week-end, 160 chercheurs ont phosphoré sur l’usage des données collectées dans des services de réanimation, où les malades sont branchés sur différentes machines – respirateurs, tensiomètres ? “Une équipe a créé un algorithme capable de prédire quels patients feront un choc septique, à partir des informations recueillies durant les deux premières heures de leur séjour”, se félicite le Pr Jean-Paul Mira, de la Société de réanimation de langue française. Une belle réussite, donc. A un détail près : alors que cette rencontre se tenait au coeur du plus grand regroupement hospitalier d’Europe, aux archives riches de dossiers de millions de malades, il a fallu, pour l’organiser, faire appel à une base de données… américaine !

La France pauvre en données exploitables

“Nous avons constitué un entrepôt de données, qui rassemble peu à peu de multiples informations cliniques de nos patients, mais celles des services de réanimation n’y figurent pas encore en quantité suffisante, s’excuse presque un responsable de l’AP-HP. Et de toute façon, je ne sais pas si nous aurions pu les utiliser au vu des contraintes strictes sur l’anonymisation qui pèsent sur nous.”

Aussi étonnant que cela puisse paraître, la France manque de données médicales facilement exploitables pour développer de l’IA en santé, comme l’a rappelé le député et mathématicien Cédric Villani dans le rapport qu’il a remis jeudi 29 mars au président Emmanuel Macron. Pour alimenter leurs algorithmes, des start-up emblématiques comme The/rapixel (lecture automatisée de mammographies) ou Cardiologs (analyse d’électrocardiogrammes) ont dû chercher aux Etats-Unis, au Royaume-Uni, en Chine ou en Inde les dizaines de milliers de radios ou d’électrocardiogrammes (ECG) dont elles avaient besoin. Une réalité qui est en net décalage avec le discours tenu jusqu’ici par les pouvoirs publics, longtemps dans l’autosatisfaction d’avoir créé “la plus grande base de données de santé au monde”.

En l’occurrence, le Système national de données de santé (SNDS), incluant à ce jour les remboursements de l’assurance-maladie, la liste des actes réalisés dans les hôpitaux et les registres des causes de décès. Cette base administrative, formidable pour faire de l’épidémiologie ou repérer des effets secondaires graves de médicaments, “n’est pas adaptée au développement de l’IA dans le secteur de la santé”, selon le rapport Villani. Pour créer des algorithmes, il faut avant tout les informations contenues dans les dossiers médicaux des hôpitaux ou des médecins de ville (diagnostics, examens, antécédents ?). “Le jour où ces éléments seront disponibles, et où, en plus, ils pourront être croisés avec ceux du SNDS, alors oui, nous disposerons d’un outil unique au monde et très puissant pour développer de l’IA”, confirme Dominique Polton, la présidente de l’Institut national des données de santé.

Une liste de difficulté sans fin

C’est justement l’ambition du “hub des données de santé”annoncé jeudi par le Président Emmanuel Macron. Sans cette infrastructure, la médecine de demain, individualisée, prédictive et préventive ne verra tout simplement pas le jour. Ou en tout cas, elle ne naîtra pas en France. Alors qu’une véritable course mondiale aux données de santé se trouve engagée, avec de nombreux pays déjà très en avance, l’enjeu est stratégique et économique, mais aussi médical. “Si un algorithme est développé à partir de données collectées aux Etats-Unis, par exemple, avec une population souvent en surpoids, mais des infirmières de réanimation 2,5 fois plus nombreuses que chez nous, ses analyses ne seront pas forcément pertinentes pour nous”, souligne le Pr Jean-Paul Mira.

Pour autant, ce “hub” s’annonce complexe à concrétiser. “C’est un chantier gigantesque, confie Bertrand Rondepierre, un des membres de la mission Villani. Un énorme travail reste à accomplir pour que les hôpitaux et les médecins se mettent en ordre de bataille.” Au-delà des interrogations soulevées par cette annonce (qui va piloter sa réalisation, dans quel calendrier ?), la liste des difficultés à surmonter semble sans fin.

La question de la structuration des données

L’informatique hospitalière est déjà un premier sujet. La situation s’améliore mais le papier n’a pas encore totalement disparu. Yann Fleurot, le patron de Cardiologs, a ainsi eu la surprise de découvrir que même au sein des établissements parisiens, une partie des ECG n’étaient pas numérisés. “Les hôpitaux manquent de moyens : remplacer les appareils existants coûterait trop cher”, constate-t-il. Et même quand tout est numérique, les ingénieurs ne sont pas au bout de leurs peines. “Extraire les données des logiciels reste compliqué, car certains éditeurs refusent d’ouvrir leurs systèmes. Et surtout les différents services disposent d’une grande variété d’outils qui, la plupart du temps, ne communiquent pas entre eux”, souligne-t-on à l’AP-HP. Mais ces problèmes techniques ne sont pas les plus ardus ?

Pour qu’un algorithme puisse croiser des données, il faut, dans l’idéal, que celles-ci soient “structurées”. Autrement dit, que les dossiers médicaux et les résultats d’examens soient présentés de la même façon (par exemple la taille toujours inscrite en centimètres et non en mètre) et qu’un même symptôme ne soit pas décrit de trois façons différentes par trois médecins différents. Un vrai challenge : “Il y a des secteurs où les dossiers sont très bien organisés, comme en cancérologie. Mais cela reste limité car standardiser demande du temps aux médecins”, constate Marc Cuggia, professeur en informatique médicale au centre hospitalier universitaire (CHU) de Rennes. Certains craignent aussi de voir les données de leur service “pillées” par des confrères pour des publications scientifiques dont eux-mêmes ne tireraient aucun bénéfice. A l’AP-HP par exemple, la procédure d’accès aux bases stipule que tous les chefs de service concernés peuvent s’opposer à une demande !

“Les réticences s’effacent au fil du temps, quand les médecins voient à quel point ces entrepôts de données servent leurs recherches”, espère le Pr Cuggia. L’alternative ? Mettre au point des logiciels de fouille automatique de texte, pour extraire les informations de la prose des comptes rendus, un peu comme le fait Google avec le Web. “Pour la médecine, ces outils existent en anglais, mais ils restent en développement en français”, indique Nicolas Garcelon, chargé de la construction de l’entrepôt de données de l’institut Imagine à Paris.

Un changement de loi nécessaire

Les directions des hôpitaux ont pu aussi parfois manquer d’enthousiasme. “Créer une base de données représente des investissements importants dont les établissements ne voient pas toujours le bénéfice à court terme”, souligne Jean-Yves Robin, le directeur général d’Openhealth Company. Aujourd’hui, seules une partie des centres de lutte contre le cancer et une poignée de CHU disposent d’entrepôts déjà opérationnels. Une fois des bases exploitables constituées un peu partout, restera encore à les relier au SNDS. Pas simple non plus. Cela supposerait, entre autres, que chaque patient dispose d’un identifiant national unique.

La question peut sembler triviale, chacun d’entre nous ayant un numéro de sécurité sociale. Sauf que son utilisation par les hôpitaux était formellement interdite jusqu’à l’an dernier. “Maintenant, c’est encouragé mais les établissements ont adopté un autre système pour identifier les patients. S’adapter leur prendra du temps”, regrette Olivier Clatz, de Therapixel. Des techniques alternatives de rapprochement des données existent, mais elles sont complexes, avec une marge d’erreur non négligeable.

Quant aux données des médecins libéraux, les intégrer dans le SNDS supposerait déjà que le dossier médical partagé soit massivement adopté par les Français. De l’aveu récent de Nicolas Revel, le directeur général de la caisse d’assurance-maladie, cela prendra “quatre ou cinq ans”. “Aujourd’hui, la loi prévoit qu’il serve à la coordination des soins, mais pas à la recherche. Donc il faudra aussi, au minimum, changer la loi”, souligne Jean-Yves Robin. Dans tous les cas, reste la grande question : les Français accepteront-ils que leurs données personnelles soient ainsi réutilisées ?

Même si elles ne sont pas nominatives, même si le nouveau règlement européen relatif à la protection des données, qui doit entrer en vigueur en mai, va dans le bon sens, la question se posera. Au Royaume-Uni, le gouvernement avait annoncé en 2013 la création d’une grande base croisant notamment les fichiers des généralistes et ceux des hôpitaux. Face au tollé général, le projet a depuis été enterré. Une leçon pour la France ?

Source https://www.lexpress.fr/actualite/sciences/la-course-aux-donnees-de-sante-est-lancee_1996695.html

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here