Cette note détaillée se base sur des billets que nous avions rédigés sur ce sujet et sur l’article “IBM pitched its Watson supercomputer as a revolution in cancer care. It’s nowhere close” By Casey Ross @caseymross and Ike Swetlitz @ikeswetlitz que nous avons traduit, résumé et très largement commenté.
A innovationesante.fr depuis des années, nous nous sommes enthousiasmé par le parcours de Watson d’IBM, le fer de lance de l’application de l’informatique cognitive en médecine, improprement appelé partout “intelligence artificielle” (IA). Nous avions interviewé Jérome Pesenti qui avait dirigé les travaux de Watson santé à New York. Il avait souligné une des faiblesses du système qui perdure aujourd’hui : La nécessaire mise à disposition de l’ogre Watson d’un Big Data composé de nombreux dossiers de patients dont les données doivent être bien ordonnées.
Dans le billet L’intelligence artificielle se mobilise contre la maladie d’Alzheimer : Interview de Jérôme Pesenti
A la question de innovationesante.fr :
« Le dossier médical électronique (dans le cloud), n’existe pas (ou très peu) en France, il ne peut donc pas être intégré aux systèmes d’IA, quel est selon vous l’impact de ce problème par rapport aux systèmes que vous développez. » (Dans le cadre de benevolent)
Jérôme Pesenti repondait : « Le dossier médical électronique n’est pas un problème pour Benevolent, mais pour Watson, c’est un problème essentiel. La possibilité d’avoir un bon dossier électronique du patient, avec de bonnes données dans le cloud, est essentiel. Aux US cela est en train de se faire mais il y a encore beaucoup de travail à faire sur le dossier électronique. Le dossier électronique est fondamental pour la médecine personnalisée et assistée « .
Nous verrons dans ce billet que cette problématique reste d’actualité.
Pour apprécier complètement ce billet il est utile de relire également:
( L’intelligence artificielle selon Watson d’IBM )
Après une entrée médiatique fracassante à la télé Nord-Américaine (Jeopardy en 2011), ce fer de lance de l’informatique cognitive appliquée à la médecine promettait une rapide révolution de l’utilisation des data médicales au profit du traitement notamment des cancers !
Ce système complexe mettait en lumière tous les nouveaux aspects de l’informatique cognitive couplé à la puissance de stockage et de traitement des datas dans le cloud, la spécialité de la nouvelle société IBM dont l’ADN avait muté du hardware vers l’IA et Bluemix
Watson doit assister le médecin, lui simplifier l’accès à l’information.
Ces composantes « de base » sont la reconnaissance vocale, la traduction automatique, la reconnaissance visuelle, l’analyse de fichiers (Watson Analytics), des techniques de statistiques, de linguistique.
Avec des apports de Merge Healthcare une société d’Imagerie médicale,
après des partenariats, avec ResearchKit d’Apple, avec Pathway Genomics, et quelques milliards de dollards d’investissements supplémentaires dans Phytel, Explorys, Merge Healthcare et Truven.
Cette accumulation de NTIC devant permettre une aide à la décision, avec intégration du dossier médical, du génome, une analyse de l’imagerie, une analyse de la littérature mondiale, une prise en compte automatisée des interactions médicamenteuses.
Les Hôpitaux pionniers de l’utilisation de Watson étant le New York Genome Center et le Memorial Sloan Kettering Cancer Center véritable incubateur et vaisseau amiral de ce que l’on nomme maintenant Watson health.
Mais après 3 années d’importants investissements et d’un marketing volontaire, d’importantes nuances se font entendre, la pénétration du marché semble en deçà des espérances avec seulement quelques dizaines d’hôpitaux utilisateurs.
– Watson aurait du mal à se familiariser avec les différentes formes de cancer
– Watson est né Américain, et dans les hôpitaux hors US, son avis serait biaisé influencé par la spécificité des patients et des méthodes de traitement US.
-Watson aurait été commercialisé alors que le produit n’était pas abouti, les médecins et des chercheurs utilisateurs se retrouvent dans un contexte de Beta testeurs !
-Le système Watson for Oncology, est en développement depuis près de huit ans, il en est toujours à ses balbutiements, IBM le décrivait comme un prodige numérique, susceptible d’apporter de nouvelles approches pour le traitement du cancer. En fait les capacités du supercalculateur sont limitées.
– l’une des failles de Watson est également qu’il a besoin de se nourrir d’un nécessaire dossier médical électronique performant et donc de datas cliniques.
-D’aucun prétendent même qu’il n’est artificiellement intelligent que dans le sens le plus rudimentaire du terme, ce qui est un comble pour le système réputé historiquement en pointe de l’IA (nous confirmons ainsi que ce terme reste impropre d’où l’utilisation du terme de techniques cognitives).
Au Memorial Sloan Kettering Cancer Center à New York le Dr Mark Kris, formateur principal de Watson a même noté qu’une découverte scientifique importante entrainant une modification significative et brutale du traitement d’un cancer ne pouvait pas être pris en compte rapidement par Watson !
-Watson n’a jamais été comparé avec les systèmes traditionnels de diagnostic et de traitement, IBM n’a publié aucun article scientifique dans ce contexte, Yoon Sup Choi un spécialiste Sud-Coréen de l’IA en médecine déclare même, qu’il est risqué pour IBM de réaliser des essais cliniques comparatifs car d’une part Watson est déjà commercialisé et il est peu probable qu’un essai clinique améliore les perspectives commerciales et que d’autre part « Si le résultat de l’essai clinique n’est pas très bon il y aurait même un risque commercial majeur ».
Cela est vraiment cynique !
Pour Pilar Ossorio, professeur de droit et de bioéthique à la Law School of University of Wisconsin Watson devrait être soumis à une réglementation plus stricte sur le plan éthique et scientifique, Watson devrait prouver qu’il évolue en toute sécurité et efficacité pour le patient.
Pour le Dr Uhn Lee responsable du programme Watson au centre médical Gil de l’université de Gachon en Corée du Sud « L’intelligence artificielle sera adoptée dans tous les domaines médicaux à l’avenir », et il n’y donc pas besoin d’études préalables. Cela est peut-être vrai, mais la relation d’intérêt est ici évidente, voir dans ce cas précis un conflit d’intérêt.
Aucune publication dans des revues à comité de lecture n’existe. Les autres rapports sont réalisés par des clients payants ou par le personnel d’IBM. Parfois Watson est l’objet d’études non publiées comparant ses résultats avec les méthodes diagnostiques classiques. Ainsi dans une étude danoise non publiée, le taux d’accord entre les propositions thérapeutiques de Watson et les protocoles habituellement adoptés n’était environ que de 33%, l’hôpital avait donc décidé de ne pas acheter le système.
Des chercheurs au Danemark et aux Pays-Bas ont déclaré que les hôpitaux de leur pays n’avaient pas signé avec Watson, car Watson était trop axé sur les préférences en matière de traitement de quelques médecins américains et que leur approche pouvait être différente des usages locaux et qu’elle n’était donc pas universelle.
Voilà un des paradoxes que devra surmonter ce type de système. Il est présenté comme étant basé sur LE big data clinique (Les dossiers des patients) et scientifique (LA littérature mondiale, l’Evidence Base Medecine (EBM)). Or en réalité in fine c’est un petit groupe de médecins qui décide (avec l’accord du patient) du traitement à proposer.
Nous autres cliniciens ne sommes pas surpris, l’Evidence Base Médecine qui semblait s’imposer à nos cerveaux est très souvent relativisée, critiquée et donc adaptée quand il s’agit de prendre la décision finale. En effet l’expérience spécifique du médecin corrige souvent les données de l’EBM (cela est souvent vrai en chirurgie). Il est bien connu que les résultats de la meilleure étude (sur le plan méthodologique) randomisé peuvent finalement être contredite par une autre étude. Je citerai par exemple une étude randomisée comparant deux techniques chirurgicales. L’étude peut montrer que l’intervention A donne de meilleurs résultats en termes de douleurs chroniques post opératoire que l’intervention B. L’étude étant parfaite en ce qui concerne le choix des patients, la méthodologie et le choix des tests statistiques….
Mais cette étude a été réalisée dans un Pays ou la culture chirurgicale propre à ces deux interventions n’a rien à voir avec celle qui existe dans un autre pays. Et dans cet autre pays la même étude avec le même cahier des charges donne un résultat exactement inverse.
En fait les mains qui ont réalisé les interventions dans les deux pays n’étaient pas comparables !!
Je crois que c’est ce même problème qui est évoqué par ceux qui ont échoué ou qui ont refusé d’utiliser Watson en oncologie, comme les mains de nos chirurgiens, les cerveaux des chercheurs Newyorkais sont différents de ceux du Texas (voir plus bas), du Danemark ou des Pays bas….
Cela ne remet absolument pas en cause l’intérêt de ces systèmes en médecine mais cela démontre que le point délicat et non universel est l’interface Machine/Médecin/Patient.
Pour illustrer cela il est intéressant de citer le Dr Jeng-Fong Chiou, directeur adjoint du Taipei Cancer Center de la Taipei Medical University, qui a commencé à utiliser Watson oncologie avec des patients et qui nous apprend que Watson est plus facile à être utilisé dans les pays comme Taiwan où les médecins ont été formés aux États-Unis ou utilisent des directives de traitement similaires à celles des médecins du Memorial Sloan Kettering ( le fameux vaisseau Amiral). Mais il ajoute qu’il existe des différences entre les patients américains et taïwanais avec par exemple la nécessité d’utiliser des doses plus faibles de médicaments pour minimiser les effets secondaires. Le contexte culturel économique, le système de santé pouvant également radicalement modifier les préconisations « New-Yorkaises » de Watson
Il est intéressant de citer l’avis de Nan Chen, qui dirige le programme Watson for Oncology à l’Hôpital international Bumrungrad en Thaïlande, il déclare que ses oncologues appliquent les directives japonaises, et non américaines, pour le traitement du cancer gastrique. Il est vrai que l’épidémiologie du cancer gastrique est très différente au japon ou sa fréquence est plus élevé qu’au US. Le vécu de ce cancer est très différent et les professionnels asiatiques sont enclin à suivre leurs propres recommandations et ne voit pas l’avantage d’entrer leurs données dans Watson pour obtenir son avis qui serait soit redondant soit différent et qu’ils jugeraient de toute façon inutile !
A l’opposé Chen met en avant l’intérêt majeur de Watson dans les pays sous médicalisés. Citant le cas de l’hôpital UB Songdo en Mongolie, l’hôpital de la capitale mongole ne compte aucun spécialiste en oncologie. Les médecins suivent les recommandations de Watson dans près de 100% du temps. Sans Watson les patients seraient traités par des Médecins généralistes n’ayant que peu, voire aucune formation en cancérologie.
Et Chen de rajouter que « C’est le genre de situation dont rêve IBM ». Watson montre toute sa puissance et son hégémonie dans cette situation où il n’a pas d’interlocuteur et de contradicteur.
Cela est à l’évidence en contradiction totale avec les principes de Watson qui se présente comme un collaborateur et qui ne devrait pas simplement se substituer aux médecins comme dans cette expérience en Mongolie.
Mais le contexte est ici très différent, Watson permettant de proposer des traitements en l’absence de spécialiste. Des études devraient montrer l’impact en termes de santé public de Watson dans cette configuration.
Une expérience en Corée du Sud, décrite par le Dr Taewoo Kang montre certaines limites de Watson qui préconise par exemple un type de chimiothérapie pour un cancer du sein sans atteinte ganglionnaires en appuyant son avis sur une étude démontrant l’efficacité de ce traitement pour des patientes présentant une propagation aux ganglions ! En Corée du sud cet avis de Watson est argumenté et arbitré par le spécialiste.
Qu’en serait-il en Mongolie en l’absence de spécialiste. Des chimiothérapies probablement inutiles seraient proposées.
Des avis non indépendants (Watson, Merck) et non étayés par des faits scientifiques soulignent toutefois l’apport de Watson pour gagner du temps lors des recherches d’études, mettant en évidence dans ces études les résultats en matière de taux de survie en fonction des traitements ce qui est très intéressant pour les médecins dans le choix des thérapeutiques (Chiou à Taiwan),
Mais cela est très vraisemblable, nous l’avons déjà largement développé dans le cas de la société Benevolent qui déclarait bénéficier très largement des nouvelles mathématiques pour développer et accélérer ses recherches pharmacologiques.
Lire L’intelligence artificielle se mobilise contre la maladie d’Alzheimer : Interview de Jérôme Pesenti
Une autre expérience particulière en Corée du sud présentée par Lee, le médecin responsable du programme Watson au Gil Medical, permet aux patients de recevoir une information directement par Watson, l’information étant argumentée par des études. On retrouve dans ce contexte le schéma intuitivement vertueux de la collaboration tripartite Médecin/Patient/ Algorithme.
Lee souligne par ailleurs l’apport de Watson qui nivelle la hiérarchie des oncologues au bénéfice des plus jeunes qui peuvent bénéficier du « soutien » de Watson contre un avis différent du spécialiste senior.
Pour avoir participé à des congrès à Séoul et avoir observé les rapports hiérarchiques entre médecins d’une même équipe et avoir perçu avec curiosité l’effet de la hiérarchie sur le comportement des membres des équipes et donc des prises de décision, je pense qu’il est évident que cet apport de Watson est strictement spécifique d’un contexte culturel particulier.
Cela souligne encore une fois l’absence d’universalité des solutions émanants des NTIC.
Un autre exemple en Inde à Manipal le Dr SP Somashekhar déclare que dans la grande majorité des patients les conclusions de Watson sont comparables au comité local, mais l’intérêt est le gain de temps obtenu avec Watson, le comité n’étudiant qu’un cas sur cinq, ce gain de temps est fondamental pour le fonctionnement du service.
Un avis intéressant de Norden un ancien collaborateur de Watson rappelle l’importance d’alimenter Watson en données cliniques (les dossiers des patients) et en essais cliniques afin que Watson puisse commencer à identifier seul les meilleurs traitements. C’est ce que nous rappelions en introduction avec Jérome Pesenti, il n’y a pas de machine learning efficace sans un solide big data très spécifique. Norden déclare que pour le moment il ne pense pas « qu’un système informatique soit prêt à être commercialisé sans une certaine surveillance humaine ».
Cela est inquiétant quand on sait que Watson peut être livré à lui-même dans certains déserts médicaux (La Mongolie).
Martijn Van Oijen, épidémiologiste et professeur associé à l’Academic Medical Center aux Pays-Bas, a déclaré que Memorial Sloan Kettering regorgeait de spécialistes de haut niveau mais n’avait pas le monopole de l’expertise en cancérologie. « Le problème, c’est qu’il s’agit d’un hôpital basé aux États-Unis, dont l’approche est différente de celle d’autres hôpitaux dans le monde », a déclaré Van Oijen, impliqué dans une initiative nationale visant à évaluer des technologies telles que Watson et toutefois convaincu de l’utilisation de tels systèmes pour aider les oncologues.
IBM a indiqué qu’il poursuivait des études pour examiner l’impact de Watson mais aucune n’a été achevée à ce jour à notre connaissance.
A noter un échec retentissant en 2017 au MD Anderson Cancer Center, l’Université du Texas, l’hôpital de Houston a été l’un des premiers partenaires d’IBM. Il utilisait ce système pour créer son propre conseil en oncologie, semblable à celui que IBM développe avec le Memorial Sloan Kettering. L’université du Texas a annulé son partenariat avec Watson après plus de 60 millions de dollars d’investissement. Lynda Chin partie prenante dans ce projet, a expliqué que Watson est une technologie puissante mais qu’il est extrêmement difficile de la traduire dans le domaine du soin. Elle a rencontré de nombreux obstacles, dont certains n’ont toujours pas été complètement traités par IBM chez MD Anderson ou ailleurs.
Les failles non réglées à Houston sont :
-La difficulté d’intégrer correctement le dossier médical du patient pour lequel on interroge Watson. Il est intéressant de noter que ce problème est très fréquemment cité par les spécialistes, encore une fois répétons nous, les data du patient représentent un maillon faible car elles ne sont toujours pas à ce jour bien ordonnées et exploitables.
-Deuxième problème, la difficulté d’assurer la sécurité des traitements proposés par la machine et le problème de la responsabilité « garantir le fait de ne pas nuire ». Nous retrouvons souvent cette crainte notamment au niveau de la direction de certains Hôpitaux pour lesquelles la possibilité de problème médico-légaux freine ou annule certains projets.
-Troisième obstacle et le plus important pour Lynda Chin, la difficulté de nourrir Watson par suffisamment de données patients et provenant de sources suffisamment différentes. Le concept de machine learning repose sur ce concept de recueil d’un nombre considérable de cas clinique identifiés et comparables afin de proposer une réponse personnalisée à un patient, nous sommes toujours dans le péché originel du big data sans cohérence alors qu’il faut de la smart data immédiatement exploitable
IBM répond que cette problématique aurait été réglée suite aux travaux du Memorial Sloan Kettering, le vaisseau Amiral de Watson Health, et que la solution est utilisée par plus de 50 hôpitaux dans le monde et que des essais cliniques sont en cours. Mais toujours pas d’études indépendantes connues.
Le cas particulier du traitement du cancer de la vessie a été étudié au Memorial Sloan Kettering. Il semblerait que les propositions de traitement soient spécifiquement influencées par l’expérience des médecins de l’hôpital, et que dans le cas de certaines formes évoluées de ce cancer il est souvent très difficile avec ou sans Watson de dégager un consensus. En plus parfois les conclusions qui avaient été difficiles à dégager sont tout simplement effacées du fait d’une préférence du patient pour un traitement différent de celui préconisé en premier.
Nous pensons que dans ce contexte cela est réconfortant et redonne beaucoup d’humanité à une démarche qui semblait sons la tutelle de la machine et du Médecin !! Cela est particulièrement bien compris en France qui est le Pays de la loi Kouchner ou pour simplifier le patient est le seul maitre de son destin. (Permettez un petit rappel éthique en mettant en avant l’empowerment).
Watson semble être à une période délicate de son parcours car c’est une entreprise jeune en pleine croissance. Pour un ancien collaborateur (Peter Greulich), IBM devrait augmenter considérablement l’investissement dans Watson à l’image des investissements réalisés dans les années 1960 pour le Hardware qui avait fait le succès de cette société.
IBM qui se présente comme la société qui est la première à avoir massivement investi dans l’informatique cognitive doit faire face maintenant à une rude concurrence notamment de certains géants comme Google, Amazon, mais aussi Microsoft Unitedhealth (Optum), et des centaines d’entreprises et une galaxie de startups.
Soulignons l’exemple d’Amazon qui a lancé un laboratoire de soins de santé, où il explore les possibilités d’exploitation de données de dossiers de santé électroniques et de la création éventuelle d’un assistant médical virtuel. Nous voyons encore ici la préoccupation première de collecter convenablement les données des patients.
Des observateurs notent que l’acquisition de Truven pour 2,6 milliards de dollars pour accéder à 100 millions de dossiers de patients ne semble pas avoir porté ses fruits et de nombreux contrats de travail étaient résiliés, mais au profit d’après la direction d’IBM, de nombreuses embauches dans les unités Watson Health, situées à Cambridge, dans le Massachusetts, et sur tout le territoire Nord-Américain.
La situation, comme nous l’avons évoqué dans ce billet et pour de nombreuses raisons, semble tendue pour Watson for Oncology, le formidable travail du Memorial Sloan Kettering est très prometteur mais comme le dit le Dr Kris Watson est encore un étudiant en médecine, il apprend à jouer dans le monde réel.
Contrairement aux éléments de Marketing Watson n’est pas forcément LE système qui a toujours LA bonne solution immédiate aux questions qu’on lui pose.
La conséquence en 2017 est le chiffre d’affaires de la division de solutions cognitives d’IBM qui a reculé alors que Watson est censé être l’avenir de l’activité de la société. Seuls les services financiers, d’un montant de 300 milliards de dollars, sont considérés comme une opportunité plus importante par la société.
Mais que les cassandres qui pensent que les NTIC et donc les techniques cognitives s’opposent aux médecins et veulent s’imposer aux patients en déshumanisaient notre profession en soient pour leur frais il n’en ait rien pour le moment.
Et paradoxalement c’est justement peut-être parce ce qu’aujourd’hui « l’intelligence Artificielle » est d’un niveau extrêmement faible, et qu’elle ne peut toujours pas s’opposer aux décisions du médecin. Elle est toujours un appoint cognitif, un accélérateur pour les choix à faire et des décisions à prendre, ces dernières n’étant toujours que du ressort de l’équipe médicale restreinte entourant le Patient (Sauf en Mongolie !).
À vos remarques, réactions et informations concernant ce sujet.