data science santé

Data Science et santé : comment la science des données transforme la médecine

Bastien L

Bastien L

8 min

Grâce à l’abondance de données à disposition, la Data Science bouleverse le secteur de la santé. Découvrez de quelles façons l’analyse de données et l’IA transforment le milieu médical, et comment devenir un ” Healthcare Data Scientist ” ou scientifique des données de santé…

Le secteur de la santé génère d’immenses quantités de données. Selon une étude menée par le Ponemon Institute, ce domaine représente à lui seul 30% des données mondiales.

Les enregistrements médicaux, les essais cliniques, les informations génétiques, les factures, les objets connectés, les bases de données, les articles scientifiques ne sont que quelques-unes des nombreuses sources de données à disposition du milieu médical.

Avec l’essor des télé-consultations et des recherches internet liées à la santé, le volume de données explose littéralement. Pour les professionnels du secteur, les données de patients sont désormais centralisées et plus accessibles que jamais auparavant.

On parle désormais de ” santé quantifiée ” pour désigner l’intégration des données en provenance d’objets connectés comme les bracelets connectés, et des accessoires tels que les glucomètres et les balances dans les enregistrements médicaux par le biais des smartphones.

C’est ce que proposent des plateformes comme Apple HealthKit et Google Fit. Grâce à ces ressources, il est désormais possible de détecter rapidement les signaux alarmants et de suivre attentivement les changements de comportements et d’indicateurs vitaux.

Toutes ces données peuvent être exploitées par les professionnels de la santé, et ouvrent une multitude de possibilités. Découvrez comment la Data Science bouleverse le domaine médical.

La découverte de médicaments

En moyenne, il faut compter 2,6 milliards de dollars et 12 années pour créer un médicament et le mettre sur le marché. Or, la Data Science permet de réduire drastiquement le coût et le délai.

Grâce aux données, les scientifiques peuvent désormais simuler la réaction d’un médicament avec les protéines de l’organisme et différents types de cellules. Selon Mark Ramsey, Chief Data Officer du géant pharmaceutique GSK, le processus pourrait être réduit à moins de deux ans grâce à cette méthode de simulation.

Plusieurs startups explorent également cette piste. Par exemple, BenevolentAI, basée à Londres, a levé 115 millions de dollars pour lancer plus de 20 programmes de création de médicaments et développer un cerveau artificiel capable de créer de nouveaux médicaments et de nouveaux traitements.

La prévention des maladies

Mieux vaut prévenir que guérir, dit le proverbe. Grâce aux objets connectés et autres appareils de tracking, prenant en compte l’historique et les informations génétiques du patient, il est possible de détecter un problème avant qu’il devienne incontrôlable.

L’entreprise Omada Health utilise par exemple des accessoires connectés pour créer des plans de comportement personnalisés et un coaching en ligne pour aider à prévenir les maladies chroniques comme le diabète, l’hypertension et le cholestérol.

De son côté, Propeller Health a créé un tracker d’usage d’inhalateur exploitant le GPS pour coupler les données des individus à risque avec les données environnementales du CDC américain. L’objectif est de proposer des interventions pour les asthmatiques.

La startup canadienne Awake Labs, quant à elle, collecte les données d’enfants autistes par le biais d’accessoires connectés. Les parents peuvent ainsi être alertés en cas de risque de crise.

L’intelligence artificielle a permis plusieurs fois de détecter les maladies de manière précoce. Les chercheurs de l’Université de Campinas, au Brésil, ont développé une plateforme IA permettant de diagnostiquer le virus Zika en utilisant des marqueurs métaboliques.

Le diagnostic des maladies

À l’heure actuelle, les diagnostics des médecins sont malheureusement encore souvent erronés. Selon la National Academies of Sciences, Engineering and Medicine, environ 12 millions d’Américains reçoivent de mauvais diagnostics.

Les conséquences peuvent parfois être fatales. Selon une enquête de la BBC, les erreurs de diagnostic causent entre 40 000 et 80 000 décès par an.

Or, la Data Science permet d’améliorer fortement la précision des diagnostics. C’est particulièrement le cas pour l’analyse d’imagerie médicale.

Les ordinateurs peuvent apprendre à interpréter les IRM, rayons X, mammographies et autres types de radios. La machine apprend à identifier les patterns dans ces données visuelles, et saura ensuite détecter les tumeurs, la sténose artérielle et autres anomalies avec une précision surpassant souvent celle des experts humains.

Sans même aller jusqu’à l’analyse automatisée de l’imagerie médicale, la Data Science permet d’augmenter la taille d’une image ou d’améliorer sa définition. L’interprétation sera facilitée pour les experts humains.

En outre, les chercheurs de la Stanford University ont développé des modèles Data Driven pour la détection d’irrégularités du rythme cardiaque à partir d’électrocardiogrammes plus rapidement qu’un cardiologue. D’autres modèles sont capables de distinguer les marques bénignes sur la peau des lésions malignes.

L’entreprise Iquity, qui développe une plateforme d’analyse prédictive pour le secteur de la santé a réalisé une étude en analysant quatre millions de points de données sur 20 millions de New-Yorkais.

En combinant les données de patients ayant reçu un diagnostic – erroné ou non – de scléroses multiples, Iquity est parvenu à prédire avec une précision de 90% l’apparition d’une maladie huit mois avant qu’elle puisse être détectée avec des outils traditionnels.

De leur côté, les chercheurs de Microsoft ont analysé les données de recherches web de 6,4 millions d’utilisateurs de Bing dont les résultats de recherche suggéraient qu’ils avaient un cancer du pancréas.

Ils ont ensuite passé en revue les mots-clés de leurs précédentes recherches, tels que la perte de poids ou les caillots de sang. Il est donc possible d’exploiter les moteurs de recherche pour anticiper le diagnostic d’un cancer du pancréas.

La personnalisation des traitements

Grâce à la Data Science, il est aussi possible de proposer des traitements mieux ciblés et personnalisés. Il est possible de tenir compte des différences subtiles entre chacun d’entre nous pour une meilleure efficacité des soins délivrés.

Par exemple, le projet 1000 Genome du National Institute of Health est une étude ouverte des régions du génome associées à des maladies courantes comme le diabète ou la maladie coronarienne. Cette étude permet aux scientifiques de mieux comprendre la complexité des gènes humains et de quelle manière un traitement spécifique sera mieux adapté à un individu.

De leur côté, l’Emory University et l’Alfac Cancer Treatment ont noué un partenariat avec NextBio pour étudier la tumeur cérébrale maligne de type médulloblastome. Alors que la thérapie par radiation était jadis le seul traitement pour ce cancer, l’analyse de données génétiques et cliniques d’un patient permet désormais de découvrir des biomarqueurs spécifiques pour proposer un traitement personnalisé.

L’outil MapReduce permet de lire les séquences génétiques et de réduire le temps nécessaire pour le traitement des données. Le langage SQL permet de restaurer les données génomiques, de manipuler les fichiers ” BAM ” et de traiter les données.

Le suivi des patients après retour à domicile

Chaque opération ou traitement peut entraîner des effets secondaires, des complications ou des douleurs récurrentes. Il peut être difficile de suivre et de surveiller ces phénomènes après qu’un patient ait quitté l’hôpital.

La Data Science permet aux médecins de continuer à suivre les patients à distance en temps réel après leur retour à domicile. Par exemple, le logiciel Cloudera permet de prédire les chances de réadmission d’un patient sous 30 jours en se basant sur ses données médicales et sur le statut socioéconomique de la région où se trouve l’hôpital.

De son côté, SeamlessMD développe une plateforme pour les soins post-opération. Cette plateforme a permis au Healthcare System Saint Peter dans le New Jersey de réduire la durée moyenne de séjour post-opération d’un jour.

Ceci représente une économie de 1500 dollars pour chaque patient, qui n’a qu’à indiquer chaque jour son niveau de douleur dans l’application et laisser les soignants surveiller l’évolution au fil du temps. En cas de problème potentiel, l’application émet aussi des alertes.

Les applications mobiles exploitant l’IA peuvent également venir en aide aux patients. Des chatbots, ou assistants vocaux virtuels, peuvent communiquer avec ces derniers. Le patient peut décrire ses symptômes ou poser des questions, et recevoir des informations précieuses tirées d’un vaste réseau liant les symptômes aux maladies.

Ces applications peuvent aussi rappeler au patient de prendre ses médicaments à l’heure, et organiser un rendez-vous avec un médecin si nécessaire. Parmi les plus populaires, on compte le chatbot Woebot développé par la Stanford University pour venir en aide aux patients dépressifs, ou l’assistant virtuel de la startup berlinoise Ada qui prédit les maladies à partir des symptômes.

La gestion des hôpitaux

Les hôpitaux sont des établissements dont la gestion est complexe et difficile. L’analyse de données permet de déterminer avec précision combien de soignants doivent être sur le pont à chaque heure de la journée pour maximiser l’efficacité.

Elle permet aussi de s’assurer que suffisamment de lits soient disponibles pour répondre à la demande, et bien plus encore. L’analyse prédictive permet aussi d’optimiser les plannings, et de fluidifier les services d’urgence.

A l’Emory University Hospital, la Data Science est utilisée pour prédire la demande en tests de laboratoires. Ceci permet de réduire le temps d’attente à hauteur de 75%.

Il est aussi possible d’exploiter la Business Intelligence pour améliorer le système de facturation et identifier les patients risquant de rencontrer des difficultés pour payer. Ces analyses peuvent être coordonnées avec les assurances et départements financiers. Ainsi, le Center for Medicare and Medicaid Services a économisé 210,7 millions de dollars grâce à la prévention de fraude basée sur le Big Data.

Le futur de la Data Science dans le domaine médical

L’industrie de la santé est en pleine transformation grâce à la science des données. Les géants pharmaceutiques, les startups de la biotech, les centres de recherches, les investisseurs et les établissements de santé investissent massivement dans cette révolution.

Il reste encore de nombreux défis à relever. Par exemple, les données sont souvent dispersées entre plusieurs régions, unités administratives et hôpitaux. Il est donc difficile de les regrouper dans un système unique.

En outre, de nombreux patients sont inquiets quant à la protection et à la confidentialité de leurs données personnelles. Certaines entreprises privées sont intéressées à l’idée d’exploiter ces précieuses données à des fins de ciblage publicitaire. Google a notamment fait l’objet de poursuites judiciaires pour de telles pratiques.

Enfin, certains s’inquiètent de la disparition de la relation entre les médecins et les patients au profit d’interactions avec des machines et des algorithmes. Il est vrai que le contact humain est essentiel dans le domaine de la santé.

Quoi qu’il en soit, malgré ces défis à surmonter, la Data Science offre de nombreuses promesses pour le futur de la médecine. À mesure que la technologie se développera, de nouvelles possibilités feront leur apparition…

Comment devenir Healthcare Data Scientist

Le domaine médical se présente donc comme un terrain idéal pour la Data Science. On parle désormais de ” Health Data Science “ ou science des données de santé pour désigner la génération de solutions ” data-driven ” aux problèmes du monde de la santé. Il s’agit d’une discipline émergente, à la croisée des statistiques, de l’informatique et de la médecine.

Les ” Health Data Scientists ” ou scientifiques des données de santé sont de plus en plus recherchés dans le secteur de la santé dans tous les pays, aussi bien dans le public que dans le privé. Pourtant, seuls 3% des Data Scientists américains travaillent actuellement dans le milieu médical.

Un Healthcare Data Scientist a pour rôle de concevoir des études et des évaluations, d’effectuer des analyses de données complexes, ou encore de conseiller les établissements de santé et les soignants à partir des résultats de ses analyses.

Il devra se baser sur les données pour prédire les effets des médicaments, comprendre les maladies affectant les humains. Son rôle est également de déployer le pouvoir de l’intelligence artificielle, et d’enrichir les ensembles de données de santé publics.

Ce professionnel peut travailler pour les départements de santé des gouvernements, pour les hôpitaux, pour les universités et instituts de recherche, pour les entreprises pharmaceutiques, pour les assurances santé ou pour des entreprises privées.

Devenir Healthcare Data Scientist requiert les mêmes compétences qu’un Data Scientist classique. Toutefois, ces compétences doivent être couplées avec une solide connaissance du domaine de la santé.

Un Healthcare Data Scientist doit disposer de compétences en mathématiques, en analyse quantitative et en statistiques. Il doit aussi être capable de communiquer avec les différents acteurs du milieu médical. Bien évidemment, il est important qu’il comprenne lui-même les notions proposées à ce secteur grâce à des connaissances en médecine, en épidémiologie ou en virologie.

Certaines entreprises proposent des programmes spécialisés. Par exemple, Harvard University a mis au point un Master en Health Data Science. Ce programme de 18 mois permet d’apprendre plus spécifiquement l’analyse et l’exploitation des données de santé pour relever les plus grands défis de ce domaine.

Une alternative consiste à coupler une formation de Data Scientist généraliste avec une formation liée au secteur de la santé. Vous pouvez tout à fait commencer par suivre la formation proposée par DataScientest, afin d’acquérir un diplôme certifié par l’Université de la Sorbonne. Cette option est aussi très pertinente si vous êtes déjà médecin et souhaitez acquérir des compétences de Data Scientist…

Vous savez désormais de quelle façon la Data Science transforme le secteur de la santé. Découvrez à présent comment l’IA aide à combattre la pandémie de COVID-19, et comment la Data Science s’invite dans le milieu de l’art et de la culture

Actualité data

DataScientist : Recrutement VS Formation

Pour la 5ème année consécutive, le métier de Data Scientist a été désigné comme le meilleur emploi aux USA par Glassdoor c’est aussi le métier qui connaît la croissance la plus rapide.

Lire plus »
Intelligence Artificielle et Société

Ethique ou Big Data

Comment faire prévaloir une question d’éthique en matière de données alors que la concurrence se veut mondiale ? Les européens doivent-ils se soumettre à une concurrence américaine et asiatique déloyale pour une question d’éthique ?

Lire plus »