Analyse de prise de sang par intelligence artificielle : ce que les applis vous promettent et ce que la science dit vraiment
Vous recevez votre bilan sanguin par mail avant même d’avoir parlé à votre médecin. Les chiffres sont là, les abréviations aussi, et personne pour vous expliquer ce que ça signifie. Alors vous faites ce que des millions de personnes font désormais. Vous copiez-collez tout dans ChatGPT, Claude ou Gemini, et vous attendez une réponse.
Ce réflexe est devenu si courant que des entreprises entières ont construit leur modèle économique dessus. Mais entre la promesse commerciale et la réalité scientifique, il y a un fossé que personne ne parle assez franchement.
L’IA pour analyser une prise de sang, une promesse qui séduit
Des marques comme Whoop et Levels ont flairé le filon. Leur pitch est séduisant. Vous uploadez vos résultats d’analyses sanguines, une IA les décortique, vous reçoit un rapport personnalisé en langage clair avec des recommandations concrètes, des ajustements alimentaires, des changements de mode de vie, et des questions pertinentes à poser à votre médecin.
Le tout disponible via abonnement, pour quelques centaines d’euros par an. Whoop propose par exemple un test annuel à environ 184 euros, ou six tests par an pour environ 832 euros. Les abonnements Levels avec analyses biologiques et suivi IA démarrent à environ 462 euros par an.
L’argument central, c’est de combler le vide entre le moment où on reçoit ses résultats et celui où un professionnel de santé prend vraiment le temps de les expliquer. Et ce vide existe bel et bien.
Le Dr John Whyte, PDG de l’American Medical Association, comprend l’attrait de ces services. “Les médecins ne sont pas toujours les meilleurs communicants. Je voudrais qu’ils le soient, et qu’ils aient plus de temps.” Mais il s’empresse d’ajouter quelque chose d’important. Il n’existe aucune recherche rigoureuse ni aucune preuve démontrant que l’IA peut interpréter efficacement et avec précision des résultats sanguins et formuler des recommandations personnalisées pour améliorer la santé.
Les modèles IA ne sont pas conçus pour ça
C’est le point que beaucoup d’utilisateurs ignorent. Les grands modèles de langage comme Gemini ou ChatGPT, ceux qu’utilisent ces entreprises en coulisses, ne sont pas validés ni calibrés spécifiquement pour l’interprétation de bilans biologiques. Google et OpenAI le reconnaissent eux-mêmes.
Quand Google s’est associé à Quest Diagnostics pour proposer un outil d’IA aux patients du laboratoire américain, la mission était clairement délimitée. Expliquer la terminologie médicale, identifier des tendances dans les données personnelles, suggérer des questions à poser au médecin. Pas de conseil médical. Pas de recommandations de style de vie.
Et pour cause. La société BloodGPT, spécialisée dans l’interprétation IA des analyses sanguines, a découvert lors de ses propres tests en 2024 que soumettre directement un bilan complet à des chatbots généralistes produisait des erreurs régulières. Des biomarqueurs entiers étaient ignorés ou confondus avec d’autres. Des recommandations étaient tout simplement inventées.
“Nous ne choisissons pas la voie facile”, reconnaît Jonathan Kron, cofondateur et PDG de BloodGPT. La société a construit un pipeline structuré avec plusieurs niveaux de validation, en combinant plusieurs modèles d’IA pour différentes tâches, classification, raisonnement, interprétation, vérification de cohérence, et en consultant des spécialistes sur des biomarqueurs précis comme les hormones reproductrices. Leurs abonnements individuels vont de 9 à 17 euros par mois.
Reste que BloodGPT n’a pas encore publié de recherche avec comité de lecture prouvant l’efficacité de sa méthode. Une étude sur 100 000 dossiers patients anonymisés en partenariat avec un système de santé israélien est prévue pour y remédier.
La question clé que ces entreprises ne peuvent pas encore répondre
Le Dr Girish Nadkarni, interniste et néphrologue au Mt. Sinai Hospital de New York et directeur d’un institut de recherche en santé numérique, met le doigt sur le vrai problème. Ces entreprises doivent démontrer leur efficacité en comparant leurs résultats rétrospectivement à des données patients anonymisées, et en conduisant des études prospectives face à l’avis d’experts. Aucune ne l’a encore fait sérieusement.
“Je ne pense pas que quoi que ce soit doive avoir une précision de 100% pour réussir, parce que les humains ne sont pas précis à 100%”, dit-il. “Mais la conversation devient vraiment difficile parce que je ne sais pas quelle est la précision de ce modèle… comment il fonctionne, et où il échoue.”
Ces outils pourraient fonctionner correctement pour la majorité des cas courants, mais c’est aux extrêmes que les risques apparaissent. Diagnostics manqués. Faux positifs générateurs d’anxiété. Examens supplémentaires inutiles voire dangereux.
La personnalisation promise est-elle réelle ?
Whoop joue la carte de l’intégration des données physiologiques. Fréquence cardiaque, qualité du sommeil, activité physique, tout est croisé avec les résultats biologiques pour créer des insights supposément uniques. L’exemple donné est parlant. Si un client a couru un marathon la veille de sa prise de sang, l’IA pourrait en tenir compte pour interpréter ses marqueurs d’inflammation.
C’est séduisant. Mais Whyte n’est pas convaincu. “Je pense qu’on doit vraiment questionner ce que sont ces données. Il faudrait un dataset massif pour formuler des recommandations individuelles. Si ces entreprises possèdent cette information, elles n’ont pas encore publié de recherche avec comité de lecture basée dessus.”
Alexi Coffey, vice-présidente produit chez Whoop, choisit ses mots avec soin. “Nous ne voulons jamais surestimer ou trop suggérer des liens entre les choses, mais nous voulons apporter de la valeur à nos membres en les aidant à comprendre ce qui pourrait être connecté.”
Ce que l’IA peut faire, et ce qu’elle ne doit pas faire
Il y a aussi le phénomène plus large des réseaux sociaux qui ont transformé la prise de sang en solution miracle. Énergie au sol ? Analyses. Problèmes de sommeil ? Analyses. Selon Whyte, certaines entreprises mesurent des éléments et des minéraux “qui ne sont pas vraiment utiles pour quoi que ce soit.” Le bilan hormonal peut être tout aussi peu concluant selon la façon dont il est réalisé.
Un autre risque, souvent ignoré, est ce que Nadkarni appelle le biais d’automatisation. Même quand un médecin humain supervise les rapports IA, il peut inconsciemment valider les conclusions de la machine sans les questionner suffisamment.
La recommandation du Dr Whyte est finalement assez simple. Utilisez l’IA pour comprendre vos résultats en langage accessible. Pas pour en tirer des conclusions personnalisées sur votre santé.
“Les gens pensent qu’un test de laboratoire est noir ou blanc et que c’est la règle finale pour savoir si on a une maladie ou non. Et ce n’est pas toujours vrai.”
L’IA peut vous aider à déchiffrer votre bilan sanguin. Mais elle ne remplace pas encore le jugement médical. Et les entreprises qui prétendent le contraire ont encore beaucoup de preuves à apporter.
Les informations contenues dans cet article sont fournies à titre éducatif et informatif uniquement et ne constituent pas un avis médical. Consultez toujours un médecin ou un professionnel de santé qualifié pour toute question relative à votre état de santé.
