Le Big Data ou la médecine de Molière ?

Big data by Merrill College of Journalism(CC BY-NC 2.0)

OPINION : les déclarations à l’emporte-pièce de Didier Raoult alimentent une mécanique toxique dans laquelle la « science » ne s’effectue plus selon des principes de rationalité mais selon l’affirmation incantatoire autosuffisante.

Par Thierry Berthier.

 

 

« Le Big Data…, une fantaisie délirante ! »

Voici donc l’une des dernières affirmations tonitruantes prononcée – à 4 mn 20 – par le professeur Raoult dans cette vidéo postée le 25 mai 2020 sur YouTube.

Ce jugement sans appel pourrait faire sourire lors d’un apéritif festif bien arrosé entre amis data scientists réunis au fond d’un bar, mais son contexte est tout autre, situé au cœur d’une polémique clivante sur l’efficacité présumée du protocole proposé par Didier Raoult.

Conforme au personnage de savant proche du peuple, incompris des élites, qu’il s’est construit au fil des semaines, la critique du Big Data résonne comme une attaque plus générale sur les sciences dures, les statistiques, les mathématiques, qu’il oppose sans vergogne aux sciences de l’Homme, celles du vivant, du ressenti, du vrai.

C’est aussi un refus catégorique de toute modernité au profit d’un arbitrage radical pour la médecine du XVIIIe siècle, celle qui se pratique grâce aux cinq sens, sans outil, sans artifice, sans donnée. Le « c’était mieux avant » complète en filigrane la sentence de Didier Raoult.

Pourquoi cette déclaration est-elle toxique ?

Jeter le discrédit sur la science des données sans être un expert de la discipline et sans fournir le moindre argument rationnel étayant la critique relève de la désinformation la plus complète.

Didier Raoult s’est-il déjà intéressé aux réussites du Big Data ? Sait-il que ses collègues scientifiques chinois n’ont mis que 14 jours pour dresser la carte génétique du coronavirus grâce aux sciences des données, au Big Data ? Sait-il que la recherche de nouvelles molécules s’appuie sur les données massives et sur les statistiques ?

Les exemples sont nombreux, de progrès médicaux directement liés à l’usage de la science des données, de leur géométrie subtile et de l’apprentissage automatique.

Le professeur Raoult devrait faire preuve de plus d’humilité et observer, par exemple, le rôle déterminant des données massives dans le diagnostic précoce de la maladie d’Alzheimer. Les travaux du professeur Stéphanie Allassonnière1 ont permis de gagner deux précieuses années dans le diagnostic précoce de la maladie d’Alzheimer ! Ce travail remarquable s’appuie directement sur l’exploitation des données massives et sur la puissance des modèles statistiques mis en place.

La science des données associée au génie humain a démontré toute sa puissance dans la résolution de problèmes complexes en génétique, en biochimie, en imagerie médicale et dans toutes les disciplines scientifiques.

Les déclarations à l’emporte-pièce de Didier Raoult alimentent une mécanique extrêmement toxique dans laquelle la « science » ne s’effectue plus selon des principes de rationalité mais selon l’affirmation incantatoire autosuffisante.

Le public sensible au discours Raoult reste majoritairement éloigné des règles de bonne pratique scientifique et ne dispose d’aucun référentiel alternatif lui permettant d’arbitrer. L’argumentaire du « complot mondial construit contre le professeur Raoult » verrouille strictement le débat et le réduit au champ polémique. Plus aucun argument rationnel n’est audible par la communauté pro-Raoult qui s’enferme dans une forme de victimisation suggérée par le guide qu’il faut suivre.

Le premier danger est celui d’une décrédibilisation de la communauté scientifique et de la pratique scientifique comme cela a eu lieu pour le personnel politique. Les puissants courants populistes associés aux courants complotistes sapent le consensus de rationalité et installent le sentiment du « tous pourris » dans les esprits en quête d’arguments manichéens.

Dans cette dynamique, chacun devient expert en quelques clics dans le domaine de son choix et se forge une croyance résistante à l’argument scientifique. Le risque d’une radicalisation d’une partie de la société contre les sciences et les technologies devient alors réel avec toutes les dérives collatérales imaginables. Le contexte de crise sanitaire, d’incertitude et de peur de la mort renforce cette dynamique de glissement vers l’irrationnel.

Le second danger est celui d’un retard possible de la France dans la course technologique mondiale qui oppose la Chine aux États-Unis. Un fort courant anti-scientifique et irrationnel traversant une partie de la population française aurait un effet catastrophique sur notre positionnement dans la course mondiale à l’innovation. D’ores et déjà, les propos de Didier Raoult sur le Big Data discréditent et éclaboussent l’ensemble de la communauté scientifique française.

Quelles sont alors les pistes pour casser cette mécanique du rejet de la technologie ?

Redonner le goût des sciences et de la preuve

Quand la dérive vers une « pseudo science populiste » est constatée, il devient urgent de mettre en place des outils cognitifs qui permettent de la contrer. La communauté scientifique dans son ensemble doit être intransigeante face à ses membres lorsque ceux-ci traversent la ligne rouge et sortent du champ de la rationalité.

Le système éducatif doit fournir des jalons efficaces renforçant le libre arbitre des plus jeunes face aux contre-discours irrationnels. Les enseignants doivent redonner le goût des sciences à leurs élèves et plus particulièrement celui de la démonstration scientifique.

Les médias ont un rôle à jouer dans la classification et la validation de l’information qui devrait être systématiquement présentée avec une probabilité de véracité. Le Big Data peut à ce titre fournir des solutions efficaces permettant de qualifier ou de réfuter une information.

La classe politique doit éviter de prendre part aux polémiques scientifiques lorsqu’elle ne maîtrise pas la discipline questionnée. Enfin, chacun doit faire preuve d’une grande humilité face à la complexité ambiante.

Article initialement publié sur European Scientist

  1. Gaussian Graphical Model exploration and selection in high dimension low sample size setting. T. Lartigue, S. Bottani, S. Baron, O. Colliot, S. Durrleman, S. Allassonnière for the Alzheimer’s Disease Neuroimaging Initiative. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020.
Vous souhaitez nous signaler une erreur ? Contactez la rédaction.