Big data : l’enjeu majeur de l’enseignement au XXIᵉ siècle

Publié Par The Conversation, le dans Technologies

Par Sébastien Corniglion.
Un article de The Conversation

Miser sur les mathématiques et la physique : c’est la recommandation de trois grands experts pour prendre le train en marche du big data (voir notre précédent article sur le sujet). Une formation d’autant plus essentielle que les profils nécessaires en la matière continuent de faire cruellement défaut en France.

Un consensus autour des enjeux du big data

Les experts s’accordent désormais tous sur le sujet : le big data est l’enjeu majeur de l’enseignement au XXIe siècle. C’est en tout cas le point de vue de John Hennessy, le président de l’université Stanford en Californie (qu’il quittera en septembre après seize ans au poste) : pour lui, comme pour d’autres, le big data devient un outil central d’aide à la décision dans une multitude de domaines.

Et il contribue à aider les entreprises à relever le défi d’une innovation permanente. Rappelons toutefois que le big data (mégadonnées) est le phénomène observé de l’accroissement exponentiel des données acquises et stockées par les organisations, et la data science (science des données) est l’ensemble des modèles, méthodes, techniques et outils permettant d’exploiter ces (méga)données.

Le son de cloche est le même pour le Français Yann LeCun, directeur de FAIR (Facebook Artificial Intelligence Research), le laboratoire de recherche en intelligence artificielle du géant de l’Internet : le champ du big data est en pleine expansion. Si les entreprises font montre d’un besoin exponentiel en savoirs et en compétences en la matière, les postes sont nombreux à rester vacants, faute de candidats.

Une pénurie également déplorée par Cédric Villani, Médaille de Fields et Directeur de l’Institut Henri Poincaré, qu’il explique par l’importance jouée par les mathématiques dans la discipline du big data. En effet, ces données volumineuses doivent être gérées avec soin, selon des méthodes abstraites et organisées ainsi que la création de modèles qui relèvent du champ des mathématiques.

L’apport de ces dernières, aussi abstraites soient-elles, est impératif à l’évolution de la société : elles finissent toujours par trouver une application industrielle intéressante. Seulement, force est de constater que la France présente un retard significatif dans la formation de profils adaptés. S’il est convaincu que ce retard va bientôt se résorber, comment cependant développer l’attirance des jeunes pour le domaine de la data science ?

La nécessité d’une formation renforcée en mathématiques et physique appliquées

Si la France brille toujours de son école de mathématiques, elle peut parfois rester un peu trop centrée sur leurs parties théoriques. Il est nécessaire d’inciter et de récompenser nos brillants enseignants-chercheurs vers des réflexions aux applications à l’industrie. Et le big data et la data science ont justement besoin de l’apport de la formation à la française pour avancer.

Dans un contexte où les technologies évoluent à une vitesse fulgurante, il est primordial de se former à des savoirs pérennes comme les mathématiques et la physique appliquées, plutôt que de chercher des spécialisations éphémères sur le langage de programmation à la mode du moment. Rappelons que connaître la syntaxe d’un langage n’est en rien synonyme de savoir concevoir un algorithme. Le marché de l’emploi sur ces métiers est en forte croissance et en tension : il faut que notre système d’enseignement produise des compétences autant de haut niveau qu’orientées vers l’industrie.

Cette orientation est d’autant plus nécessaire que le big data devient un enjeu transverse impactant de nombreux secteurs de l’économie : grande distribution, e-commerce, services publics, industrie high-tech, secteurs bancaire et financier ou encore secteur biomédical avec l’avènement de la médecine individualisée. Mais aussi le domaine de l’intelligence artificielle, dont l’expansion n’est pas près de s’arrêter.

Or, comme le souligne Cédric Villani, « plus il y aura d’intelligence artificielle, plus il y aura de mathématiciens ».

L’invitation adressée aux étudiants comme aux professionnels avides de se spécialiser est donc désormais claire : pour rejoindre les rangs des plus grands et notamment des GAFA (Google, Apple, Facebook, Amazon) et contribuer à faire avancer la recherche et ses applications industrielles, travaillez vos mathématiques et votre physique appliquées !

Une autre vision de l’imbrication entre théorie et pratique

Cet appel à la formation est séduisant sur le papier. Dans les faits cependant, il souligne les vieilles habitudes de silotage de l’enseignement français, malgré sa culture cartésienne qui donne à notre pays un véritable avantage concurrentiel. Permettre le développement de connaissances numériques, quantitatives et scientifiques est indispensable, mais il doit s’accompagner de l’apport de la recherche en sciences humaines et sociales sur les cinquante dernières années.

Et notamment de la psychologie cognitive, grande oubliée des bancs des écoles alors qu’elle contient des apports majeurs à la compréhension du fonctionnement du cerveau et de la transformation des informations en connaissances, primordiaux dans le champ de l’intelligence artificielle. Et comment pourrait-on oublier le droit et l’éthique, dont la complexité parfois égale aux plus difficiles des algorithmes, est au cœur des projets data science et big data ?

Bien sûr et tant mieux, l’écosystème français se met en place et en marche pour répondre à cette demande. Et là où il se distingue clairement vis-à-vis de ses concurrents anglo-saxons, c’est en matière d’approche de la formation. Aux USA, les formations de niveau master sont en temps plein, sans stage, sans alternance et finalement, point de salut en dehors du doctorat : la France, elle, a su avec l’alternance, les contrats de professionnalisation, les stages financés par les entreprises ou encore des politiques comme le Crédit d’impôt innovation et le Crédit impôt recherche (CII/CIR) ancrer la formation dans le domaine de la recherche appliquée, en vue de générer des outils industriels pérennes et des profils opérationnels rapidement.

Soyons fiers : le système inventé par la France lui donne donc un avantage concurrentiel très sérieux par rapport aux autres pays développés. Dans le domaine du big data et de la data science, l’absence d’exposition vers l’entreprise des étudiants formés ailleurs dans le monde va immanquablement leur poser un très sérieux problème dans les années à venir. En développant la formation en mathématiques et en physique appliquées des futurs Data Scientists, aucun doute n’est permis : la France bénéficiera d’un statut privilégié dans un domaine que François Bourdoncle, ingénieur émérite et fondateur d’Exalead, appelle « avant tout une révolution industrielle ».

Sur le web

  1. Je ne comprends pas très bien en quoi la physique ou la physique appliquée est nécessaire au « big data ». Sauf peut-être à éviter d’illustrer le cerveau humain avec 3 engrenages en triangle …

    1. Parce que la physique a l’habitude de développer des modèles mathématiques adaptés à des situations particulières. Alors que (pour caricaturer) le mathématicien va développer une technique abstraite et chercher à prouver qu’elle fonctionne, le physicien va savoir bidouiller, triturer son modèle et s’arranger pour qu’il fonctionne en pratique. Sans compter que certains concepts physiques (ceux d’énergie, d’entropie ou plus généralement tout ce qui touche à la physique statistique) peuvent plus ou moins se transposer dans des modèles de big data et apporter une meilleure compréhension.

      En un mot, parce que la physique est un peu la science par excellence quand il s’agit de pondre le modèle mathématique d’un phénomène.

  2. Soyons fiers, la France est le pays du meilleur potentiel et des meilleures perspectives, et le restera longtemps.

    1. Essayez de ne pas oublier l’Inde !

  3.  » En effet, les capacités intellectuelles humaines sont insuffisantes pour intégrer l’ensemble des données délivrées quotidiennement.  » Faux ! Sauf les cerveaux manipulés pour n’avoir que des capacités d’analyse et pas de synthèse. Et l’informatique, à ce jour, ne peux encore qu’effectuer des tris ; les rares synthèses du « Big Data » sont évacuées. Quand à Villani qui est trop vieux pour faire des avancées en maths, il prêche partout pour sa paroisse sans se rendre compte (du moins je l’espère) que les maths sont l’antichambre d’un Big Brother, tant elles bornent les cerveaux.

    1. Pardon ! Pour être bien compris de Villani j’aurais dû utiliser « La Mathématique » !

  4. Le 21e siècle est le siècle de la donnée, de la « data ». Ces informations numériques qui circulent toujours plus vite grâce à des algorithmes de plus en plus puissants qui les exploitent, les interprètent. Ces équations donnent du sens à une masse de données peu lisible à l’état brut. Retrouvez l’analyse de Farid Gueham « Le Big Data, pétrole du 21e siècle » sur le blog Trop Libre (http://www.trop-libre.fr/le-big-data-p%C3%A9trole-du-21e-si%C3%A8cle/)

    1. « Le pétrole du 21e siècle » ?!?

      C’est quoi le pouvoir énergétique d’un kilo de « data » ?

      Que l’analyse des données soit devenue incontournable pour les entreprises commerciales est une chose. Dans ce sens cela optimise les processus de marché et la logistique. Les entreprises qui n’ont pas ces moyens (et en particulier les petites) sont les grandes perdantes. Pour ce qui est du « service et la fonctionnalité » pour les utilisateurs – grand pipeau servant à justifier la collecte des données – cela est plus douteux. Par exemple, l’article s’extasie sur une application qui permettrait à un heureux utilisateur de trouver la DERNIERE place assise dans un train : et ceux qui n’ont pas l’appli restent debout ? de la à en conclure bêtement que la SNCF devient aussi confortable que le voiture ? Beau tissus d’âneries et de bienpensance …

      Le problème de l’analyse de données, des systèmes experts, de la reconnaissance vocale c’est qu’ils sont aujourd’hui prétexte à mettre en place le Big Browser, sans envisager et au contraire en verrouillant bien le machin pour qu’il ne puisse fournir des solutions individuelles. Je VEUX un système de commande vocale chez moi, mais pas des micros espions qui me rendent un pseudo service en retour. Cela demande le développement de systèmes électroniques (micophones array) de logiciels IA et de passerelles domotiques PERSONNELLES. La techno a toutes les chances de devenir disponible à terme pour le particulier, mais avec un fort décalage et la nécessité de laisser se développer le Big Brother. C’est un peu cher à payer …

      1. Deux choses :
        – sans application mobile, la DERNIÈRE place dans le train que vous citez reste aujourd’hui inoccupé. Que seuls ceux qui ont un smartphone et la bonne appli qui exploite en temps réel puisse l’acheter et s’y installer, c’est un progrès.
        – les box domotique sa commande vocale, personnelles, adaptables, personnalisa les et évolutives à souhait sans être connecté à 8nternet existent déjà. S.A.R.A.H. est par exemple une brique bien populaire en ce sens.
        On ne peut pas attendr de l’industrie qu’elle fournisse des biens et des services très évolués et en même temps réclamer l’autonomie technologique complète.
        Big Brother est un système d’humains, pas de machines. En ce sens ou l’usage qui serait fait de tous ces systèmes n’est nuisible à l’homme que si ces systèmes sont mal fichus. Une IA planétaire, comme on en voit dans certains films de SF, est par essence neutre ou bienveillante. Le film Transcendance l’illustre plutôt bien, je trouve…

  5. Le « Big Data », vocable exotique plus excitant que l’Analyse des Données qu’on appelait autrefois plus modestement l’Esprit Critique résulte d’une formation exigeante à fort contenu combinatoire qu’on trouve en effet dans les mathématiques et la physique mais aussi le latin et le grec (dont Villani est aussi un grand défenseur).
    Je ne vois rien dans l’évolution de l’instruction publique qui prédispose la génération française montante à égaler les générations précédentes dans ce domaine.

Les commentaires sont fermés.