Humanités algorithmiques : l’expérience du professeur Muhanna

Platon, Aristote, Socrate credits mararie (licence creative commons)

Le professeur Muhanna ne se doutait pas que son cours en littérature sur l’avant wikipedia allait attirer des matheux…

Par Farid Gueham.
Un article du site Trop Libre

Platon, Aristote, Socrate credits mararie (licence creative commons)
Platon, Aristote, Socrate credits mararie (licence creative commons)

Elias Muhanna est professeur de littérature comparée à la Brown University. Dans un article récemment publié par le New Yorker, il évoquait un séminaire qu’il avait animé au printemps dernier « Before Wikipedia ». Derrière ce titre accrocheur, le séminaire traitait de l’histoire de l’écriture encyclopédique, de l’Antiquité à nos jours. Dans le descriptif du séminaire, on pouvait lire « Comment les hommes organisaient-ils les connaissances avant Wikipedia ? Ce cours explore l’histoire fascinante de textes encyclopédiques, des archives et des bases de données dans différents contextes culturels. Nous aborderons la question de l’histoire du livre, de la classification de la connaissance, de l’obsession de collecter, compiler et documenter les savoirs connus ou fictifs dans les encyclopédies réelles et mythiques. L’utilisation de Wikipedia dans ce cours est non seulement tolérée, mais nécessaire. Les étudiants seront responsables de la création, la composition et de la vérification de nouvelles entrées de Wikipedia pendant le semestre en cours ». Au programme, des analyses d’extraits des « Étymologies » d’Isidore de Séville, de l’Encyclopédie de Diderot, mais aussi d’œuvres de Calvino, Sebald ou Flaubert.

En intitulant son cours « l’avant wikipedia », le professeur Muhanna ne se doutait pas que son cours allait attirer une toute nouvelle population : des profils scientifiques, dans un séminaire de littérature comparée ! Des physiciens, des mathématiciens, un groupe de codeurs, un ingénieur et un doctorant en neurosciences. Une première pour un professeur qui, même s’il était toujours attentif à l’ouverture transdisciplinaire, n’avait jamais vu une audience aussi variée. Comme pour la quasi-totalité de ses séminaires, Elias Muhanna s’attendait à une « mutinerie ». Ces habituels échanges mouvementés avec des étudiants aux esprits effervescents, mais là, rien. Juste le cliquetis des doigts sur les claviers d’ordinateurs portables « ces silences qui semblaient excessivement longs, j’ai appris à les laisser planer dans la salle de classe. À l’issue de la première semaine, j’étais angoissé par ce son étrange lorsque j’étais en train d’écrire sur le tableau noir. Le frôlement continu d’une vingtaine de mains sur vingt claviers d’ordinateurs, s’efforçant de retranscrire les mots griffonnés sur le tableau, résonnait comme l’écho d’un « fact-checking » la semaine suivante », affirme le professeur.

Un des premiers devoirs demandés portait sur les travaux de l’encyclopédiste Pline l’ancien. Son Histoire Naturelle est une mine d’informations intarissables sur le quotidien dans l’antiquité, avec des sujets aussi variés que l’histoire du papier, les auspices portés par le vol des oiseaux ou des abeilles, la fabrication de l’ocre… Le professeur Muhanna a demandé à ses étudiants d’analyser le style et l’écriture de Pline et de s’en inspirer pour écrire sur un sujet non traité dans l’ouvrage du maître. Une semaine plus tard, le professeur se retrouvait devant une pile de devoirs inspirés de la prose de Pline sur des sujets comme « les cafés-librairies », ou les attributs caractéristiques du « mec branché – du type Kanye West ». Résultat : un pastiche décalé et presque parfait de l’écriture de Pline sur des sujets contemporains.

Sciences dures et sciences humaines sont plus proches qu’il n’y semble ?

Au fil des corrections, un étudiant sort du lot. Henry, étudiant en double cursus sciences de l’informatique et mathématiques. Il a procédé différemment en ne faisant pas fait le choix d’imiter Pline. Henry s’est procuré sur internet les 37 tomes de son œuvre pour générer, à l’aide d’un algorithme informatique des phrases en anglais s’inspirant du style de Pline. Le robot encyclopédiste débite alors des phrases de poésie magnétique, des mots agglomérés, mais totalement incohérents. L’étudiant envisageait de perfectionner son programme d’analyse sémantique latente, procédé de traitement des langues naturelles, dans le cadre de la sémantique vectorielle, mais aussi les méthodes de Monte-Carlo par chaînes de Markov (méthodes MCMC) qui permettent un échantillonnage à partir de distributions de probabilité. Pour affiner la méthode, il fallait beaucoup plus de temps. Le texte d’Henry ne valait pas un clou, mais pour sa démarche et ses efforts, le professeur Muhanna décide de lui accorder un « A » pour l’évaluation du séminaire. « Mes compétences en programmation étaient certes rudimentaires et, sans les explications ludiques du code et de la programmation, j’aurais été complètement perdu. Toutefois, j’étais désormais sûr de deux choses : la première, c’est qu’une machine pilotée par un étudiant de premier cycle pouvait m’apprendre quelque chose de nouveau sur le style d’un ancien historien de la nature romaine. La seconde était que je devais recruter Henry pour des recherches plus approfondies » confesse Elias Muhanna. Les mois qui suivent, le professeur se lance dans l’apprentissage du codage qu’il met en pratique sur des textes de poésie en arabe classique. Et l’éclairage de la science s’avère particulièrement enrichissant : que peut-on apprendre, au travers du codage sur les tics de langage et de style d’un auteur classique ? Le code permet-il d’isoler des caractéristiques génériques qui font d’un texte un bon poème ? Quelles sont les caractéristiques, qui rendent un texte identifiable, comme le produit d’une personne, d’une époque, d’un lieu ? Henry a accepté de s’impliquer dans ce projet.  « Nous avons passé le reste du semestre à développer un algorithme capable de détecter différents types de figures de rhétorique dans un vaste corpus de la poésie. Il a survolé des milliers de lignes et de vers comme un drone sur des zones d’habitat ou sur de la faune, pour prendre des photos, pour les comparer, entre allusions et métathèses ». Mais comme l’algorithme de Pline, le programme n’a pas produit un texte grandiose. Pas simple de transposer l’architecture de la langue arabe, sa morphologie et les grands principes de la poésie classique. Un disque dur plus tard, jonché de fichiers bruts, de scripts, et de chat sur des forums réservés aux codeurs, la démarche était aussi épuisante qu’exaltante. Durant les 10 dernières années, le savoir numérique est sorti du coin obscur des sciences humaines, pour se généraliser. Les enjeux ne sont plus les mêmes. Le virage numérique pourrait donc dynamiser les sciences humaines, à travers une synthèse avec les sciences dites « dures ». Pour beaucoup, le caractère  « disparate » et bricolé des humanités numériques relève encore du gadget ou de la curiosité, une sorte abstraction humaniste.

Le projet de poésie algorithmique était certes modeste, mais cette expérience numérique ouvrait des pistes de réflexion pour l’avenir de l’enseignement de la littérature et des sciences humaines.

« Mes étudiants des cycles supérieurs auront-ils des tests de JavaScript et de QGIS parallèlement à leurs examens d’arabe classique ? Le petit ruisseau des humanités deviendra-t-il un torrent gorgé des financements publics et privés ? Mais derrière chaque vision ensoleillée se cache une ombre dystrophique ». Le silence à nouveau. Mais cette fois, le professeur Muhanna s’interroge sur l’avenir de l’enseignement des sciences humaines et c’est sûrement Henry, l’étudiant de premier cycle, qui lui donnera la réponse dans un futur proche. Dans ses recherches pour la revue «TIC et société », Hélène Bourdeloie nous explique que « les sciences humaines et sociales ont pendant longtemps été l’objet de débats s’agissant de leur nature scientifique, de la posture du chercheur (neutre, engagée, critique), de leur essence prétendue subjective ou encore du rôle des méthodes et outils mobilisés… ». Le nouveau contexte numérique bouleverse des enjeux et les débats. En déployant de nouvelles méthodes, les sciences humaines subissent de profondes transformations qui affectent, de fait, les conditions pratiques de recherche. S’il faut se réjouir des bienfaits du numérique pour les sciences humaines, un regard critique s’impose sur les caractéristiques des outils mobilisés et des valeurs que ces outils portent en eux. À l’image de Wikipedia, la maîtrise des nouveaux outils de veille et de bibliographie, d’organisation de manifestations scientifiques en ligne, de consultation et d’alimentation de bases de données, sont autant de défis pour nous tous. La familiarité avec le monde numérique et sa mise au service de l’activité scientifique s’avèrent réellement fécondes pour le chercheur qui les apprivoise. De même, il est urgent de comprendre le phénomène d’ouverture et de co-construction, de recherche et d’écriture, pour expérimenter le travail en réseau international élargit et enrichir ainsi l’activité scientifique, tout en apportant un éclairage nouveau sur les savoirs littéraires.

Sources

Sur le web