Terra Data : qu’allons-nous faire des données numériques ?

Avec internet et la multiplication du nombre d’objets connectés, les volumes de données ne cessent de croître.

Par Farid Gueham.
Un article de Trop Libre

« Depuis des milliers d’années, nous collectons de l’information et utilisons des algorithmes. Mais récemment, la récolte a littéralement explosé : les technologies numériques nous permettent de créer, stocker, transformer et transmettre des données dans des quantités et à une vitesse de plus en plus considérables. Ordinateurs, téléphones, objets connectés, réseaux sociaux… Chacun de nous contribue activement, consciemment ou non, à bâtir un nouveau continent, la Terra Data, la « terre des données ». Entre promesses et menaces, quelle société se dessine derrière cette avalanche d’information ? ».

Valérie Peugeot et Serge Abiteboul nous proposent un voyage au cœur des données numériques, celles qui nous aident et facilitent dans notre vie quotidienne.

Ces mêmes données qui nous plongent également dans une vulnérabilité, dans le harcèlement publicitaire, dans notre formatage commercial. « C’est une évidence, ces données qui s’accumulent chaque jour plus encore ne sont ni angéliques, ni diaboliques ».

Bien avant le numérique, la donnée était partout

« Certains indices semblent indiquer que nos ancêtres du néolithique utilisaient déjà des représentations de données. Mais c’est avec l’invention de l’écriture, en Mésopotamie, à la fin du IVème millénaire avant J.-C., que les premières traces irréfutables existent ». 

En Mésopotamie déjà, la comptabilité était l’une des premières fonctions de l’écriture. Les premières tablettes comprenaient souvent des listes de comptes. En Chine, de nombreuses listes faisaient état du recensement de la population.

Au XIXe siècle, Herman Hollerith s’inspirait du métier à tisser de Jacquard en inventant une machine mécanisée pour le recensement.

« De façon générale, les données deviennent indispensables quand les organisations humaines dépassent une certaine taille, une certaine complexité. Elles s’imposent notamment dans les sciences quand les phénomènes deviennent trop complexes pour être appréhendés par des cerveaux humains sans l’appui d’ordinateurs » précisent les auteurs.

Les big data

Avec internet et la multiplication du nombre d’objets connectés, les volumes de données ne cessent de croître. Entreprises et gouvernements sont tous conscients de la valeur de cette information, encore plus précieuse lorsqu’elle est croisée avec d’autres, déclinées à de nouveaux services ou produits.

« De nouvelles techniques ont été développées, basées principalement sur l’utilisation de ce qu’on appelle le « parallélisme massif » : elles utilisent les calculs d’un grand nombre de machines dans des data centers. Ces techniques se sont popularisées sous le terme de big data ». 

Mais si l’analyse des données massives est aujourd’hui incontournable dans plusieurs domaines, elle soulève aussi des questionnements quant à la fiabilité des données, les erreurs, les manques et malgré la puissance des algorithmes, certaines analyses manquent toujours de précision.

Il arrive également que certains algorithmes n’expliquent pas le raisonnement qui leur a permis de fournir un résultat. Ces derniers génèrent ainsi une forme d’opacité problématique lorsque leurs calculs impactent nos vies au quotidien.

La démocratie étendue, la démocratie fragilisée

La donnée et l’information ont toujours joué un rôle central au sein du débat démocratique. L’information est « au cœur de la transparence et du débat, deux piliers d’un régime démocratique » rappellent les auteurs. La donnée est au cœur des programmes, des débats des partis et des candidats.

Cette même donnée, une fois le candidat élu, sera analysée, décryptée, commentée. Cette épreuve de validité de l’information mise en débat est un enjeu central de la démocratie.

La période actuelle est caractérisée par une surabondance de sources, des médias traditionnels aux médias sociaux, conjointement avec l’accélération du rythme de production et de diffusion de l’information.

« Aux États-Unis, le site Politifact est un des pionniers dans le domaine du fact-checking. Il a obtenu le prix Pulitzer en 2009 dans la catégorie National reporting « pour son examen de 750 déclarations faites durant la campagne pour l’élection présidentielle américaine de 2008 ». 

Mais paradoxalement, alors que les technologies vérifiant le flot inédit d’informations se développent, les démocraties, en Europe et sur le continent américain, n’ont jamais semblé aussi fragilisées.

« Les symptômes de cette fragilité sont multiples : abstention aux élections, replis identitaires et votes populistes, mobilisations citoyennes en désaveu des partis politiques traditionnels, installation de régimes d’extrêmes droite au cœur de l’Europe, confiscation du pouvoir législatif grec par les institutions européennes, répressions et violence étatique en Turquie, etc… ».

Cette régression trouverait-elle sa source dans la surabondance d’informations ? La diffusion et l’exploitation de contre-vérités, ces fake-news popularisées lors de la campagne présidentielle américaine ? La transposition de techniques marketing publicitaire dans les campagnes électorales, « avec des outils toujours plus précis, inspirés des CRM, les logiciels des entreprises, s’appuient sur les données pour cibler les électeurs à démarcher ». 

Depuis 2008, les logiciels destinés à améliorer la gestion des campagnes électorales se sont multipliés. En France, c’est le logiciel NationBuilder qui fut utilisé en amont de la présidentielle de 2017, par les candidats à la primaire de la droite, mais aussi par Jean-Luc Mélenchon.

Le mouvement « En Marche » d’Emmanuel Macron a, quant à lui, fait le choix du logiciel 50+1 afin d’accompagner la construction du site internet mais aussi les levées de fonds ou l’animation des groupes de sympathisants. Autant de nouveaux outils qui intéressent de près la CNIL : utiles au renouvellement de notre vie démocratique, ils ne doivent pas pour autant empiéter sur nos vies privées.

Notre mémoire fout-elle le camp ?

À l’image des photos stockées sur la mémoire de nos téléphones portables, dont nous ignorons peu à peu l’existence, les données numériques deviennent des documents immuables.

« Nous tenons beaucoup à nos piles de vinyles, nos vieux rapports de stages, à ce paquet de lettres d’un ancien amour peut-être… Ces objets sont des traces de notre mémoire. Mais quand la mémoire devient numérique, qu’en est-il de sa préservation ? ». 

Il suffit d’une panne, d’un virus, d’un incident, pour perdre des pans entiers de mémoire. La conservation de la mémoire est confrontée à un autre obstacle, celui de l’obsolescence rapide des formats de conservation. La mémoire numérique doit donc être constamment actualisée, renouvelée et modernisée.

Un challenge qui concerne aussi bien les archives d’État que celles des entreprises et des particuliers. Mais du moment que nous prenons conscience de toutes ces difficultés, nous pouvons les dépasser.

« Avec l’aide des algorithmes, nous pouvons apprendre à devenir les archivistes du monde de nos données. Un apprentissage parmi d’autres dans une société numérique, un savoir pour profiter au mieux de cette mémoire augmentée et inédite dans l’histoire de l’humanité ». 

Pour aller plus loin :

–      «  NationBuilder : aide-toi le logiciel t’élira »,Liberation.fr

–      « Qu’est-ce que Nationbuilder : le cms qui veut sauver la démocratie ? », Numerama.com

–      « Campagnes électorales : les logiciels deviennent incontournables », Compol.media

Sur le web