Le document numérique à l’heure des données

Photo by Joshua Sortino on Unsplash - https://unsplash.com/photos/LqKhnDzSF-8 — Joshua Sortino ,

L’histoire des données reste encore à écrire. Des travaux importants de la statistique sociale montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Par Farid Gueham.
Un article de Trop Libre

« Ne serions-nous pas en train d’assister à l’éclosion du web sémantique ? Le paysage informationnel poursuit en effet une mutation qui nous conduit à interroger à nouveau la nature même du document : où commence-t-il, où finit-il ? Et d’ailleurs finit-il vraiment ? Quelles en sont les frontières constitutives ? Pour cela, il nous faut comprendre l’environnement dans lequel il évolue désormais : le web de données ». 

À l’occasion d’un séminaire organisé par l’Institut de recherche en sciences du numérique (Inria), Lisette CalderanPascale LaurentHélène Lowinger et Jacques Millet interrogent des spécialistes de disciplines diverses afin de croiser leurs analyses, et de comprendre ce qui « forge et structure aujourd’hui le document », dans ses aspects techniques, sémantiques et juridiques.

Les données : une histoire à écrire

« Le web et le numérique en général ont été l’occasion d’insister sur le développement des données, par le projet de web de données que nous venons d’évoquer, mais aussi par la mise en mémoire des données numériques de toutes sortes, phénomène aujourd’hui connu sous le blocable de big data. »

Recensements de populations, tableaux économiques, marchés financiers, l’utilisation de la donnée explose dans tous les rouages des sociétés contemporaines. Mais l’histoire des données reste encore à écrire, des travaux importants de la statistique sociale, notamment ceux d’Alain Desrosières, montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Alain Dérosières insiste par ailleurs sur les deux niveaux de la statistique : celui de la collecte et du traitement de la donnée.

Le chercheur va plus loin, en affirmant que les éléments de référencement communs à divers acteurs sont la condition du débat contradictoire entre les différents acteurs d’une cité.

Relier, réutiliser, partager : l’apport du web de données

« L’expression web of data, qu’on traduit de manière littérale par « web de données », est présente dès la feuille de route pour le web sémantique écrite en 1998 par Tim Berners-Lee. Cependant, elle n’a été vraiment utilisée qu’à partir de 2006, suite à la parution de la note Linked Data du même Tim Berners-Lee. »

Le but premier du web sémantique était donc la création de lien entre les données exposées et distribuées sur le réseau, autour de plusieurs principes de mise à disposition : l’hypothèse émise par les membres de ce groupe montre qu’il était nécessaire de disposer de premiers jeux de données (data sets), sous licence libre, afin de constituer un point de départ.

L’interopérabilité est également un prérequis qui permet d’exploiter et de confronter des données issues de secteurs différents.

« Les référentiels tels que thésaurus, vocabulaires contrôlés, listes d’autorité, sont volontiers associés au modèle hub and spoke : ils agissent comme un point nodal ou une colonne vertébrale permettant de créer un point de contact entre des jeux de données différents. »

Dans le web des données, n’importe quel jeu de données dont on réutilise les entités peut jouer ce même rôle de passerelle.

Du web de documents au web de données : la révolution juridique inachevée de l’Open Data

« Le droit occupe une place importante dans l’Open Data mais il n’est pas pour autant aisé d’en donner une définition juridique. En effet, les grands principes qui façonnent l’ouverture des données publiques n’ont pas été à l’origine définis par les États et ils ne figurent en tant que tels dans aucune loi. »

L’Open Data est une démarche empirique qui fut initialement lancée par plusieurs gouvernements, à commencer par la Grande-Bretagne, l’Australie, etc.

L’Open Data s’est peu à peu codifié dans son cadre juridique, sous l’impulsion de plusieurs groupes de travail composés d’experts issus de la société civile ou d’organisation non gouvernementales.

L’ouverture des données publiques dans le cadre légal actuel nécessite toujours la mise en œuvre d’outils juridiques particuliers : certaines licences présentent la spécificité d’avoir été écrites en dehors de l’action des États et parfois par des organisations internationales.

En France, le mouvement de l’Open Data s’est lui structuré autour d’une dialectique d’ouverture des données par les autorités publiques et les interventions de groupes issus de la société civile, qui ont été en mesure d’évaluer ou de critiquer les actions menées par le secteur public.

Depuis le début de l’Open Data, il n’est pas excessif de considérer que le mouvement a donné lieu à une véritable révolution juridique dans la manière dont le droit appréhende les informations et leur réutilisation, avec certaines limites : le droit d’auteur n’a pas été conçu pour appréhender les données et les informations brutes car, à défaut d’être originales, ces dernières demeurent dans le domaine public, et si la loi du 17 juillet 1978 relative à la réutilisation des données publiques n’impose pas aux administrations de s’engager dans une démarche d’Open Data, elle n’en est pas pour autant réfractaire à l’ouverture des données.

L’avenir du web au prisme de la ressource

« De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand, dans le même temps, le web d’applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable. »

Une complexité qui provient d’une part de la ressource présente sur des formes aussi différentes les unes que les autres, et d’autre part sur l’angle de la cohérence architecturale du réseau.

Parmi les différentes facettes du web, le web des données liées (c’est-à-dire les données liées et structurées sur le web et selon ses standards), est appelé à jouer un rôle important dans l’avenir : il sera amené à gérer une nouvelle diversité de ressources, les métadonnées, un gisement indéfini et extensible à l’infini.

Pour aller plus loin :

La politique des grands nombres, editionsdeladecouverte.fr

La statistique : outil de preuve et de gouvernement, irevues.inist.fr

Le web à venir par Tim Berners-Lee, conférence Tedtalk.

Le risque d’un Netflix du droit, lemonde.fr

L’Open data reste un chantier à conceptualiser largement pour l’ État, lagazettedescommunes.com

Des normes pour les ressources électroniques en ligne, in Actualités de la conservation

Sur le web

Vous souhaitez nous signaler une erreur ? Contactez la rédaction.