Le document numérique à l’heure des données

L’histoire des données reste encore à écrire. Des travaux importants de la statistique sociale montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.
Partager sur:
Sauvegarder cet article
Aimer cet article 0
Photo by Joshua Sortino on Unsplash - https://unsplash.com/photos/LqKhnDzSF-8

Promouvoir la liberté n’est pas gratuit

Mais cela peut aider à réduire vos impôts de 66%

Faites un don dès maintenant

Faire un don

Le document numérique à l’heure des données

Publié le 10 décembre 2019
- A +

Par Farid Gueham.
Un article de Trop Libre

« Ne serions-nous pas en train d’assister à l’éclosion du web sémantique ? Le paysage informationnel poursuit en effet une mutation qui nous conduit à interroger à nouveau la nature même du document : où commence-t-il, où finit-il ? Et d’ailleurs finit-il vraiment ? Quelles en sont les frontières constitutives ? Pour cela, il nous faut comprendre l’environnement dans lequel il évolue désormais : le web de données ». 

À l’occasion d’un séminaire organisé par l’Institut de recherche en sciences du numérique (Inria), Lisette CalderanPascale LaurentHélène Lowinger et Jacques Millet interrogent des spécialistes de disciplines diverses afin de croiser leurs analyses, et de comprendre ce qui « forge et structure aujourd’hui le document », dans ses aspects techniques, sémantiques et juridiques.

Les données : une histoire à écrire

« Le web et le numérique en général ont été l’occasion d’insister sur le développement des données, par le projet de web de données que nous venons d’évoquer, mais aussi par la mise en mémoire des données numériques de toutes sortes, phénomène aujourd’hui connu sous le blocable de big data. »

Recensements de populations, tableaux économiques, marchés financiers, l’utilisation de la donnée explose dans tous les rouages des sociétés contemporaines. Mais l’histoire des données reste encore à écrire, des travaux importants de la statistique sociale, notamment ceux d’Alain Desrosières, montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Alain Dérosières insiste par ailleurs sur les deux niveaux de la statistique : celui de la collecte et du traitement de la donnée.

Le chercheur va plus loin, en affirmant que les éléments de référencement communs à divers acteurs sont la condition du débat contradictoire entre les différents acteurs d’une cité.

Relier, réutiliser, partager : l’apport du web de données

« L’expression web of data, qu’on traduit de manière littérale par « web de données », est présente dès la feuille de route pour le web sémantique écrite en 1998 par Tim Berners-Lee. Cependant, elle n’a été vraiment utilisée qu’à partir de 2006, suite à la parution de la note Linked Data du même Tim Berners-Lee. »

Le but premier du web sémantique était donc la création de lien entre les données exposées et distribuées sur le réseau, autour de plusieurs principes de mise à disposition : l’hypothèse émise par les membres de ce groupe montre qu’il était nécessaire de disposer de premiers jeux de données (data sets), sous licence libre, afin de constituer un point de départ.

L’interopérabilité est également un prérequis qui permet d’exploiter et de confronter des données issues de secteurs différents.

« Les référentiels tels que thésaurus, vocabulaires contrôlés, listes d’autorité, sont volontiers associés au modèle hub and spoke : ils agissent comme un point nodal ou une colonne vertébrale permettant de créer un point de contact entre des jeux de données différents. »

Dans le web des données, n’importe quel jeu de données dont on réutilise les entités peut jouer ce même rôle de passerelle.

Du web de documents au web de données : la révolution juridique inachevée de l’Open Data

« Le droit occupe une place importante dans l’Open Data mais il n’est pas pour autant aisé d’en donner une définition juridique. En effet, les grands principes qui façonnent l’ouverture des données publiques n’ont pas été à l’origine définis par les États et ils ne figurent en tant que tels dans aucune loi. »

L’Open Data est une démarche empirique qui fut initialement lancée par plusieurs gouvernements, à commencer par la Grande-Bretagne, l’Australie, etc.

L’Open Data s’est peu à peu codifié dans son cadre juridique, sous l’impulsion de plusieurs groupes de travail composés d’experts issus de la société civile ou d’organisation non gouvernementales.

L’ouverture des données publiques dans le cadre légal actuel nécessite toujours la mise en œuvre d’outils juridiques particuliers : certaines licences présentent la spécificité d’avoir été écrites en dehors de l’action des États et parfois par des organisations internationales.

En France, le mouvement de l’Open Data s’est lui structuré autour d’une dialectique d’ouverture des données par les autorités publiques et les interventions de groupes issus de la société civile, qui ont été en mesure d’évaluer ou de critiquer les actions menées par le secteur public.

Depuis le début de l’Open Data, il n’est pas excessif de considérer que le mouvement a donné lieu à une véritable révolution juridique dans la manière dont le droit appréhende les informations et leur réutilisation, avec certaines limites : le droit d’auteur n’a pas été conçu pour appréhender les données et les informations brutes car, à défaut d’être originales, ces dernières demeurent dans le domaine public, et si la loi du 17 juillet 1978 relative à la réutilisation des données publiques n’impose pas aux administrations de s’engager dans une démarche d’Open Data, elle n’en est pas pour autant réfractaire à l’ouverture des données.

L’avenir du web au prisme de la ressource

« De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand, dans le même temps, le web d’applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable. »

Une complexité qui provient d’une part de la ressource présente sur des formes aussi différentes les unes que les autres, et d’autre part sur l’angle de la cohérence architecturale du réseau.

Parmi les différentes facettes du web, le web des données liées (c’est-à-dire les données liées et structurées sur le web et selon ses standards), est appelé à jouer un rôle important dans l’avenir : il sera amené à gérer une nouvelle diversité de ressources, les métadonnées, un gisement indéfini et extensible à l’infini.

Pour aller plus loin :

La politique des grands nombres, editionsdeladecouverte.fr

La statistique : outil de preuve et de gouvernement, irevues.inist.fr

Le web à venir par Tim Berners-Lee, conférence Tedtalk.

Le risque d’un Netflix du droit, lemonde.fr

L’Open data reste un chantier à conceptualiser largement pour l’ État, lagazettedescommunes.com

Des normes pour les ressources électroniques en ligne, in Actualités de la conservation

Sur le web

Promouvoir la liberté n’est pas gratuit

Mais cela peut aider à réduire vos impôts de 66%

Faites un don dès maintenant

Faire un don
0
Sauvegarder cet article

Par François Jolain.

Nous pensons tous avoir la réponse à cette question : ce sont les personnes âgées de plus de 60 ans qui meurent majoritairement du covid en France. Oui, mais en détail ?

Un flou au niveau de l'information

Aussitôt, on tombe dans le vide. On aurait pourtant besoin de plus d’informations pour mieux juger la stratégie du gouvernement. Combien de jeunes de moins de 30 ans sont morts du covid ? Combien sont-ils hospitalisés chaque jour en France ? Quel est l’âge moyen des morts du covid ?

En fait, ... Poursuivre la lecture

Les ganacheries tombant aussi aisément au sujet des algorithmes qu’à Gravelotte, trouver une nourriture de l’esprit équilibrée et éclairante relève de la tâche pascalienne. Aurélie Jean est de celle-ci. Mêlant pédagogie et nuance, elle fait entendre sa voix et ses messages aux quatre coins du globe, seule échelle à la mesure de cette globetrotteuse hyperactive.

À l’occasion de la sortie de son dernier ouvrage, Les algorithmes font-ils la loi ?, aux éditions de l’Observatoire, Aurélie Jean a répondu aux questions de Corentin Luce.

<... Poursuivre la lecture

Par Yannick Chatelain.

Que cela soit d’un point de vue sécuritaire ou sanitaire, l’État, et c’est là un euphémisme, se donne dans l’urgence quelques libertés concernant le traitement des données personnelles des citoyens, par impréparation ou volonté délibérée.

Il ne m’appartient pas d’en juger, mais juste d’alerter les citoyens sur des faits, aux côtés des organismes comme la CNIL ou La Quadrature du Net qui veillent et surveillent attentivement les projets de loi et les décrets qui se succèdent à une cadence effrénée.

L... Poursuivre la lecture

Voir plus d'articles