Le document numérique à l’heure des données

L’histoire des données reste encore à écrire. Des travaux importants de la statistique sociale montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Partager sur:
Sauvegarder cet article
Aimer cet article 0
Photo by Joshua Sortino on Unsplash - https://unsplash.com/photos/LqKhnDzSF-8

Promouvoir la liberté n’est pas gratuit

Mais cela peut aider à réduire vos impôts de 66%

Faites un don dès maintenant

Faire un don

Le document numérique à l’heure des données

Publié le 10 décembre 2019
- A +

Par Farid Gueham.
Un article de Trop Libre

« Ne serions-nous pas en train d’assister à l’éclosion du web sémantique ? Le paysage informationnel poursuit en effet une mutation qui nous conduit à interroger à nouveau la nature même du document : où commence-t-il, où finit-il ? Et d’ailleurs finit-il vraiment ? Quelles en sont les frontières constitutives ? Pour cela, il nous faut comprendre l’environnement dans lequel il évolue désormais : le web de données ». 

À l’occasion d’un séminaire organisé par l’Institut de recherche en sciences du numérique (Inria), Lisette CalderanPascale LaurentHélène Lowinger et Jacques Millet interrogent des spécialistes de disciplines diverses afin de croiser leurs analyses, et de comprendre ce qui « forge et structure aujourd’hui le document », dans ses aspects techniques, sémantiques et juridiques.

Les données : une histoire à écrire

« Le web et le numérique en général ont été l’occasion d’insister sur le développement des données, par le projet de web de données que nous venons d’évoquer, mais aussi par la mise en mémoire des données numériques de toutes sortes, phénomène aujourd’hui connu sous le blocable de big data. »

Recensements de populations, tableaux économiques, marchés financiers, l’utilisation de la donnée explose dans tous les rouages des sociétés contemporaines. Mais l’histoire des données reste encore à écrire, des travaux importants de la statistique sociale, notamment ceux d’Alain Desrosières, montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Alain Dérosières insiste par ailleurs sur les deux niveaux de la statistique : celui de la collecte et du traitement de la donnée.

Le chercheur va plus loin, en affirmant que les éléments de référencement communs à divers acteurs sont la condition du débat contradictoire entre les différents acteurs d’une cité.

Relier, réutiliser, partager : l’apport du web de données

« L’expression web of data, qu’on traduit de manière littérale par « web de données », est présente dès la feuille de route pour le web sémantique écrite en 1998 par Tim Berners-Lee. Cependant, elle n’a été vraiment utilisée qu’à partir de 2006, suite à la parution de la note Linked Data du même Tim Berners-Lee. »

Le but premier du web sémantique était donc la création de lien entre les données exposées et distribuées sur le réseau, autour de plusieurs principes de mise à disposition : l’hypothèse émise par les membres de ce groupe montre qu’il était nécessaire de disposer de premiers jeux de données (data sets), sous licence libre, afin de constituer un point de départ.

L’interopérabilité est également un prérequis qui permet d’exploiter et de confronter des données issues de secteurs différents.

« Les référentiels tels que thésaurus, vocabulaires contrôlés, listes d’autorité, sont volontiers associés au modèle hub and spoke : ils agissent comme un point nodal ou une colonne vertébrale permettant de créer un point de contact entre des jeux de données différents. »

Dans le web des données, n’importe quel jeu de données dont on réutilise les entités peut jouer ce même rôle de passerelle.

Du web de documents au web de données : la révolution juridique inachevée de l’Open Data

« Le droit occupe une place importante dans l’Open Data mais il n’est pas pour autant aisé d’en donner une définition juridique. En effet, les grands principes qui façonnent l’ouverture des données publiques n’ont pas été à l’origine définis par les États et ils ne figurent en tant que tels dans aucune loi. »

L’Open Data est une démarche empirique qui fut initialement lancée par plusieurs gouvernements, à commencer par la Grande-Bretagne, l’Australie, etc.

L’Open Data s’est peu à peu codifié dans son cadre juridique, sous l’impulsion de plusieurs groupes de travail composés d’experts issus de la société civile ou d’organisation non gouvernementales.

L’ouverture des données publiques dans le cadre légal actuel nécessite toujours la mise en œuvre d’outils juridiques particuliers : certaines licences présentent la spécificité d’avoir été écrites en dehors de l’action des États et parfois par des organisations internationales.

En France, le mouvement de l’Open Data s’est lui structuré autour d’une dialectique d’ouverture des données par les autorités publiques et les interventions de groupes issus de la société civile, qui ont été en mesure d’évaluer ou de critiquer les actions menées par le secteur public.

Depuis le début de l’Open Data, il n’est pas excessif de considérer que le mouvement a donné lieu à une véritable révolution juridique dans la manière dont le droit appréhende les informations et leur réutilisation, avec certaines limites : le droit d’auteur n’a pas été conçu pour appréhender les données et les informations brutes car, à défaut d’être originales, ces dernières demeurent dans le domaine public, et si la loi du 17 juillet 1978 relative à la réutilisation des données publiques n’impose pas aux administrations de s’engager dans une démarche d’Open Data, elle n’en est pas pour autant réfractaire à l’ouverture des données.

L’avenir du web au prisme de la ressource

« De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand, dans le même temps, le web d’applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable. »

Une complexité qui provient d’une part de la ressource présente sur des formes aussi différentes les unes que les autres, et d’autre part sur l’angle de la cohérence architecturale du réseau.

Parmi les différentes facettes du web, le web des données liées (c’est-à-dire les données liées et structurées sur le web et selon ses standards), est appelé à jouer un rôle important dans l’avenir : il sera amené à gérer une nouvelle diversité de ressources, les métadonnées, un gisement indéfini et extensible à l’infini.

Pour aller plus loin :

La politique des grands nombres, editionsdeladecouverte.fr

La statistique : outil de preuve et de gouvernement, irevues.inist.fr

Le web à venir par Tim Berners-Lee, conférence Tedtalk.

Le risque d’un Netflix du droit, lemonde.fr

L’Open data reste un chantier à conceptualiser largement pour l’ État, lagazettedescommunes.com

Des normes pour les ressources électroniques en ligne, in Actualités de la conservation

Sur le web

Promouvoir la liberté n’est pas gratuit

Mais cela peut aider à réduire vos impôts de 66%

Faites un don dès maintenant

Faire un don
web
1
Sauvegarder cet article

Article disponible en podcast ici.

Un nouveau mot est maintenant sur toutes les présentations des startups qui souhaitent l’argent des investisseurs. Le web3 succède aux précédents buzz words tels BigData, Intelligence Artificielle ou Cloud Native.

Bien évidemment, une fois mis sur la présentation d’une startup, ce mot ne veut plus rien dire. Pourtant techniquement, il réfère à une réalité précise. Nous allons voir ce qu’est le web3 en passant également par le web1 et le web2.

 

Web1, le serveur

Le web1 est ap... Poursuivre la lecture

Big Data
1
Sauvegarder cet article

Par Sylvain Fontan.

Le phénomène intitulé Big Data (données massives) fait référence au flux de données sur internet de la part des particuliers, des entreprises et des États du fait de la démocratisation des connexions haut débit. L'ampleur de ce phénomène est telle qu'il peut être considéré comme valeur économique en soi. En effet, la capacité à exploiter ces données peut permettre de valoriser l'activité économique.

Le Big Data comme valeur économique

L'importance accrue du Big Data est telle que le Forum économique mondial ... Poursuivre la lecture

modèles morts covid
0
Sauvegarder cet article

Par François Jolain.

Nous pensons tous avoir la réponse à cette question : ce sont les personnes âgées de plus de 60 ans qui meurent majoritairement du covid en France. Oui, mais en détail ?

Un flou au niveau de l'information

Aussitôt, on tombe dans le vide. On aurait pourtant besoin de plus d’informations pour mieux juger la stratégie du gouvernement. Combien de jeunes de moins de 30 ans sont morts du covid ? Combien sont-ils hospitalisés chaque jour en France ? Quel est l’âge moyen des morts du covid ?

En fait, ... Poursuivre la lecture

Voir plus d'articles