Le document numérique à l’heure des données

L’histoire des données reste encore à écrire. Des travaux importants de la statistique sociale montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Partager sur:
Sauvegarder cet article
Aimer cet article 0
Photo by Joshua Sortino on Unsplash - https://unsplash.com/photos/LqKhnDzSF-8

La liberté d’expression n’est pas gratuite!

Mais déductible à 66% des impôts

N’oubliez pas de faire un don !

Faire un don

Le document numérique à l’heure des données

Publié le 10 décembre 2019
- A +

Par Farid Gueham.
Un article de Trop Libre

« Ne serions-nous pas en train d’assister à l’éclosion du web sémantique ? Le paysage informationnel poursuit en effet une mutation qui nous conduit à interroger à nouveau la nature même du document : où commence-t-il, où finit-il ? Et d’ailleurs finit-il vraiment ? Quelles en sont les frontières constitutives ? Pour cela, il nous faut comprendre l’environnement dans lequel il évolue désormais : le web de données ». 

À l’occasion d’un séminaire organisé par l’Institut de recherche en sciences du numérique (Inria), Lisette CalderanPascale LaurentHélène Lowinger et Jacques Millet interrogent des spécialistes de disciplines diverses afin de croiser leurs analyses, et de comprendre ce qui « forge et structure aujourd’hui le document », dans ses aspects techniques, sémantiques et juridiques.

Les données : une histoire à écrire

« Le web et le numérique en général ont été l’occasion d’insister sur le développement des données, par le projet de web de données que nous venons d’évoquer, mais aussi par la mise en mémoire des données numériques de toutes sortes, phénomène aujourd’hui connu sous le blocable de big data. »

Recensements de populations, tableaux économiques, marchés financiers, l’utilisation de la donnée explose dans tous les rouages des sociétés contemporaines. Mais l’histoire des données reste encore à écrire, des travaux importants de la statistique sociale, notamment ceux d’Alain Desrosières, montrent le lien fort entre la consolidation des États modernes et l’organisation de son espace public.

Alain Dérosières insiste par ailleurs sur les deux niveaux de la statistique : celui de la collecte et du traitement de la donnée.

Le chercheur va plus loin, en affirmant que les éléments de référencement communs à divers acteurs sont la condition du débat contradictoire entre les différents acteurs d’une cité.

Relier, réutiliser, partager : l’apport du web de données

« L’expression web of data, qu’on traduit de manière littérale par « web de données », est présente dès la feuille de route pour le web sémantique écrite en 1998 par Tim Berners-Lee. Cependant, elle n’a été vraiment utilisée qu’à partir de 2006, suite à la parution de la note Linked Data du même Tim Berners-Lee. »

Le but premier du web sémantique était donc la création de lien entre les données exposées et distribuées sur le réseau, autour de plusieurs principes de mise à disposition : l’hypothèse émise par les membres de ce groupe montre qu’il était nécessaire de disposer de premiers jeux de données (data sets), sous licence libre, afin de constituer un point de départ.

L’interopérabilité est également un prérequis qui permet d’exploiter et de confronter des données issues de secteurs différents.

« Les référentiels tels que thésaurus, vocabulaires contrôlés, listes d’autorité, sont volontiers associés au modèle hub and spoke : ils agissent comme un point nodal ou une colonne vertébrale permettant de créer un point de contact entre des jeux de données différents. »

Dans le web des données, n’importe quel jeu de données dont on réutilise les entités peut jouer ce même rôle de passerelle.

Du web de documents au web de données : la révolution juridique inachevée de l’Open Data

« Le droit occupe une place importante dans l’Open Data mais il n’est pas pour autant aisé d’en donner une définition juridique. En effet, les grands principes qui façonnent l’ouverture des données publiques n’ont pas été à l’origine définis par les États et ils ne figurent en tant que tels dans aucune loi. »

L’Open Data est une démarche empirique qui fut initialement lancée par plusieurs gouvernements, à commencer par la Grande-Bretagne, l’Australie, etc.

L’Open Data s’est peu à peu codifié dans son cadre juridique, sous l’impulsion de plusieurs groupes de travail composés d’experts issus de la société civile ou d’organisation non gouvernementales.

L’ouverture des données publiques dans le cadre légal actuel nécessite toujours la mise en œuvre d’outils juridiques particuliers : certaines licences présentent la spécificité d’avoir été écrites en dehors de l’action des États et parfois par des organisations internationales.

En France, le mouvement de l’Open Data s’est lui structuré autour d’une dialectique d’ouverture des données par les autorités publiques et les interventions de groupes issus de la société civile, qui ont été en mesure d’évaluer ou de critiquer les actions menées par le secteur public.

Depuis le début de l’Open Data, il n’est pas excessif de considérer que le mouvement a donné lieu à une véritable révolution juridique dans la manière dont le droit appréhende les informations et leur réutilisation, avec certaines limites : le droit d’auteur n’a pas été conçu pour appréhender les données et les informations brutes car, à défaut d’être originales, ces dernières demeurent dans le domaine public, et si la loi du 17 juillet 1978 relative à la réutilisation des données publiques n’impose pas aux administrations de s’engager dans une démarche d’Open Data, elle n’en est pas pour autant réfractaire à l’ouverture des données.

L’avenir du web au prisme de la ressource

« De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand, dans le même temps, le web d’applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable. »

Une complexité qui provient d’une part de la ressource présente sur des formes aussi différentes les unes que les autres, et d’autre part sur l’angle de la cohérence architecturale du réseau.

Parmi les différentes facettes du web, le web des données liées (c’est-à-dire les données liées et structurées sur le web et selon ses standards), est appelé à jouer un rôle important dans l’avenir : il sera amené à gérer une nouvelle diversité de ressources, les métadonnées, un gisement indéfini et extensible à l’infini.

Pour aller plus loin :

La politique des grands nombres, editionsdeladecouverte.fr

La statistique : outil de preuve et de gouvernement, irevues.inist.fr

Le web à venir par Tim Berners-Lee, conférence Tedtalk.

Le risque d’un Netflix du droit, lemonde.fr

L’Open data reste un chantier à conceptualiser largement pour l’ État, lagazettedescommunes.com

Des normes pour les ressources électroniques en ligne, in Actualités de la conservation

Sur le web

La liberté d’expression n’est pas gratuite!

Mais déductible à 66% des impôts

N’oubliez pas de faire un don !

Faire un don

Par Luke Hogg.

Dans de nombreux États, les Américains peuvent désormais se débarrasser de leur portefeuille physique et vérifier leur identité en présentant simplement leur appareil sur un scanner. Tout comme les portefeuilles numériques d'Apple et de Google ont rendu le commerce plus pratique, les systèmes d'identification numérique pourraient potentiellement rendre les interactions avec l'administration plus rapides et plus efficaces.

Mais ils soulèvent également le spectre inquiétant de la surveillance gouvernementale. Peut-o... Poursuivre la lecture

Par Pierre Farge et Shana Elkaim.

Le ministre de l'Intérieur Gérald Darmanin a demandé la fermeture de groupes de discussions sur les messageries cryptées telles que Telegram appelant à des actions violentes à l’encontre de la communauté musulmane durant la rupture du jeûne du ramadan.

Ces enjeux posent la question de la limite entre la protection de la sécurité nationale, l’impératif pour un gouvernement de disposer de renseignements, et la protection des libertés civiles. Le point par l’avocat Pierre Farge.

« Quand tu a... Poursuivre la lecture

2
Sauvegarder cet article

Accueilli avec enthousiasme par les uns, avec circonspection par les autres, le nouveau modèle d’intelligence artificielle GPT-4 développé par OpenAI est sorti ce mardi 14 mars.

Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg

— OpenAI (@OpenAI) March 14, 2023

Le système peut faire passer l'examen du barreau, résoudre des énigmes logiques et même créer un site internet à partir de quelques l... Poursuivre la lecture

Voir plus d'articles