Du big data au fast data, le nouvel écosystème de la data

Une nouvelle technologie n’affecte l’efficacité d’une organisation que si celle-ci se réorganise en même temps. Mais « qui gardera les gardiens » de la donnée ?

Par Farid Gueham.
Un article de Trop Libre

A peine le big data occupe-t-il le devant de la scène technologique que déjà surgit le phénomène de fast data. Car au-delà du volume des données, ce qui devient décisif, c’est la capacité à traiter, à grande vitesse, les données dans toute leur variété, de les transformer en connaissances en fournissant très rapidement la bonne information à la bonne personne au bon moment, voire de les utiliser pour prédire l’avenir.

Les auteurs de cet ouvrage collectif, décryptent et vulgarisent le nouvel écosystème de la data, mais aussi son impact sur des fonctions en mutation et des enjeux émergents.

Car l’avènement de la valeur data a transformé en profondeur tous les domaines : de l’éducation en passant par la sécurité, mais aussi la recherche, la médecine, les transports, jusqu’aux recoins les plus intimes de nos vies, à travers le quantified self.

Le quantified self : vers un « soi » toujours plus performant ?

Dans le domaine du sport comme celui de l’industrie, l’analyse de la donnée est au service de la performance. Le sport de haut niveau s’est largement inspiré des méthodes de l’industrie.

Les datas, leurs collectes et leurs analyses créent de nouveaux métiers et de nouvelles fonctions, du sport scientist au pur expert analytique. Une évolution professionnelle grâce à des parcours mixtes qui lient coaching, compréhension de la performance athlétique et du corps humain mais aussi des compétences mathématiques et de « databasing ».

La National Football League (NFL ), qui est la Ligue de football américain aux Etats-Unis, vient de débuter une vague de recrutement de sport scientists afin de réduire le rythme des blessures et améliorer la performance.

Un rapport au pouvoir : la e-gouvernance

Emmanuel Raviart, directeur technique d’Etalab, service chargé de la création d’un « portail unique interministériel des données publiques », rappelle que la France s’est engagée dans l’ouverture des données de son administration dès 2011, sensiblement après les pays anglo-saxons ou scandinaves.

Et au-delà de l’ouverture démocratique, l’open government s’avère être un formidable libérateur d’énergies sur le plan économique. « Potentiellement, toutes les entreprises ont besoin de ces données. Or, pour l’heure, ces besoins ne sont pas couverts, sauf par des bases de données pirates ou parallèles » rappelle l’auteur.

Parmi les tentatives d’ouverture des données les plus réussies, on citera l’exemple de la réserve parlementaire, notamment sous l’impulsion de l’association « Regards Citoyens ».

De la même façon, la CADA « Commission d’accès aux documents administratifs » a libéré ses décisions. Et le croisement des données permet d’obtenir des informations stratégiques, dans les limites éthiques et déontologiques fixées par la loi. Certains croisements et usages ne sont pas souhaitables.

Et en ouvrant une partie de ses données, l’Etat abandonne une partie de ses prérogatives : « la construction d’un Etat moderne s’appuie nécessairement sur les citoyens, et donc sur des compétences extérieures. C’est le pari que nous faisons. L’Etat n’a pas toujours raison, il doit donc s’appuyer sur ses citoyens, qui sont souvent plus compétents que lui », souligne Emmanuel Raviart.

Quel cadre législatif et juridique pour le big data ?

Pour Alain Bensoussan, avocat spécialiste en droit des technologies avancées, le Big Data nous oblige à repenser le domaine d’application des lois et leur cadre. Un défi passionnant qui implique la reconnaissance de trois droits fondamentaux : le droit de la propriété, le droit à la souveraineté des données personnelles et le droit à l’intimité de la vie privée.

Car, pour l’heure, il n’existe pas de droit à la propriété des données.

Si le droit à la propriété n’existe pas pour l’instant, nous devons au moins créer le droit à la souveraineté, à l’autodétermination par l’utilisateur de ses droits. Le droit à la souveraineté est sûrement un droit fondamental, un droit naturel qui permet au-delà de la propriété, nonobstant la propriété ou malgré le fait qu’il n’y ait pas de propriété, de pouvoir effectivement contrôler ses données et décider de leur utilisation.

Quant au traitement juridique des données personnelles, il repose pour l’essentiel sur l’autorité de la CNIL, pour laquelle la législation des données à caractère personnel repose sur un responsable de traitement.

Les citoyens européens doivent rester maîtres de leurs fichiers. Pour Alain Bensoussan, ces derniers doivent garder une copie de leur donnée, conserver la maîtrise de leurs données.

Open sciences : la science et la recherche à l’heure des méga-données 

Étroitement lié à tous les champs d’études quantitatifs, le big data tout comme les fast data et l’open data sont étroitement liés à la science. Dans le cadre d’expériences à grande échelle, les laboratoires ont été parmi les premiers organismes à faire usage de nouveaux outils, des métiers.

Frédéric Hemmer, chef du département des technologies de l’information (IT) du CERN et David Rousseau, physicien des particules qui a dirigé les développements des logiciels hors-ligne, partagent une conviction : le big data apporte une solution majeure, il a permis une collaboration inédite

L’ensemble des éléments que nous utilisons, infrastructures, réseaux, ordinateurs, volume de données, s’appuient sur le big data. Sans lui, les collaborations et les cerveaux seraient inutiles. Il trouve également des applications auxquelles on ne pense pas au premier abord.

Le big data impose l’utilisation de structures adaptées, en particulier pour l’archivage et la pérennisation des données. Des capacités de stockage considérables sont désormais nécessaires et il faut recourir aux infrastructures distribuées, comme le cloud.

L’utilisation des données requiert également une puissance de calcul accrue », rappelle Célya Gruson-Daniel, cofondatrice de « HackYourPhd », plateforme communautaire à destination des doctorants.

L’Open science se situe donc à la croisée du monde de la recherche, des technologies numériques, de l’information, de la communication et des pratiques de cultures « open » émergentes.

« L’Open science est un courant qui questionne et remet en cause certaines pratiques actuelles. Pour autant, chaque pratique émergente porte des enjeux économiques et ouvre une niche ; les dérives sont toujours possibles. L’open data pose évidemment des questions éthiques, sous l’angle des données personnelles », souligne Célya Gruson-Daniel.

Les données redistribuent le pouvoir

Une nouvelle technologie n’affecte l’efficacité d’une organisation que si celle-ci se réorganise en même temps. Mais « qui gardera les gardiens » de la donnée ?

La séparation des pouvoirs peut être appliquée au big data « avoir le droit de savoir ce que vous savez sur moi et d’avoir une certaine autonomie sur mes données, comme le promeut le mouvement My Data », rappelle Henri Verdier.

Tout reste à faire sur le plan des règles déontologiques et légales qui s’appliqueront aux entreprises, dont la puissance viendra en grande partie de leur aptitude à utiliser les données. « La question ne sera peut-être pas celle de la surveillance, mais demandera sans doute un équilibre des pouvoirs. Nous n’en sommes qu’au début de l’histoire ».

Pour aller plus loin :

–      « L’ouvrage collectif « Big, fast et open data. Décrire, décrypter et prédire le monde : l’avènement des données », édité par l’EPITA et FYP Éditions, remporte le Prix du Livre Cyber lors du Forum International de la Cybersécurité 2015 », Blog Ionis Group.

–      « L’exposition « Terra Data » décode pour vous le monde des données », Big Browser, Le Monde.

–      « La Data Socialisation, prochaine révolution du Big Data ? », Webmarketing&com

–      « Présidentielle : la revanche des sondeurs sur les acteurs du Big Data », Les Echos.fr

–      « Big data is watching you », L’Humanité.fr