Tirer profit du Big Data sans compromettre nos libertés (4/5)

the art of the cash register by joe robertson(CC BY-NC-ND 2.0) — joe robertson, CC-BY

Analyse de la proposition de Génération Libre qui souhaite voir nos données rémunérées en échange de leur collecte. Une idée qui ne protège pas nos libertés..

Par Philippe Mösching.

Le think tank Génération Libre, dirigé par Gaspard Koenig, propose d’instaurer une propriété des données personnelles. Permettant ainsi à son possesseur d’en faire commerce.

Mais est-ce que la nature même des données permet la possession ? Et finalement, est-ce que cela nous rendra plus libre ?

En introduction, telle une devise, le think tank Génération Libre affirme :

« Nos données nous appartiennent. »

Pour partie, cela est parfaitement vrai. Principalement dans le cas où on passe du temps, dépense de l’énergie, investit dans du matériel pour produire quelque chose qui peut être représenté sous forme de données : écrire un livre, réaliser une série de photos, rédiger un article, etc. Ces productions sont des données qu’on peut vouloir protéger d’un usage abusif.

Bien sûr, cette protection existe depuis longtemps sous la forme de brevet, licence, copyright. Et personne n’aurait idée de la contester, car elle est la contrepartie de l’investissement consenti par son auteur.

Dans son rapport « Mes data sont à moi. Pour une patrimonialité des données personnelles », le think tank propose d’appliquer la notion de propriété à l’ensemble des données issues de nos actions qu’elles soient volontaires ou non.

Un concept impossible car mal défini

La première difficulté est d’attribuer une donnée à son auteur. Dans les cas évoqués précédemment qui font intervenir un effort ou un investissement, il est simple de mesurer ces efforts et investissements et de partager la propriété des données résultantes à ceux qui ont fourni ces efforts.

Mais dans le cas de données involontaires ou de données dont l’origine n’est pas uniquement personnelle, à qui en attribuer la propriété ? Ma vitesse de déplacement dans le trafic est-elle une donnée qui m’appartient ? Alors qu’elle est la résultante de mon comportement, mais aussi de celui de centaines d’autres automobilistes. Est-ce que je dois partager la propriété avec tous ces gens ? Dans ce cas, je dois aussi la partager avec ceux qui auraient pu être dans le trafic avec moi, mais qui ont choisi un autre itinéraire.

De plus, il s’agit d’une donnée extraite de l’espace public, donc librement accessible à tous. Comme c’est mon téléphone qui a collecté et transmis cette information, on pourrait imaginer un dédommagement pour le service rendu, mais ce n’est pas de ça qu’il s’agit dans le rapport de Génération Libre.

Dans le domaine privé, on se heurte également à la même ambiguïté. Ma date de naissance est-elle ma propriété ou dois-je la partager avec mes parents, l’hôpital ou la sage-femme ? Tous peuvent revendiquer que cette données est aussi, partiellement, la conséquence de leurs actes. Même davantage que celle de mes propres efforts, peut-être !

On voit bien que ce concept très individualiste de propriété fonctionne bien pour un bien matériel ou pour des données produites suite à un effort individuel bien identifié. Mais les données produites étant souvent le fruit d’interactions sociales et environnementales, la propriété est difficile à attribuer. Ce qui ouvre la porte à de nombreux litiges.

Requérir un service, c’est déjà de la donnée

Deuxième difficulté, comment monnayer les données provenant de l’interaction même avec le fournisseur de service ? La commande d’un service est une donnée très précieuse, que je suis bien obligé de communiquer gratuitement si je veux obtenir un bien ou un service.

Prenons l’exemple du restaurant. Si je me rends au restaurant et que je passe commande, je fournis au restaurateur une information de très forte valeur qui l’utilisera pour mieux cibler son offre et optimiser ses commandes.

Selon le principe proposé par Génération Libre, je serais en droit de lui vendre ma commande car c’est une donnée personnelle. Alors que je n’ai pas d’autre choix si je veux être servi. De même que, de facto, je lui indique le jour et l’heure de mon passage, le nombre de personnes qui m’accompagnent, le temps que je compte passer dans son restaurant, etc.

Je pourrais lui proposer de me rémunérer pour ces données fournies. Dans ce cas, il intégrera ce coût dans son modèle d’affaires et il me facturera ce coût dans la note en fin de repas, ce qui ne changera rien par rapport à aujourd’hui, sauf gonfler artificiellement le PIB. Je pourrais alors opter pour ne pas lui vendre cette information. Comme je dois lui fournir ces données si je veux être servi, il devra m’assurer qu’il ne les exploitera pas.

À l’extrême, si tous les clients se comportent ainsi, ils paieront tous leur repas plus cher qu’aujourd’hui, et le restaurateur fera des achats de nourriture sans tenir compte des préférences de ces clients, ni des fluctuations de fréquentation. Favorisant ainsi l’inefficacité, les prix augmenteront, le gâchis aussi.

Tout le monde sera perdant, car ces données produisent de la connaissance, utilisée par le restaurateur pour optimiser son offre et donc mieux servir sa clientèle. Marchandiser cette information, c’est réduire l’efficacité, sans rien gagner d’autre en contrepartie.

Troisième difficulté, il est impossible de communiquer des données et demander à ce qu’elles ne soient pas exploitées. Comment m’assurer que le restaurateur n’utilise pas ces données de manière inconsciente ? Naturellement, il verra bien que tel plat se vend moins et donc diminuera ses stocks en conséquence ou le retirera de la carte. Même s’il s’est engagé à ne pas exploiter les données collectées. Les données se diffusent et s’exploitent de manière parfois inconsciente.

Quatrième difficulté, si mes données sont issues de mes actes, je peux en réclamer la possession. Mais mes actes affectent mon entourage et influencent les actes des autres qui produisent donc des données dérivées de mes actes et ceci sans que je puisse en revendiquer la propriété. Il suffit d’extraire les données, non pas à la source, mais à la suite d’un acte indirect, pour ne pas avoir à en payer le coût à la source.

Revenons à l’exemple du restaurateur qui s’engage à ne pas exploiter les données fournies. En fin de journée il pourra très bien constater l’état de ses stocks et ainsi optimiser ses achats et sa carte sans devoir rétribuer ses clients pour leurs choix. Les données de son stock lui appartiennent alors qu’elles sont dérivées des choix de ses clients. Les données se diffusent d’acteur en acteur sans relation contractuelle, rendant la marchandisation impossible.

Il existera aussi le même effet pervers qu’avec le RGPD, à savoir que le consommateur aura le choix d’accepter les règles imposées par le fournisseur de service ou de renoncer au service. Comment ne pas divulguer la destination de son prochain vol, lorsqu’on achète un billet d’avion. On est simplement contraint d’accepter les conditions. Les données à protéger sont parfois indissociables des biens ou services que nous souhaitons acheter.

On pourrait aussi avancer que ce système de monétisation encourage la production de données frauduleuses destinées à la vente, induisant ainsi des dérives dans les connaissances qui en sont dérivées.

Même sans monétisation ce phénomène a été observé en 2016 avec l’agent conversationnel Tay de Microsoft, lorsque plusieurs utilisateurs lui ont tenu des propos racistes et misogynes influençant son comportement et poussant Microsoft à arrêter ce service.

Alors imaginons ce qui pourrait se passer si des pirates pouvaient en soutirer un avantage financier. Les données à vendre sont facilement fabricables frauduleusement.

Un constat erroné

Gaspard Koenig s’insurge contre les bénéfices publicitaires dégagés par un célèbre réseau social et attribue ces gains à la seule exploitation des données pillées à ces usagers.

Il faut savoir que la source des recettes publicitaires est avant tout la fréquentation du réseau et non pas le ciblage. Certes le ciblage permet une meilleure efficacité et donc participe aux revenus, et les données collectées y participent. Mais le ciblage est également le fruit des technologies développées par le réseau.

Les revenus du réseau ne sont donc pas le résultat d’un pillage, mais la conséquence d’un service répondant à une demande et du développement d’une technologie. L’usager peut ne pas apprécier être soumis à la publicité, dans ce cas certains réseaux ont prévu une version payante sans publicité laissant ainsi la liberté à l’usager de ne pas y être soumis.

Le pacte softien que dénonce Génération Libre, où l’usager se fait piller ses données contre un service gratuit, a permis à de nombreuse entreprises d’offrir des services extrêmement performants à tous. Tout le monde est gagnant : l’usager qui a partagé ses données et qui bénéficie d’un service sur mesure, l’entreprise qui a globalement amélioré son service pour tous, la société qui retire les bénéfices de l’optimisation apportée.

Mieux protéger ?

Même si toutes ces difficultés étaient surmontées et que la société acceptait ce virage individualiste, serions-nous mieux protégés par la proposition de Génération Libre ? Rien ne le laisse supposer. La patrimonialité, donc la possible vente des données personnelles, ne signifie pas la protection du vendeur.

Au contraire, la monétarisation de ces données tentera l’acheteur d’en faire une utilisation la plus poussée que le contrat le permet. Alors que c’est la protection de la liberté qui doit être défendue avant la marchandisation.

Pas étonnant que Génération Libre affirme que sa proposition s’inscrit dans la continuité du RGPD (voir article précédent). De même que le RGPD, cette proposition ne fait pas la promotion d’une société basée sur la connaissance par la donnée, ni n’aborde la question de la protection des libertés par l’anonymat.

Au contraire, elle se base sur un individualisme renforcé, enfermant les utilisateurs dans le choix de se mettre en marge de la modernité ou d’être rémunérés pour accepter de voir leur liberté réduite. De même que dans le cadre du RGPD, la seule protection seront des conditions générales de en plus plus complexes.

Un système régressif

Alors que nous savons que le partage de connaissances permet le développement de nouvelles connaissances. Que le logiciel libre a véritablement fait exploser le développement de l’informatique peu avant le début du siècle. Que la diffusion libre des résultats de la recherche fondamentale alimente les autres chercheurs. Que le partage d’information en général est une valeur, non seulement altruiste, mais fortement productive pour la société. D’où, sans doute, notre biais altruiste. Qu’à chaque tentative de restreindre, contrôler, censurer, empêcher la circulation des informations la société a régressé. Voilà un risque que porte le projet de Génération Libre en nous poussant à monnayer nos données.

Revenons sur les données involontaires ; alors qu’elles ne coûtent rien à celui qui les a collectées, elles servent à créer de la connaissance qui sera mise au profit de tous. Grâce à une matière première gratuite et un traitement informatique vite amorti par les gains, le bilan est très positif. Il reste à bien le partager entre tous.

Dans le cas d’un système basé sur la monétisation des données, certains choisiront de ne pas les vendre pour protéger leur vie privée ; en contrepartie ils ne bénéficieront donc pas du service proposé (ou d’un service non-personnalisé et qu’ils devront payer) et en résultera une moindre qualité de service pour tous les autres usagers.

De plus, cette vision individualiste peut être perçue comme immorale, car elle rémunère des données produites alors qu’aucun effort n’a été fourni.

Pour la protection des libertés et non pas la monétisation

Néanmoins Gaspard Koenig révèle à raison un certain nombre de dérives : la spirale d’enfermement engendrée par des propositions qui correspondent à nos choix passés, la traçabilité pesant sur nos libertés, les risques de fuites de données.

Mais il propose comme défense la monétisation en contrepartie de ces risques, alors qu’il faudrait s’interroger sur la façon de lutter contre ces dérives tout en permettant de construire des connaissances issues de nos données et en faire profiter chacun.

Conclusion

Impossible à mettre en œuvre, ouvrant ainsi la voie à une avalanche de litiges et de fraudes, complexifiant encore plus les relations contractuelles, la patrimonialité des données ne protégera pas plus qu’aujourd’hui nos libertés.

Le principe de monétisation des données personnelles se fonde sur un principe individualiste de propriété appliqué aux données alors que l’économie de la connaissance par les données se fonde sur la collecte de données la plus large possible et leur libre partage. Ces deux approches sont incompatibles.

Monétiser ses données, c’est tuer la connaissance par les données, c’est priver la société de l’extraordinaire pouvoir que l’exploitation de ces données peut nous offrir. C’est aussi faire le deuil de projets nécessaires et qui dépassent la société humaine, comme la mesure de l’impact environnemental par les comportements humains : déplacements, consommation, habitudes alimentaires, besoin en énergie, dont l’objectif est de mieux connaître pour mieux servir à moindre impact.

Préparons la diffusion fluide et en masse des données, en protégeant les libertés de chacun par l’anonymat. Ce sera le thème du cinquième et dernier article de cette série.

Vous souhaitez nous signaler une erreur ? Contactez la rédaction.