Actualités
Tenez-vous informés des nouvelles du Self Data et du projet MesInfos : retrouvez nos dernières publications, comptes rendus des ateliers/des rencontres, et participez aux événements sur notre blog !

Un techos à MyData 2016

GDPR

Auteur : Guillaume Jacquart

Date : 7 octobre 2016



Dans la continuité de billets sur la conférence MyData 2016, voici un angle de vue technique de la conférence, qui permet de jeter un éclairage sur certaines formes d’architectures et enjeux liés au développement d’un écosystème d’innovation divers et dynamique.

Le Self Data n’est pas une innovation technologique

La conférence MyData et le mouvement Self Data en général n’ont pas été impulsés par une innovation technologique. Si Daniel Kaplan, Jamie Smith, Doc Searls, et d’autres ont mentionné l’innovation technologique, c’est pour rappeler un fait assez banal : la puissance de calcul, et les capacités de stockage sont devenues gigantesques et très bon marché, les organisations en ont des quantités, et les utilisateurs aussi (chez eux, dans leur poche, …) et nous avons échangé pendant trois jours pour essayer de rééquilibrer leur usage. Nous n’avons donc pas été étonnés, ni déçus de ne pas rencontrer de messie technologique lors de MyData.

Mieux, nous avons pu voir replacée à sa juste place l’innovation technologique à la mode : la blockchain. Dans la session consacrée à la Blockchain, Michele Nati (Digital Catapult RU) a très simplement rappelé les caractéristiques de cet outil, permettant à l’auditoire de conclure lui-même :
1. « Don’t store personal information to blockchain. Blockchain is open and everyone can see the contents. »
2. « Blockchain doesn’t link digital (data) to real humans, a real 3rd party is still required »
3. « Decentralisation dream : Blockchain release from the central authority needs, but move to code is law (and code may have errors (bugs !), and code is written by humans). »

La Blockchain reste néanmoins un outil puissant, qui offre des solutions intéressantes dans des cas d’usages de gestion des consentements et droits d’accès et dont la nature distribuée (et donc décentralisée) résonne avec le Self Data.

 

C’est quand même un sujet stimulant pour la technique

Cette volonté de redonner du pouvoir aux individus se traduit dans les solutions techniques, qui tendent à attribuer une entité technique à chaque individu. C’est évident sur les plateformes de cloud personnel (qui font partie du paysage des Pims, Personal Information Management Services/Systems, dont nous vous parlions dans notre article précédent) :
— certaines donnent à chaque individu une machine (virtuelle) distincte – Cozy, HAT
— d’autres s’appuient sur les ressources techniques individuelles des individus (Desktop et mobile pour Digi.me), hardware dédié pour Freedombox, ou hardware de son choix (Personium, Cozy si on le souhaite) ; sur le mobile pour la plateforme d’identification SingleID.
— d’autres ajoutent à cela l’aspect communautaire : le commun des données, s’appuie sur une mise en commun des ressources techniques utilisées, systèmes distribués type Matchupbox, Aeternam.

Toutes ces initiatives (ces entreprises en fait), explorent, approfondissent, investissent dans des technologies alternatives au cloud, en fait aujourd’hui concentré dans les data centers des GAFAs (et oui c’est un billet Français, nous nous devions donc d’utiliser l’acronyme GAFA !). Cela contribue à un mouvement plus large de (re-)décentralisation d’internet, poussé notamment par Tim Berners Lee.

Ces technologies ne sont pas indispensables au Self Data, et plusieurs acteurs n’en ont pas fait une priorité (Meeco et Fair&Smart par exemple, fonctionne plutôt sur un modèle centralisé), cependant, elles font partie des sujets que le Self Data stimule.

MyData a aussi été l’occasion d’aborder plusieurs thématiques du Self Data qui challengent les technologies.

Le consentement

 Allon Bar de https://rankingdigitalrights.org/, un site qui note les grandes entreprises sur leur privacy policies, leurs CGU etc.

Allon Bar de https://rankingdigitalrights.org/, un site qui note les grandes entreprises sur leur privacy policies, leurs CGU etc.

Sortir du TOSDR (Terms of services ; Didn’t read), aller à contre-courant d’un état de l’art qui tourne le dos à l’utilisateur depuis près de 20 ans. Si tous les acteurs du Self Data  donnent au consentement une place de premier choix, ce sont les institutionnels qui avancent le plus concrètement sur le sujet : les travaux portent à la fois sur l’ergonomie pour enfin approcher un consentement éclairé, mais aussi la formalisation des preuves de consentement. La Digital Catapult, avec le projet Real Consent explore ainsi les éléments d’ergonomie qui fonctionnent, ainsi que les éléments juridiques nécessaires pour constituer une preuve de consentement. La Tampere University of Technology présentait un prototype MyData orchestrant ce que pourrait être un consentement à la sauce Self Data, avec tous les éléments de contrôle nécessaire. Ces travaux ne manquent pas de similitudes avec le travail sur le défi juridique MesInfos .

La recherche sur le web, mais pas seulement …

Qwant et son moteur de recherche respectueux de la vie privée prouvent que la collecte de données opérée par exemple par Google n’est pas nécessaire pour un tel service. Qwant explore aussi tout un domaine qui s’ouvre, de services, de technologies puissantes sur les traitements de données, mis au service de l’individu sur ses propres données, comme un moteur de recherche.

Statistiques : croisements de données personnelles “CNIL compliant”

Big Data et protection des données personnelles sont souvent confrontés. Mais pour certains, comme pour Berit Skjernaa et son équipe du Security Lab de l’Alexandra Instituttet (Danemark) ce n’est qu’un défi à relever. Grâce à une architecture adaptée, et un peu de cryptographie, le projet ‘Confidential data analysis permet d’effectuer des statistiques sur des croisements de données personnelles, provenant de différents silos, tout en garantissant la confidentialité. Une piste pour un big data plus “éthique” ?

Algorithmes, inférence et données personnelles.

Plus que des innovations techniques, il s’agit aussi d’un état d’esprit (peut-être un nouvel état d’esprit). C’est en tous cas le propos Oguzhan Gencoglu, chercheur en intelligence artificielle. Les nouvelles technologies d’intelligence artificielle, notamment leur caractère apprenant et donc autonome, font aujourd’hui l’actualité, car on envisage de les placer dans des systèmes interagissant directement avec l’environnement. Mais leurs compétences et leurs dérives possibles touchent bien évidemment les données personnelles. Elles rendent aussi plausible les scénarios de ré-identification les plus farfelus (par exemple, il serait assez difficile pour un système de ce type d’éviter à ce que, en demandant l’adresse de l’individu, ce système reposant sur une machine apprenante (Machine Learning) n’en tire des conclusions sur ses origines, ses revenus, … en croisant automatiquement différentes données et en s’appuyant sur les caractéristiques du quartier). D’où la difficulté, et l’attention à apporter à tous ces algorithmes qui se disent impartiaux, ou anonymisants.

GDPR

Martin Vidberg illustre pour le G29 et la Cnil la portabilité des données

Un autre levier d’innovation pourrait bousculer les technologies ; déjà bien à l’esprit des acteurs du Self Data depuis plusieurs mois maintenant, le GDPR (General Data Protection Regulation) est un argument clé (même si classique, de mise en conformité avec de nouvelles normes) pour faire bouger les lignes d’ici 2018. Si tous se réclament d’offrir des éléments de solutions pour la conformité au GDPR, le GDPR a placé les entreprises détentrices de données personnelles comme cibles marketing prioritaires d’une partie des startups, notamment les plus récentes sur le sujet.

 

Entre besoin et volonté de standard : des protocoles communs pour réussir le multi-acteurs.

Dans les talks, dans les sessions, c’est vraiment la volonté de collaboration et d’unité des différents acteurs sur de multiples sujets techniques qui nous a frappés :
— Sur le consentement : une uniformisation internationale est indispensable pour que les solutions imaginées puissent fonctionner. De sorte que l’utilisateur, puisse prendre ses marques, et devienne à l’aise avec ces concepts au fur et à mesure des utilisations répétées des mêmes interfaces.
— Dans la transmission des données des détenteurs aux plateformes.
— Pour la ré-utilisation : Yle par exemple expliquait clairement qu’il ne serait jamais réutilisateur pour 10 systèmes techniques différents et incompatibles.

Cette volonté se traduit déjà par quelques projets fédérateurs :
UMA (User Managed Access) commence à rassembler des acteurs
— Les technologies suffisamment souples et adaptées comme OAuth ou OpenIdConnect sont mises en place.
— Des partenariats se nouent : Qwant avec Meeco et Cozy (afin d’en être le moteur de recherche au sein de ses données personnelles), Meeco et Cozy, …

Mais pour de nombreux chantiers, cette volonté ne se traduit pas (encore ?) dans les faits. Chacun propose sa propre solution, pensée pour être ouverte et universelle ; mais en même temps, chacune est aussi spécifique et peu mature que la proposition de solution du speaker suivant…

Lors de la conférence MyData nous avons pu avoir un tour d’horizon international des propositions techniques pour les défis du Self Data, de bon augure pour son avenir et sa capacité à assumer son expansion. Mais pour certains sujets, comme le consentement (élément clé de différentiation par rapport au paradigme actuel) ou les services réutilisateurs tiers (point clé du retard par rapport au paradigme actuel) que chacun souhaite unifiés à terme, et même si les acteurs ne se sentent pas encore prêts, il est sans doute déjà temps d’unifier la réflexion, les prototypes, les développements ; car la valeur de la solution n’est pas tant dans ses qualités intrinsèques, que dans le fait qu’il y en ait une seule, assumée et portée par tous.





Cet article a 3 commentaires


    ElyesBH

    RT @Expe_MesInfos: MyData2016 : La nouvelle technologie (révolutionnaire) du Self Data : https://t.co/RUhkSbKsZW




    jbpiacentino

    Un techos à MyData 2016. Belle synthèse de @jacquarg @mydata2016 https://t.co/eLSdwVQdUQ




    darmont_lyon2

    RT @Expe_MesInfos: MyData2016 : La nouvelle technologie (révolutionnaire) du Self Data : https://t.co/RUhkSbKsZW



Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>