GT3 – Collecte de données personnelles & traitements algorithmiques

Le GT 3 se focalise sur la transparence en matière de collecte de données personnelles et de traitement algorithmique.

La thématique centrale

Le Règlement Général sur les Données Personnelles (RGPD) fait peser sur les responsables de traitement des obligations d’information des personnes sur la collecte et le traitement de leurs données personnelles. Cependant des questions complexes se posent sur la manière de communiquer cette information (format, medium, design de l’interface, moment, contenu précis, etc.) de façon à attirer l’attention des personnes concernées et à favoriser leur compréhension.

Ces exigences sont encore plus difficiles à assurer avec le développement de l’internet des objets et l’évolutivité des finalités dans le cadre de l’analyse de données massives (« big data »). Par ailleurs, il est important de pouvoir fournir des explications sur les traitements eux-mêmes, notamment quand ils mettent en jeu des algorithmes d’aide à la décision. Ces explications peuvent être utiles pour renforcer les droits des personnes concernées (contestation d’une décision, détection de discriminations, etc.).

De manière plus générale, il convient également de vérifier si, et dans quelle mesure, la transparence est un facteur d’empowerment, pour l’individu voire pour certaines communautés ainsi que pour le régulateur, et de définir les types de transparence et leur articulation avec d’autres principes et droits comme ceux de protection de la vie privée et de la propriété intellectuelle. Le groupe travaillera donc aussi bien sur les aspects conceptuels (définitions et complémentarités des différentes notions) que sur la conception de nouvelles méthodes et outils pour renforcer la transparence. À cet égard, des collaborations entre informaticiens, juristes, psychologues, éthiciens et designers en particulier sera particulièrement encouragée.

Les exemples partagés

Seront notamment envisagés l’exigence de motiver une décision et le droit de la contester, dès lors notamment que celle-ci a un impact significatif sur les personnes concernées. Exemples frappants en la matière:

  • le logiciel COMPAS utilisé dans de nombreux tribunaux américains pour évaluer le risque de récidive de prévenus
  • les décisions conduisant à livrer un diagnostic médical, à  proposer un parcours de soin, à formuler des offres d’emploi et de formation (Parcoursup), ou encore une offre d’accès aux crédits bancaires.

L’analyse portera aussi sur les enjeux de la transparence pour préserver le respect d’intérêts collectifs, par exemple :

  • le maintien du pluralisme lorsque la décision concerne l’offre culturelle ou la construction de l’opinion par les médias.

Les disciplines présentes

Le groupe travaillera aussi bien sur les aspects conceptuels (définitions et complémentarités des différentes notions) que sur la conception de nouvelles méthodes et outils pour renforcer la transparence. À cet égard, des collaborations entre informaticiens, juristes, psychologues, éthiciens et designers en particulier sera particulièrement encouragée.

Décryptages

La traduction littérale de « big data » est « grosses données ». On lui préfère le terme de « données massives ».
Cette gigantesque masse de données numériques massives (textes, photos, vidéos, etc.), combinées aux capacités sans cesse accrues de stockage et à des outils d’analyse en temps réel de plus en plus sophistiqués offrent aujourd’hui des possibilités inégalées d’exploitation des informations. Les ensembles de données traités correspondant à la définition du big data répondent à trois caractéristiques principales : volume, vélocité et variété.
(source : CNIL)

L’internet des objets (idO), ou Internet of Things (IoT) en anglais, fait référence à des choses, objets du quotidien, lieux du monde physique connectés, capables de communiquer via Internet aussi bien avec vous qu’avec d’autres appareils/choses/objets connectés.