anonymisation
Le répertoire anonymisation fournit une méthode, des outils et des références sur l'anonymisation des données à caractère personnel.
Objectifs et usages
Ce projet a pour objectif :
- D'introduire l'utilisateur et le producteur de données aux enjeux de l'anonymisation, d'un point de vue juridique, scientifique et technique.
- De construire un espace collaboratif autour de ce thème.
- De proposer une méthode robuste et testée de k-anonymisation de données.
Contenu
Plus précisément, cet espace est constitué d'un wiki permettent de détailler et de comprendre l'anonymisation. Le code formalise le traitement de k-anonymisation et, en guise de cas pratique, est notamment appliqué à la base Transparence Santé. Le détail des différentes étapes est disponible ici : Transparence Santé. Un autre exemple est appliqué sur la base du fichier des équidés.
Données
Les données exploitées pour tester notre algorithme peuvent être téléchargées :
- Transparence Santé (data.gouv.fr)
- Enrichissement des données (INSEE)
- Fichier des équidés (data.gouv.fr)
Installation
pip install anonymizer
Qui sommes-nous ?
Ce projet est développé par l'équipe de l'Administrateur Général des Données (AGD), en collaboration avec toutes les bonnes volontés et les producteurs de données à caractère personnel. Le forum d'Etalab est aussi ouvert à toute question, remarque ou suggestion. Une consultation sur les logiciels d'anonymisation y a notamment été initiée.