Differential privacy for metric spaces : information-theoretic models for privacy and utility with new applications to metric domains - Laboratoire d'informatique de l'X (LIX) Accéder directement au contenu
Thèse Année : 2021

Differential privacy for metric spaces : information-theoretic models for privacy and utility with new applications to metric domains

Confidentialité différentielle pour les espaces métriques : modèles théoriques de l'information pour la confidentialité et l'utilité avec de nouvelles applications aux domaines métriques

Résumé

Differential privacy, introduced by Dwork et al. in 2006, has become the benchmark for data privacy in statistical datasets. Despite its widespread popularity, its use in other domains has been relatively limited. In this thesis, we explore a generalisation of differential privacy for metric domains known as d-privacy. Our approach incorporates an information-theoretic framework for analysing information flows, which allows us to provide a structural characterisation of d-privacy and analyse its privacy and utility properties. Using information flow analysis we examine the leakage order of channels induced by the privacy parameter epsilon, we find a new characterisation for optimal mechanisms, extending existing results in the area of universal optimality, and we re-examine the privacy-utility trade-off for oblivious and local differential privacy workflows. Finally, we demonstrate the applicability of d-privacy to novel and complex domains with example applications in text document privacy, statistical utility and private nearest neighbour search.
La "differential privacy", introduite par Dwork et al. en 2006, est devenue la référence en matière de protection de la vie privée dans les ensembles de données statistiques. Malgré sa popularité généralisée, son utilisation dans d'autres domaines a été relativement limitée. Dans cette thèse, nous explorons une généralisation de la "differential privacy" pour les domaines métriques appelés d-privacy. Notre approche intègre un cadre théorique de l'information pour analyser les flux d'informations, ce qui nous permet de fournir une caractérisation structurelle de la d-privacy et d'analyser ses propriétés de confidentialité et d'utilité. En utilisant l'analyse des flux d'informations, nous examinons l'ordre de fuite des canaux induit par le paramètre de confidentialité epsilon, nous trouvons une nouvelle caractérisation des mécanismes optimaux, étendant les résultats existants dans le domaine de l'optimalité universelle, et nous réexaminons le compromis privacy-utility pour flux de l'information dans un contexte "oblivious" et local. Enfin, nous démontrons l'applicabilité de la d-privacy à des domaines nouveaux et complexes avec des exemples d'applications dans la confidentialité des documents texte, l'utilité statistique et la recherche confidentielle des nearest neighbours.
Fichier principal
Vignette du fichier
99009_FERNANDES_2021_archivage.pdf (6.61 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03344453 , version 1 (15-09-2021)

Identifiants

  • HAL Id : tel-03344453 , version 1

Citer

Natasha Fernandes. Differential privacy for metric spaces : information-theoretic models for privacy and utility with new applications to metric domains. Information Theory [cs.IT]. Institut Polytechnique de Paris; Macquarie University (Sydney, Australie), 2021. English. ⟨NNT : 2021IPPAX030⟩. ⟨tel-03344453⟩
146 Consultations
400 Téléchargements

Partager

Gmail Facebook X LinkedIn More