Enjeux, risques et mesures de protection des données confidentielles en apprentissage automatique
Pour cette présentation, nous mettrons en lumière trois aspects essentiels liés à la confidentialité et à la sécurité des données : – Les risques de sécurité en machine learning : Des mécanismes d’attaque révèlent les vulnérabilités des modèles et soulignent l’importance de la sécurité des données. – Confidentialité différentielle : En réponse à ces risques, la confidentialité différentielle est un cadre formel offrant des garanties mathématiques pour protéger les données sensibles au sein des modèles. – Apprentissage fédéré et données synthétiques : deux exemples de cadres qui reconfigurent la dissémination des données (et donc les enjeux afférant de souveraineté et de confiance), mais qui ne résolvent pas en soi les enjeux techniques (et juridiques) liés à la confidentialité. Il existe des logiciels open-source pour ces cadres, notamment DecLearn pour l’apprentissage fédéré.