La technologie d’attribution respectueuse de la vie privée de Mozilla

Dans le sillage de Google et de Facebook, Mozilla a introduit sa propre technologie pour remplacer les cookies tiers : intéressons-nous au fonctionnement de l’attribution respectueuse de la vie privée.

En juillet 2024, avec la dernière version de son navigateur Firefox, Mozilla a introduit une technologie appelée Attribution respectueuse de la vie privée (PPA), conçue pour vérifier l’efficacité de la publicité en ligne. La fonctionnalité est activée par défaut dans Firefox 128.

Les défenseurs de la vie privée en ligne s’en sont déjà préoccupés et ont fait paraître des titres tels que « Maintenant, Mozilla vend aussi les données de ses utilisateurs ». Le bruit a été si fort que le directeur technique de Firefox, Bobby Holley, a dû intervenir sur Reddit pour expliquer aux utilisateurs ce que Mozilla a réellement fait et pourquoi.

Le moment est venu d’examiner de plus près ce qu’est l’APP, pourquoi cette technologie est nécessaire dans un premier temps et pourquoi elle est apparue aujourd’hui.

Google Ad Topics et l’historique des liens Facebook

Tout d’abord, un peu d’histoire. Comme vous vous en souvenez peut-être, en 2019, les développeurs du navigateur le plus populaire au monde, Google Chrome, ont commencé à élaborer des plans pour désactiver complètement la prise en charge des cookies tiers.

Ces minuscules fichiers suivent les actions des utilisateurs en ligne depuis maintenant 30 ans. Cette technologie est à la fois l’épine dorsale de l’industrie de la publicité en ligne et le principal moyen de porter atteinte à la vie privée des utilisateurs.

Il y a quelque temps, en remplacement, Google a dévoilé un développement interne appelé Ad Topics. Dans le cadre de cette technologie, le suivi repose sur l’historique du navigateur Chrome et l’historique des interactions avec les applications Android. Le déploiement d’Ad Topics était censé aboutir à la fin progressive de la prise en charge des cookies tiers dans Chrome au second semestre 2024.

Meta est un autre acteur majeur de la publicité numérique qui a développé sa propre technologie de suivi des utilisateurs et qui s’appuie également sur des cookies de tiers. Baptisée Historique des liens, elle permet de s’assurer que tous les liens externes des applications mobiles Facebook s’ouvrent désormais dans le navigateur intégré de Facebook, où l’entreprise peut continuer à espionner vos faits et gestes.

En fin de compte, l’arrêt de la prise en charge des cookies tiers confère davantage de contrôle à Google et Meta, respectivement propriétaire du navigateur et du système d’exploitation mobile les plus populaires au monde, et du réseau social le plus populaire au monde, tandis que les petits acteurs deviendront encore plus dépendants d’eux.

Parallèlement, les données des utilisateurs continuent d’être collectées à l’échelle industrielle, principalement par les suspects habituels en matière de violation de la vie privée : oui, Google et Facebook.

La question est de savoir s’il n’est pas possible de mettre au point un mécanisme permettant aux annonceurs de suivre l’efficacité de la publicité sans collecter massivement des données sur les utilisateurs. La réponse est apportée par l’attribution respectueuse de la vie privée.

Prio, un système d’agrégation respectueux de la vie privée

Pour mieux comprendre l’histoire de cette technologie, il faut remonter un peu dans le temps, jusqu’en 2017, lorsque les cryptographes Henry Corrigan-Gibbs et Dan Boneh de l’université de Stanford ont présenté un document de recherche. Ils y décrivent un système de collecte de statistiques agrégées axé sur la protection de la vie privée, qu’ils ont baptisé Prio.

Pour simplifier grandement les choses, Prio repose sur le mécanisme suivant. Supposons que vous soyez intéressé par l’âge moyen d’un certain nombre d’utilisateurs, mais que vous souhaitiez préserver leur vie privée. Vous préparez deux (ou plusieurs) tirelires et demandez à chaque utilisateur de compter le nombre de pièces correspondant à son âge et, sans les montrer à personne, de les déposer au hasard dans différentes tirelires.

Ensuite, vous faites basculer les pièces des tirelires dans un tas, vous les comptez et vous les divisez par le nombre d’utilisateurs. Le résultat est celui souhaité : l’âge moyen des utilisateurs. Et si au moins une des tirelires garde son secret (c’est-à-dire qu’elle ne révèle à personne ce qu’elle contient), il est impossible de déterminer combien de pièces un utilisateur donné a mis dans les boîtes.

Le principe de fonctionnement de Prio

Les principales étapes du traitement de l’information selon Prio. Source

Prio superpose ce mécanisme de base avec beaucoup de cryptographie pour protéger les informations contre l’interception et garantir la validité des données reçues. Il est impossible pour les utilisateurs de glisser des réponses dans le système, pour quelque raison que ce soit, qui pourraient fausser les résultats. Le concept principal réside dans l’utilisation de deux ou plusieurs agrégateurs qui collectent des parts aléatoires des informations recherchées.

Les algorithmes de Prio présentent une autre particularité essentielle : ils améliorent considérablement les performances du système par rapport aux méthodes précédentes de collecte fiable de données anonymes – de 50 à 100 fois, affirment les chercheurs.

Protocole d’agrégation distribuée

Mozilla s’est intéressé à Prio en 2018. Le premier fruit de cet intérêt a été le développement du système expérimental Firefox Origin Telemetry, basé sur Prio. Ce système a notamment été conçu pour recueillir en privé des données télémétriques sur la capacité du navigateur à lutter contre les systèmes de suivi publicitaire.

Ensuite, en février 2022, Mozilla a dévoilé la technologie Interoperable Private Attribution (IPA), développée conjointement avec Meta, qui, semble-t-il, a servi de prototype à la technologie PPA.

L’avant-projet du protocole DAP (protocole d’agrégation distribuée) basé sur Prio a été publié en mai 2022. Le projet a été rédigé par des représentants de Mozilla et de l’Internet Security Research Group (ISRG) – une organisation à but non lucratif connue pour le projet Let’s Encrypt visant à démocratiser l’utilisation du protocole HTTPS – ainsi que par deux employés de Cloudflare.

Tout en travaillant sur le protocole, l’ISRG a également mis au point un système de collecte de statistiques anonymes basé sur le protocole DAP, connu sous le nom de Divvi Up. Ce système est principalement destiné à collecter diverses données télémétriques techniques pour améliorer les performances d’un site Internet, comme le temps de chargement des pages.

Principe de fonctionnement du protocole DAP

Représentation schématique du principe de fonctionnement du protocole DAP. Source

Enfin, en octobre 2023, Divvi Up et Mozilla ont annoncé une collaboration visant à mettre en œuvre le protocole DAP dans le navigateur Firefox. Dans le cadre de cet effort commun, un système de deux agrégateurs a été créé, l’un du côté de Mozilla, l’autre du côté de Divvi Up.

Comment fonctionne la technologie APP

C’est ce système Divvi Up/Mozilla qui est actuellement déployé avec la technologie PPA. Il s’agit pour l’instant d’un test portant sur un nombre limité de sites.

Dans les grandes lignes, voici son fonctionnement :

  • Le site Internet demande au navigateur de se souvenir des cas de visualisation réussie des annonces.
  • Si l’utilisateur effectue une action que le site considère comme étant utile (par exemple, acheter un produit), le site interroge le navigateur pour savoir si l’utilisateur a vu l’annonce.
  • Le navigateur ne communique rien au site, mais envoie des informations aux serveurs d’agrégation par le biais du protocole DAP.
  • Tous ces rapports sont accumulés dans des agrégateurs, et le site reçoit périodiquement un résumé.

Le site apprend ainsi que sur X utilisateurs ayant vu une certaine annonce, Y utilisateurs ont effectué des actions jugées utiles pour le site. Mais ni le site ni le système d’agrégation ne savent qui étaient ces utilisateurs, ce qu’ils ont fait d’autre en ligne, etc.

Pourquoi avons-nous besoin de la technologie PPA ?

Dans la publication susmentionnée sur Reddit, le directeur technique de Firefox a expliqué l’objectif poursuivi par Mozilla en introduisant la technologie PPA avec la nouvelle version de son navigateur.

Le raisonnement de l’entreprise est à peu près le suivant. La publicité en ligne, du moins à ce stade du développement du réseau Internet, est un mal nécessaire. Il est donc compréhensible que les annonceurs souhaitent en mesurer l’efficacité. Cependant, les outils actuellement utilisés à cette fin ne tiennent pas compte de la vie privée des utilisateurs.

Entre-temps, toute discussion sur les façons de restreindre d’une manière ou d’une autre le suivi des actions des utilisateurs par les publicitaires se heurte aux protestations des premiers. L’absence de collecte de données signifie, selon eux, qu’ils sont privés d’un outil d’évaluation de la publicité en ligne.

Fondamentalement, la technologie PPA est un outil expérimental qui permet aux annonceurs d’obtenir le retour d’information dont ils ont besoin sans collecter ni stocker de données sur les actions des utilisateurs.

Si l’expérience démontre que la technologie peut répondre aux besoins des annonceurs, les défenseurs de la vie privée disposeront d’un argument de poids dans leurs futures négociations avec les régulateurs et les législateurs. D’une manière générale, elle prouvera que la surveillance totale en ligne n’est pas nécessaire et qu’elle devrait être limitée par la loi.

Bloquer les cookies de tiers maintenant

Il se trouve que presque immédiatement après le tollé suscité par le nouveau déploiement de Mozilla, Google a annoncé que la société revenait complètement sur ses projets de désactivation des cookies tiers. Se débarrasser d’une technologie dépassée peut être plus difficile qu’il n’y paraît, comme l’a constaté Microsoft en essayant d’enterrer Internet Explorer.

La bonne nouvelle, c’est que, contrairement à Internet Explorer, qu’il est difficile d’éliminer de Windows, les utilisateurs peuvent se débrouiller seuls avec les cookies tiers. Tous les navigateurs modernes permettent de les bloquer facilement (cf. notre guide pour plus de détails).

Rappelons que le refus de Google de se débarrasser des cookies ne signifie pas la fin d’Ad Topics. En effet, l’entreprise a l’intention de poursuivre l’expérience. Nous vous recommandons donc de désactiver cette fonctionnalité, et voici comment le faire dans Chrome et Android.

Si vous utilisez l’application mobile Facebook, il est judicieux de désactiver l’historique des liens. Là encore, notre guide explique la marche à suivre.

En outre, vous pouvez et devriez utiliser la fonction de navigation privée dans nos formules d’abonnement Kaspersky Standard, Kaspersky Plus et Kaspersky Premium pour bloquer les systèmes de suivi publicitaire (qui n’utilisent pas tous des cookies).

Enfin, nous vous recommandons d’utiliser notre service gratuit Privacy Checker, qui vous guidera dans la configuration de la confidentialité des applications, des services et des réseaux sociaux les plus couramment utilisés, et ce, pour différents systèmes d’exploitation.

En ce qui concerne la technologie PPA, celle-ci semble assez utile. Si vous n’êtes pas convaincu, voici la marche à suivre pour la désactiver dans Firefox. Pour ma part, je préfère soutenir le développement de cette technologie et je continuerai donc à l’utiliser dans mon navigateur.

Conseils