Lamphone : une nouvelle méthode d’écoute visuelle

La méthode Lamphone n’a besoin que d’une ampoule pour écouter la conversation tenue dans une pièce insonorisée.

Il n’y a pas si longtemps, nous avons rédigé un article au sujet des méthodes utilisées par Mordechai Guri et ses collègues de l’Université Ben-Gurion du Néguev pour extraire les informations d’un dispositif non connecté à Internet et physiquement isolé du réseau. Lors de la conférence Black Hat USA 2020, un autre chercheur de l’Université de Ben-Gurion du Néguev a présenté un rapport sur un sujet similaire. Ben Nassi a parlé d’une méthode d’écoute visuelle que lui et ses collègues appellent « Lamphone ».

Nous allons vous expliquer comment fonctionne Lamphone mais commençons par une petite introduction sur l’histoire de ce problème.

Comment est-il possible de voir du son ?

Une technologie bien connue pour enregistrer le son à distance grâce à une méthode visuelle est le microphone laser. Cette technique est assez évidente.

Les personnes qui mettent une conversation sur écoute pointe le faisceau laser qui opère en infrarouge (et est donc invisible à l’œil nu) vers une surface adéquate (généralement une vitre) de la pièce où la conversation a lieu. Le faisceau se reflète sur la surface et atteint le récepteur. Les ondes sonores créent des vibrations sur la surface de l’objet qui, en retour, modifie l’apparence du faisceau laser reflété. Le récepteur enregistre les variations qui peuvent ensuite être converties en son afin d’obtenir un enregistrement de la conversation.

Cette technologie est utilisée depuis l’époque de la guerre froide et est apparue dans de nombreux films d’espionnage. Vous l’avez sûrement vue dans l’un d’entre eux. Plusieurs entreprises fabriquent des dispositifs tout prêts de système d’écoute par laser et leur champ d’action est compris entre 500 et 1000 mètres. Vous craignez d’être pris pour cible par un microphone laser ? Ne vous inquiétez pas, nous avons deux bonnes nouvelles. Tout d’abord, les microphones laser sont très chers. Ensuite, les fabricants ne vendent des microphones laser qu’aux organismes gouvernementaux (ou du moins c’est ce qu’ils disent).

Pourtant, selon Nassi, la nature active du microphone laser est un sérieux inconvénient. Pour que ce système d’écoute fonctionne, le faisceau laser doit « illuminer » une surface et cela signifie qu’un détecteur infrarouge peut le déceler.

Il y a plusieurs années de cela, un groupe de chercheurs de l’Institut de technologie du Massachusetts (Massachusetts Institute of Technology) a proposé une autre méthode d’enregistrement visuel qui était complètement passive. Leur idée était sensiblement la même : les ondes sonores créent des vibrations sur la surface d’un objet. Les vibrations sont bien sûr enregistrées.

Pour enregistrer les vibrations, les chercheurs ont utilisé une caméra haute vitesse qui enregistrait plusieurs milliers d’images par seconde. En comparant les images de la caméra (à l’aide d’un ordinateur), ils ont pu reproduire le son à partir de la séquence des images vidéo.

Cette méthode a aussi un inconvénient et il n’est pas des moindres. Les ressources informatiques nécessaires pour convertir cette massive quantité d’informations visuelles capturées par la caméra haute vitesse en son sont considérables. Même en utilisant un poste de travail extrêmement puissant les chercheurs du MIT ont mis entre 2 et 3 heures pour analyser un enregistrement vidéo de 5 secondes. Il est évident que cette approche n’est pas idéale pour écouter des conversations à la volée.

Fonctionnement de Lamphone

Nassi et ses collègues ont découvert une nouvelle technique d’ « écoute visuelle » qu’ils ont appelée « Lamphone ». L’idée principale consiste à utiliser une ampoule (d’où le nom de cette technique) comme objet à partir duquel vous pouvez capturer les vibrations causées par le son.

Une ampoule est un objet particulièrement banal et brillant. Par conséquent, si quelqu’un utilise les vibrations d’une ampoule, il n’a pas besoin de dépenser en ressources informatiques pour analyser les changements extrêmement subtils dans l’image. Il suffit de diriger un télescope puissant vers l’ampoule, puis le télescope envoie le flux de lumière de l’ampoule vers un capteur électro-optique.

L’ampoule émet une lumière qui ne part pas uniformément dans plusieurs directions. Curieusement, l’irrégularité varie aussi selon les différents types d’ampoules, puisqu’elle est particulièrement élevée avec les ampoules LED et à incandescence mais beaucoup plus basse avec les ampoules fluorescentes. Cette irrégularité génère les vibrations de l’ampoule (causées par les ondes sonores) et modifie légèrement l’intensité du flux de lumière que le capteur électro-optique enregistre. Ces changements sont suffisamment perceptibles pour être enregistrés. Après avoir enregistré les changements et fait quelques modifications assez simples, les chercheurs ont pu récupérer le son obtenu par cet « enregistrement lumineux ».

Pour tester leur méthode, les chercheurs ont installé un dispositif d’écoute sur un pont piéton qui se trouvait à 25 mètres de la fenêtre de la pièce où le son était émis par un haut-parleur. En dirigeant le télescope vers l’ampoule de la pièce, les chercheurs ont pu enregistrer les variations lumineuses et les convertir en enregistrement sonore.

Les enregistrements obtenus étaient assez compréhensibles. Par exemple, Shazam a pu identifier les chansons utilisées pour ce test, à savoir « Let It Be » des Beattles et « Clocks » de Coldplay, et le service de reconnaissance vocale de Google a correctement transcrit les mots d’un discours prononcé par Donald Trump lors de sa campagne.

La méthode Lamphone est-elle une vraie menace ?

Nassi et ses collègues ont développé une méthode d’ « écoute visuelle » vraiment opérationnelle. Plus important encore, cette méthode est complètement passive et il est donc impossible de la détecter à l’aide d’un capteur.

Il convient également de souligner que, contrairement à la méthode pionnière des chercheurs du MIT, les calculs nécessaires pour décoder les enregistrements Lamphone sont extrêmement simples. Comme le processus ne requiert aucune ressource informatique importante, la méthode Lamphone peut être utilisée en temps réel.

Pourtant, Nassi reconnaît que le volume du son émis dans la pièce lors du test était particulièrement élevé. Pour le moment, les résultats de ce test sont intéressants d’un point de vue théorique. D’autre part, nous ne devrions pas sous-estimer la simplicité des méthodes utilisées pour convertir l’ « enregistrement lumineux » en son. Cette technique pourrait éventuellement être affinée en utilisant des algorithmes d’apprentissage automatique, par exemple, qui excellent dans ce genre de tâches.

À ce stade, les chercheurs évaluent la possibilité actuelle d’utiliser cette technique en pratique sans qu’elle ne soit ni trop difficile ni trop simple ; il faut trouver le juste milieu. Ils avaient pourtant prévu que cette méthode pourrait devenir plus pratique si quelqu’un pouvait mettre en place des algorithmes sophistiqués pour convertir les données du capteur électro-optique en enregistrements sonores.

Conseils