Le nouveau logiciel d'Interpol reconnaîtra les criminels à leur voix

Dr.Mo7oG
22 mai 2018
6 min de lecture

Le plus grand réseau de police du monde est en train d'évaluer un logiciel qui permettrait de faire correspondre des échantillons de discours tirés d'appels téléphoniques ou de messages sur les médias sociaux à des enregistrements vocaux de criminels stockés dans une énorme base de données partagée par les organismes d'application de la loi.

La plate-forme, telle que décrite par les développeurs, utiliserait plusieurs algorithmes d'analyse de la parole pour filtrer les échantillons de voix selon le sexe, l'âge, la langue et l'accent. Il sera géré par Interpol à sa base de Lyon, en France, dans le but d'accroître l'exactitude des données vocales et de renforcer sa fiabilité et sa recevabilité judiciaire. L'équipe de développement a terminé avec succès les essais sur le terrain du système en mars et novembre 2017. Le prochain examen de projet aura lieu en juin prochain à Bruxelles. Bien que le système puisse traiter n'importe quel son "légalement intercepté", y compris les conversations ambiantes, son utilisation prévue serait de faire correspondre les voix glanées dans les médias téléphoniques et sociaux avec une base de données "liste noire". Les échantillons peuvent provenir d'enregistrements mobiles, de lignes terrestres ou de voix sur protocole Internet, ou encore d'extraits audio capturés à partir de vidéos de recrutement ou de propagande postées sur les médias sociaux. Ces données enregistrées deviennent essentiellement un widget sur une ligne de production. Ce fichier, le clip vocal capturé, peut déjà inclure des métadonnées descriptives ajoutées par les responsables de l'application de la loi qui l'ont initialement sécurisé. Le logiciel tente alors d'ajouter de nouvelles informations sur l'âge ou l'accent du locuteur, par exemple. Pour faciliter cette tâche, la plate-forme SIIP créerait un modèle d'enregistrement d'un appel téléphonique par la police, marquant les caractéristiques acoustiques qui représentent les voix sur le clip. Ces caractéristiques, ou vecteurs d'identité, sont ensuite utilisés pour essayer de trouver des correspondances dans la base de données.

Pour créer le logiciel, les développeurs ont aligné des algorithmes, ou modules, pour trier les échantillons de voix nouvellement enregistrés par une chaîne de traitement construite sur une architecture open-source. Les rapports intérimaires, publiés en juin 2016, mai 2017 et février 2018, indiquent que les défis de la mise en place d'un tel système comprenaient la mise en place d'outils pour filtrer le bruit de fond, améliorer la clarté de la voix, isoler les sons et faciliter le partage, la collecte et la classification des données pour les applications tant au quartier général de la police que sur le terrain. Le but est de pouvoir comparer un nouvel enregistrement à une très grande base de données d'échantillons sonores stockés dans une base de données qui peut contenir plus d'un million d'enregistrements. Cette base de données serait gérée par Interpol ; les dossiers seraient remplis par les organismes d'application de la loi membres de l'institution. Ces organismes, provenant de 192 pays, auraient accès au système.

La plateforme peut également faire correspondre des échantillons de voix provenant de plateformes de médias sociaux, notamment Twitter, Google+, LinkedIn, YouTube et Facebook. En parcourant le contenu multimédia en fonction de critères de recherche tels que la pertinence linguistique et la géolocalisation, le système étiquettera et traitera ce matériel et trouvera des clips similaires dans la base de données. Le moteur de traitement vidéo du logiciel peut extraire l'audio d'une vidéo en ligne, le diviser en mono et le formater en fichiers WAV 16 kilohertz non compressés. Les contenus audio peuvent également être recherchés et étiquetés de cette manière. La coordination du projet est assurée par Verint, une société de " intelligence actionnable " basée à New York et en Israël. Les racines de Verint se trouvent dans l'enregistrement commercial des appels - pensez à l'ouïe "cet appel peut être enregistré à des fins de contrôle de qualité et de formation". L'entreprise a travaillé avec Airbus, Singular Logic et Nuance pour développer le système, avec des composants de repérage de mots-clés des Sail Labs de Vienne et de l'association suisse de recherche IDIAP. Des groupes de sécurité aux Pays-Bas et au Royaume-Uni ont étudié les aspects éthiques du projet. Interpol, les Carabinieri italiens, la Metropolitan Police du Royaume-Uni, le Bundeskriminalamt allemand et la Policia Judiciaria du Portugal ont contribué à l'application de la loi. Comme dans le domaine plus large de la surveillance automatisée de la voix, le projet suscite des réactions complexes. "Je considère que la reconnaissance vocale entre les mains de la police et des services secrets est très dangereuse. J'ai des objections ", dit Matthias Monroy, un militant berlinois qui édite un journal des droits civiques. M. Monroy surveille l'effort du PIIE depuis son lancement en 2014. Paul Johannes, associé de recherche en droit commercial à l'Université de Kassel et membre du Forum Privatheit, une organisation de protection de la vie privée numérique basée à Berlin, affirme que les forces de l'ordre sont toujours à la recherche d'outils dans une course contre les nouvelles techniques mises au point par des organisations criminelles ou terroristes.

Mais le contexte politique est tout, dit Maya Wang, chercheuse principale et experte en Chine chez Human Rights Watch, qui a récemment contribué à la production d'un rapport critiquant le travail du gouvernement de Beijing visant à créer une base de données d'échantillons de voix améliorés par l'intelligence artificielle. Elle voit un contexte tripolaire : il y a la Chine et son "Wild East" de surveillance, sans protection significative, par opposition à des règles plus strictes en Europe, et un cadre plus souple aux États-Unis qui est toujours lié à une société civile dynamique et à la primauté du droit. Selon Wang, le potentiel malveillant de la reconnaissance vocale automatisée dépend de l'endroit où elle est utilisée. Pour compliquer les choses, l'Union européenne est sur le point d'adopter son règlement général sur la protection des données (GDPR), un vaste ensemble de mesures relatives à la protection de la vie privée des consommateurs. Les avis divergent quant à l'impact de la directive sur les outils de reconnaissance vocale tels que le SIIP. Johannes dit que le GDPR a une directive "jumeaux oubliés" qui réglemente le traitement des données personnelles par la police ou les services de renseignement et fixe les règles de sa libre circulation. De nombreux organismes d'application de la loi utilisent déjà des progiciels de reconnaissance vocale. Une enquête menée par Interpol auprès de 91 départements dans 69 pays a montré que plus de la moitié d'entre eux utilisent déjà une sorte d'identification automatisée des locuteurs. Par exemple, STC Group, filiale européenne du Speech Technology Center basé en Russie, propose une suite de reconnaissance vocale appelée Voice Grid, déployée au Mexique en 2011 et en Equateur en 2015. STC s'efforce de séparer une "empreinte vocale" des données vocales brutes sous-jacentes - en cas de piratage d'une base de données contenant les empreintes vocales, les données d'identification personnelle sont déjà effacées. Verint et Interpol n'ont pas renvoyé les demandes répétées de commentaires. L'un des objectifs du système est d'améliorer les perspectives d'utilisation de la reconnaissance vocale dans les affaires judiciaires. Mais si Interpol va de l'avant avec la plate-forme SIIP, selon les sources, le trait distinctif pourrait bien être la base de données. Geoffrey Stewart Morrison, professeur agrégé au Center for Forensic Linguistics de l'Université Aston de Birmingham, au Royaume-Uni, affirme qu'il y a une grande différence entre l'utilisation des données vocales dans les tribunaux et l'utilisation de la reconnaissance vocale comme outil d'enquête. Par le biais de travaux publiés, lui et un collègue ont tracé des lignes nettes pour le témoignage comparatif devant les tribunaux. La plate-forme d'Interpol pourrait s'avérer tout aussi utile pour réduire les listes de suspects potentiels que pour poursuivre les criminels. Selon M. Morrison, les organismes d'application de la loi peuvent déjà acheter des systèmes existants pour leurs propres besoins, mais il se peut qu'ils ne partagent pas les données, même à l'intérieur de leur propre pays. Le rôle d'Interpol est toutefois de faciliter l'échange d'informations entre les services chargés de l'application de la loi. Cette analyse pourrait également être considérée comme un avertissement, compte tenu des préoccupations récentes concernant les entreprises qui aspirent les données des plateformes de médias sociaux comme Facebook. Comme le souligne l'activiste Monroy, le grand public n'a pris conscience que récemment de l'ampleur de la mesure dans laquelle leur communication écrite peut être surveillée et filtrée par mots-clés. "Ils devraient savoir que cela fonctionne aussi avec la parole, dit-il.