Et si la vidéosurveillance (intelligente) nous rendait aveugles ?
À l’œil des caméras de vidéosurveillance, se sont ajoutées des oreilles, une bouche. Un nouveau visage semble se dessiner : celui d’un « policier augmenté » qui, à distance, verrait, entendrait, parlerait « mieux » que son homologue humain. à ces capacités physiques s’ajouteraient des fonctions cognitives, permettant à la reconnaissance faciale, tel un « cerveau robotisé », d’identifier plus efficacement les criminels et de dépister les comportements suspects.
Si certaines voix s’élèvent pour dénoncer « le vrai visage de la reconnaissance faciale », d’autres en vantent les mérites pour assurer notamment la protection des citoyens. Cependant, cette polarisation du débat (pour ou contre) repose sur un certain nombre de postulats et de croyances qui biaisent la controverse. Pour aider à déconstruire les nouveaux fantasmes suscités par l’émergence de la reconnaissance faciale, intéressons-nous aux acteurs publics et privés qui utilisent la vidéosurveillance au quotidien.
Tout d’abord, les caméras dites hautement performantes, ne voient pas si bien que cela. En effet, le large éventail de dispositifs de vidéosurveillance existants (caméras dômes, fixes, factices, lecture de plaques d’immatriculation), les divers lieux (rues, parkings) et supports d’implantation (lampadaires, plafonds), les moyens humains inégaux associés (surveillance en temps réel, en temps différé), ou encore les obstacles visuels (arbres, stores de commerces, panneaux publicitaires, soleil, pluie, brouillard etc.), font considérablement varier la qualité des images. En outre, les caméras censées filmer en continu ne fonctionnement pas toujours et nécessitent de recourir régulièrement à des techniciens de maintenance pour réparer les pannes récurrentes du système.
Si la vidéosurveillance est souvent associée à une « machine à tout faire », elle est loin de pouvoir tout résoudre.
Ensuite, la neutralité, l’objectivité de la vidéosurveillance n’est qu’apparente. En réalité les caméras voient d’une certaine façon. En témoignent les représentations et les pratiques des vidéo-opérateurs, qui les actionnent et les font « parler ». Ces derniers se focalisent sur les risques de dangerosité (plutôt que sur la dangerosité avérée) et orientent le contrôle classique du crime vers un contrôle, plus individualisé, de personnes surveillées en raison de leur lieu de résidence, de leur apparence, de leur âge ou encore du simple fait d’être en groupe ou de « n’être pas du coin ».
Enfin, si la vidéosurveillance est souvent associée à une « machine à tout faire », elle est loin de pouvoir tout résoudre. La greffe des fonctions sécuritaires (dissuader, élucider les affaires judiciaires etc.) aux multiples usages de la vidéosurveillance[1], rend souvent ses finalités incompatibles. Par exemple, un usage dissuasif suppose que la présence des caméras soit portée à la connaissance du public tandis que l’efficacité de leur usage judiciaire repose justement sur le ressort inverse. Autre exemple fourni par un policier en poste dans un service d’enquête : « L’emplacement de la caméra ne permet pas la même vision. Ceux qui cherchent à surveiller leurs employés mettent l’angle de la caméra sur l’employé, ce qui ne permet pas de bien voir les clients, et pour nous ça n’a pas beaucoup d’intérêt. » En outre, la croyance en l’efficacité de la vidéosurveillance dans le domaine de la lutte contre la délinquance est rarement étayée par de solides vérifications empiriques. Si les études évaluatives menées dans le monde anglo-saxon se contredisent, les recherches en France tendent à sérieusement relativiser son efficacité dans ce domaine.
Ces diverses limites de la vidéosurveillance sont parfaitement applicables aux caméras dites intelligentes, que l’on songe aux « faux positifs » ou aux « biais algorithmiques » laissant planer un sérieux doute sur la capacité de cette technologie à confondre à coup sûr les criminels. Toutefois, elles ne sont pas les seuls, ni même les principaux obstacles à l’exploitation de cette technologie. Pour le comprendre, examinons les usages de la vidéosurveillance dans un contexte judiciaire d’administration de la preuve.
Pour éviter de survaloriser ou à l’inverse de minorer la contribution judicaire de cette technologie, il faut dissocier son intérêt, réel mais différencié selon les services d’enquête, de son intérêt probatoire, plus limité. La vidéosurveillance fournit un outil « en plus » aux enquêteurs qui choisissent, à l’issue d’un calcul coûts/avantages, d’y recourir ou non. Néanmoins, les policiers et les gendarmes mobilisent inégalement cette technologie. Réquisitionner les enregistrements constitue un « réflexe », une quasi-routine déjà institutionnalisée, uniquement dans les services d’enquête qui ont en charge une faible quantité d’affaires criminelles et/ou de graves délits pour « ouvrir ou fermer des portes » (pistes de recherche).
En revanche, l’intérêt des enquêteurs pour la vidéo diminue dans le cas où les policiers sont en charge d’un nombre important d’affaires délictuelles (dégradations, vols) et où l’enjeu de l’investissement policier est perçu comme faible (récupérer un papier pour l’assurance). Ils estiment n’avoir ni le temps ni l’énergie de se donner tous les moyens de retrouver le suspect. Si le nombre d’enregistrements dont disposent les enquêteurs est croissant, en revanche, plus rares sont ceux qui parviennent à remonter au sommet de la chaîne pénale. Par ailleurs, les bandes, rarement visionnées par les magistrats qui leur préfèrent les conclusions des procès-verbaux d’exploitation, ne sont qu’une ressource parmi d’autres preuves. Pour s’assurer de leur intérêt probatoire, les magistrats réinscrivent ces « éléments de preuve » dans un faisceau de preuves convergentes (témoignages, ADN, écoutes téléphoniques etc.).
Mais pourquoi y-a-t-il à la fois autant de vidéosurveillance et si peu d’enregistrements transmis à la justice ? L’inexploitation ou, à l’inverse, l’exploitation des vidéos repose en grande partie sur un processus de sélection. Suite au processus de tri, qui part du local des pourvoyeurs de vidéos (centres de sécurité urbaine, commerces, transports en commun, bailleurs sociaux etc.), jusqu’au palais de justice, en passant par l’institution policière, beaucoup d’enregistrements sont écartés. En effet, tous ces professionnels ne voient pas la même chose et ne partagent pas une définition homogène de la preuve. Les tris opérés sont donc orientés par des perceptions différentes de ce qu’est une preuve, et par des catégories de l’entendement propres à chaque milieu professionnel : la valeur de la vidéo dépend moins de ce qu’elle donne à voir que de ce que les acteurs de la chaîne y voient et pensent devoir y voir.
Ces modalités d’appropriation et d’utilisation hétérogènes sont possibles car les procédures et les protocoles d’usage de la vidéosurveillance ne sont pas stabilisés en justice pénale. Tout au long de la chaîne, se jouent donc des arbitrages et des raisonnements différents qui conditionnent ensuite l’utilisation qui sera faite de la vidéo. Lorsque les acteurs concernés adoptent des stratégies d’ajustement en anticipant les représentations de leurs interlocuteurs, pour trier les « bons » des « mauvais » enregistrements, ils augmentent les chances pour une vidéo d’être utilisée comme mode de preuve.
Toutefois, ces stratégies d’ajustement se heurtent à des oppositions et des résistances qui font vaciller le destin de la technique comme preuve. En effet, au cours de ces interactions s’exercent également des rapports de force entre des acteurs qui occupent d’inégales positions et possèdent d’inégales ressources. Par exemple, la plupart des enquêteurs estiment que les vidéo-opérateurs n’ont pas à connaître les tenants et les aboutissants d’une affaire, car « ils ne sont pas flics ».
Dans la chaîne des acteurs de l’ordre judiciaire, la vidéosurveillance est mobilisée comme un enjeu de luttes professionnelles.
Cela se traduit très concrètement dans la manière dont les officiers de police judiciaire rédigent leurs réquisitions de vidéos. Si certains prennent soin de mentionner le type d’infraction concernée et des indications relatives à la description et/ou la tenue vestimentaire des mis en cause, d’autres en revanche ne mentionnent que le créneau horaire et un lieu approximatif, ce qui a pour effet d’accroître considérablement le temps de recherche des vidéo-opérateurs.
Ainsi, la vidéosurveillance est mobilisée comme un enjeu de luttes professionnelles. Plus encore, ce sont les rapports sociaux hiérarchisés concernant les personnes qui sont projetés dans cet objet. En prenant ses distances avec la prétendue valeur ou force probante de la vidéo, chaque acteur remet à sa « juste » place l’interlocuteur précédent pour maintenir non seulement l’ordre judiciaire, qui tend justement à être déstabilisé par l’appropriation de cette technologie en tant que preuve, mais également la hiérarchie de leurs positions sociales respectives.
Ces usages, loin d’être conformes à la réputation de « reine des preuves » de la vidéosurveillance, rappellent que cette technologie n’est pas autonome. Or, la vidéosurveillance intelligente dépendra elle aussi de celui qui la produit, la programme et l’utilise et supposera toujours d’activer des savoirs (voir– reconnaître– convaincre). La thèse d’une substitution progressive du contrôle humain par le recours aux technologies de pointe, censées régler les failles humaines (baisse de la vigilance, attention flottante), loin d’être confirmée comme le montrent les travaux de Frédéric Ocqueteau, ne nous rend-elle pas aveugle à d’autres enjeux ?
La situation de celles et ceux qui nous surveillent derrière les caméras interroge. On ne peut pas dire des « vidéo-opérateurs » qu’ils forment une profession. Les statuts qu’ils occupent, les tâches qu’ils remplissent et les jugements qu’ils portent sur leur travail les différencient assez sensiblement. En outre, si les pratiques des agents en poste derrière les caméras diffèrent, ils ont en commun d’être peu-ou pas- qualifiés, formés, et reconnus comme de vrais professionnels.
La mécanisation des opérations de surveillance ne trace pas la voie de métiers techniques plus valorisants, comme on pourrait s’y attendre : c’est la précarité qui caractérise ces postes et leurs occupants. On pourrait en dire autant de la plupart des emplois exercés par les nouveaux acteurs locaux de la sécurité, qui forment, selon le sociologue Philippe Robert, un « prolétariat de néo-surveillants ».
La vision du monde sous-tendue par cette technologie politique de gestion du crime, ou plutôt des indisciplines, pose également question. Portée par des logiques industrielles ( l’Etat n’étant plus seul à assurer la sécurité des biens et des personnes), la vidéosurveillance n’est pas différente d’autres technologies qui concernent d’autres domaines ; bien au contraire, elles existent et prennent forme et force dans un mode de gouvernement orienté vers des objectifs gestionnaires et d’économie de moyens, qui organise la répression avant le passage à l’acte par l’élaboration d’indicateurs de risque, et dans la fin d’un modèle social.
Les logiciels de reconnaissance faciale augurent un nouveau tournant dans l’histoire de l’identification impliquant plusieurs menaces : les inégalités programmées et automatisées, le risque d’interconnexion des données.
On le sait, le système de protection sociale français, qui prémunit contre les aléas de l’existence (chômage, vieillesse, maladie, etc.), est fragilisé. Or ce « démantèlement du filet de protection sociale » se réalise en même temps que se déploie un « filet policier et pénal », pour citer Loïc Wacquant. Dans ce contexte, le choix de déployer des systèmes de vidéosurveillance pour « protéger » la population n’est pas anodin. Il repose sur une conception de la protection dans laquelle la lutte contre l’insécurité civile (contre la délinquance), devenue prioritaire, se fait au détriment du combat contre l’insécurité sociale, soulignait Robert Castel.
Est-ce à dire que rien ne change avec l’avènement de la « caméra biométrique »? Couplés aux caméras de vidéosurveillance, les logiciels de reconnaissance faciale augurent un nouveau tournant dans l’histoire de l’identification. Plusieurs menaces, dont il faut prendre la juste mesure, se profilent. Celle des inégalités programmées et automatisées. En effet, les logiciels reposeront sur un système de classement des populations et de perception du monde social qui, en étant traduits en langage informatique, pourraient échapper à toute emprise critique et exonérer leurs utilisateurs de leurs responsabilités. Pensons également au risque d’interconnexion des données, qui les détournerait de leurs fonctions premières en passant par exemple d’un usage commercial à un usage sécuritaire, et à la mise en réseau des divers systèmes de vidéosurveillance. Citons, enfin, les nouvelles possibilités de classement des individus par leurs corps, et ce sans qu’ils s’en aperçoivent.
Tout se passe comme si, à mesure que les machines se dotent d’un visage, nous « perdions » le nôtre, selon La Quadrature du Net. Si nous forçons le trait, c’est pour souligner à quel point, à l’heure où la reconnaissance faciale émerge en France, du moins dans ses applications sécuritaires, le débat démocratique s’impose. Si consentement de la population il doit y avoir, au moins faut-il qu’elle soit vraiment éclairée.
NDLR : Elodie Lemaire a publié en mars 2019 L’Œil sécuritaire. Mythes et réalités de la vidéosurveillance, aux Éditions La Découverte.