Pourquoi risquons-nous de rester coincés dans la désinformation ?

Mots clés

#désinformation

Dans la même rubrique

Lila Shroff s’inquiète. A raison. ChatGPT Images 2.0 qui vient de sortir permet de créer des visuels photoréalistes nettement plus convaincants que ceux produits par ses prédécesseurs. Elle l’a utilisé pour créer une image de Trump en train de donner des conseils de maquillage comme une capture d’écran de TikTok. Amusant. « Mais les deepfakes les plus réalistes que j’ai pu créer n’impliquaient ni politiciens ni célébrités. La plupart ne représentaient même pas de personnes. Sans trop d’efforts, j’ai pu créer plus de 100 images falsifiées, notamment des ordonnances d’opioïdes et de médicaments contre le TDAH, des alertes bancaires, des publications sur les réseaux sociaux, de fausses images de cartes d’identité et de passeports », de faux documents financiers (factures, reçus et déclarations fiscales), fausses captures d’écran (pour falsifier une confirmation de virement bancaire), fausses notes de frais, fausse capture d’écran d’un site de presse… Les modèles d’images ont longtemps peiné à produire des images intégrant du texte. Ce n’est plus du tout le cas avec cette version ci. Bien sûr, en y regardant de plus près, tous ces faux ne sont pas encore parfaits. Dans son dernier rapport annuel sur la cybercriminalité, le FBI a inclus une section sur les escroqueries à l’IA, qui auraient coûté près d’un milliard de dollars aux Américains l’an dernier.

Fake, ça accélère

« En théorie, je n’aurais pas dû être capable de créer la plupart de ces images. OpenAI interdit l’utilisation de sa technologie à des fins de fraude ou d’escroquerie » … mais souhaite laisser une liberté créative totale à ses utilisateurs. De la à permettre de reproduire des logos de banque ou des documents officiels… Même constats chez Google dont les IA permettent également de générer ce genre de faux. Les entreprises d’IA se défendent en estimant que les images générées le sont avec des filigranes comme SynthID ou des métadonnées, mais encore faut-il que les gens aient des outils pour analyser les images qu’ils voient. « Malgré la fragmentation de notre écosystème médiatique, une simple recherche Google suffit généralement à vérifier si ces images sont fausses. Ce sont les deepfakes ciblés et omniprésents – ceux qui escroquent vos proches plutôt que de simplement perturber les réseaux sociaux – qui sont peut-être les plus inquiétants. » Et pour lesquels les mesures de protection s’annoncent encore très perfectibles.

Pour le New York Times, Stuart Thompson a testé les détecteurs d’IA. Plus d’une douzaine d’outils en ligne affirment pouvoir faire la différence entre le vrai et le faux en recherchant des filigranes cachés, des erreurs de composition et d’autres indices numériques. « Les résultats suggèrent que ces détecteurs peuvent aider à confirmer les soupçons concernant les contenus générés par l’IA, mais il est difficile de s’y fier pour établir un diagnostic définitif. » Thompson réalise plusieurs tests ne produisant pas toujours des résultats adaptés auprès d’une galerie d’outils comme Hive Detect, Resemble.ai, AI or Not, Reality Defender, Copyleaks, BrandWell, Sensity, Sightengine et les grands outils d’IA qui ont tous intégré ces fonctions, de Gemini à Claude, ChatGPT ou SuperGrok.

Le NYTimes a fait passer des tests à tout ces outils. « Nombre d’entre eux ont pu détecter les contrefaçons les plus simples ». Parfois, certains outils ne parviennent même pas à détecter les images qu’ils ont eux-mêmes créé. Les propriétaires de ces outils estiment néanmoins que les mises à jour de ceux-ci seront plus efficaces qu’ils ne sont, sans parvenir à la perfection. La détection de vidéo est plus difficile que celle des images et les résultats de ces outils sont tous moins bons, mais semblent plus performants pour détecter les sons générés. Ils réussissent mieux à détecter comme réels des images et vidéos réels, par contre les images réelles modifiées demeurent les plus difficiles à détecter… tant pour les outils que pour les humains.

Deepfakes : pourquoi ça marche ?

Dans sa newsletter, Rob Horning tente de comprendre pourquoi les images génératives rencontrent un tel succès. Par rapport aux images réelles, « les versions générées par l’IA sont souvent plus spectaculaires, plus cinématographiques et optimisées pour générer des clics sur les réseaux sociaux ». Toutes les images ne sont pas propagandistes, rappelle le philosophe, elles sont surtout « opportunistes ». Elles visent à produire du contenu. C’est une propagande pour l’information elle-même, qui soutient l’idée que « toute information peut et doit être vécue comme un divertissement ». « Elles encouragent plutôt une approche post-narrative où l’appréciation des mèmes ne dépend plus de la compréhension des enjeux globaux ni de la recherche de contexte ». « Les spectateurs sont pris en étau entre deux systèmes algorithmiques : l’un génère le contenu et l’autre nous le présente, notre attention étant captée pour les entraîner à converger.»

Ces images et vidéos cherchent plus à être émotionnellement compréhensibles qu’à être authentiques. Le contenu ne fait que nourrir et renforcer notre soif de spectacle. « La confusion entre preuves et contenu dans les flux d’information a engendré une confusion entre les deux. Les éléments présentés comme des preuves deviennent un alibi pour le spectacle ; ils imitent la vérifiabilité tout en nous incitant à nier tout besoin de vérification. » Mais, s’inquiète Horning, « ces contenus renforcent également l’idée qu’il est plus amusant d’être dupé que d’être informé, et que l’indifférence à la vérité procure des récompenses émotionnelles immédiates ». Ils nous disent autre chose encore de notre monde, souligne-t-il. Ces contenus de piètre qualité alimentent l’idée que tout devrait être visible, surtout dans un monde aussi saturé de surveillance que le nôtre. A l’heure où tout est accessible, nous avons l’impression que tout est désormais visible, comme quand le journalisme lui-même utilise la reconstitution fictive pour nous montrer ce qui n’a pas été enregistré. Il existe de fausses images sur tout ce qui peut susciter des réactions. Et ces images et vidéos permettent de montrer ce qu’il se passe réellement, sans que ce soit réel. « Ces vidéos ne fournissent pas d’informations factuelles, mais une idéologie, nous épargnant ainsi l’effort de la réflexion. »

Si ces fausses images prolifèrent, c’est parce qu’elles offrent des illustrations claires de problèmes perçus comme réels, explique la chercheuse Claire Wilmot sur son blog pour la London Review of Books, qui montre que les deepfakes racistes offrent à ceux qui les utilisent la confirmation de leurs diagnostics. Les gens qui les partagent savent très bien que ces images sont fausses, mais elles permettent de montrer ce que ces gens pensent qu’il se passe réellement. « Ces vidéos répondent au désir du public de voir ses croyances se manifester sous forme de preuves et de consommer ce qu’il croit déjà comme si cela était irréfutablement établi par des événements réels. Elles nous offrent des explications simplistes, nous dispensant ainsi de tout effort de réflexion ou de toute responsabilité. Ces types de vidéos et d’images nous permettent de vivre ces croyances comme un contenu sans avoir à y croire « réellement ». Elles apparaissent simplement sous nos yeux pour nous rassurer. Ces contenus s’auto-valident pour leur public car ils présentent une idée qu’il tient déjà pour acquise. »

« Le flux constant de ces contenus normalise l’idée que l’information sera immédiatement remaniée pour nous satisfaire, et que nous pouvons compter sur nos flux d’actualités pour moduler nos émotions et nous apporter une forme de clarté, voire de soulagement. » Les fausses images permettent finalement de neutraliser le flux des images réelles qui sont peu commodes à comprendre. Elles apaisent l’anxiété de l’actualité en permettant de mieux la maîtriser, de la rendre plus lisible qu’elle n’est, plus conforme à ce qu’elle devrait être ou ce qu’on voudrait qu’elle soit.

« Le caractère facilement rejetable de ces images obséquieuses fait partie de leur attrait ; il rend la tromperie apparente et contenue, grâce à l’incrédulité délibérément suspendue du spectateur. La désinformation nous flatte en nous laissant entrevoir la supercherie tout en savourant la vision du monde qu’elle propose. Elle offre un discours facile à suivre, qui procure un sentiment constant de réussite, de reconnaissance, d’obtention sans effort. Elle flatte comme un chatbot obséquieux. Son mal ne réside pas dans le fait de nous persuader de choses fausses, mais dans l’érosion du sens des responsabilités collectives face à l’information partagée. » C’est un peu comme si ces images permettaient d’enlever de l’actualité sa complexité. « C’est le message sous-jacent de tout contenu : nous devrions pouvoir voir ce que nous voulons croire sans avoir à investir d’efforts pour construire cette réalité. »

Horning pointe un autre effet de la désinformation partagée : celle de nous isoler finalement. « Au lieu de rechercher l’information en reconnaissant notre ignorance nous ingérons des quantités massives d’informations simulées et de propagande maladroite qui nous donne l’illusion d’être imbus de nous-mêmes. Si le devoir civique, en tant que raison de s’informer, s’est atrophié, la diffusion de désinformation vise à l’anéantir complètement. »

L’industrie médiatique a subordonné la vérité au spectacle, éliminant les points de vue marginalisés et les voix divergentes. Or, ce que nous voyons, entendons, lisons… ne devrait jamais suffire à dicter nos croyances, rappelle Horning. La « crise de la vérité » ne provient pas d’un nouveau pouvoir des médias de nous tromper, « mais de la conviction que la simple consommation de médias suffit à nous faire vivre dans le monde réel ». Or, « aucune image ne peut nous conférer un rapport privilégié à la vérité, une conscience automatique de la réalité objective, une empathie accrue ou un sens moral plus sûr. Aucun média ne peut nous affranchir de la médiation. S’engager avec les médias ne signifie pas « surveiller la situation » ; cela implique de participer à la guerre de la propagande, et non de se complaire dans la médiocrité ».

Nous sommes de plus en plus soumis à une pure consommation d’information. Et en cela, les fausses images nous invitent à rester dans une pure consommation, en n’ayant plus qu’à circuler parmi elles, en naviguant parmi celles qui nous complaisent le mieux. Or, consommer l’information ne suffit pas, rappelle Horning. Les militants du Minnesota, face à l’ICE, ont montré l’importance à documenter ensemble, les pratiques de la milice, pas seulement en invitant les gens à regarder leurs vidéos, mais à les produire collectivement, en filmant la réalité des exactions de l’ICE sous tous les angles possibles, à témoigner. Une pratique qui devient plus forte à mesure que plus de gens y participent. Une pratique qui produit de la solidarité et qui participe à la production d’une réalité partagée. Tout l’inverse de la production politique traditionnelle qui amplifie de plus en plus les pires outrages, les pires dénis, les pires mensonges. Trump est assurément le pire menteur et affabulateur de tous les temps, et pourtant, il reste perçu comme plus honnête et plus authentique que ses adversaires, se désole la journaliste Zoe Williams dans The Guardian. Le risque est bien que les images génératives empruntent le même chemin : qu’elles semblent honnêtes et plus authentiques que la réalité.

Hubert Guillaud

Cet édito a été originellement publié pour la lettre d’information Café IA du 13 mai 2026.

MAJ du 25/06/2026 : En janvier, dans la Technology Review, le journaliste James O’Donnell avait révélé que le Département américain de la Sécurité intérieure, qui gère les services d’immigration, utilisait des générateurs vidéo IA de Google et d’Adobe pour créer du contenu destiné au public. Si certains commentateurs n’étaient pas surpris (le président Trump lui-même étant coutumier du fait), de nombreux autres justifiaient la pratique en estimant qu’il fallait combattre la désinformation par de la désinformation. Au grand damne du journaliste qui, dans un autre article où il raconte les conséquences, constate que l’enjeu n’est plus la vérité. Et le journaliste de pointer vers un article de recherche de la revue Communications Psychology de Nature. Dans cette étude, les participants ont visionné une « confession » truquée et les chercheurs ont constaté que même lorsqu’on leur disait explicitement que la preuve était fausse, les participants s’y fiaient pour juger de la culpabilité d’un individu. « Autrement dit, même lorsque les gens apprennent que le contenu qu’ils consultent est entièrement faux, ils restent influencés émotionnellement par celui-ci ». Nous avons réagi à la crise de la vérité en nous préparant à un monde où le principal danger serait la confusion, conclu O’Donnell. « Or, nous entrons dans un monde où l’influence survit à la révélation, où le doute est facilement instrumentalisé et où établir la vérité ne permet pas de repartir à zéro. Et les défenseurs de la vérité sont déjà largement distancés. » Face à la submersion par le faux, même rétablir la vérité ne semble plus avoir d’effets.

MAJ du 25/06/2026 : Il reste des éléments qui permettent encore de distinguer les images réelles des images générées, estime Hany Farid, pionnier de la criminalistique numérique, qui à la tête de l’entreprise GetReal Security, est l’un des plus grands experts mondiaux en matière de détection de manipulation de photos et de vidéos. Dans Science, il explique que les images génératives peinent à reproduire fidèlement les lois de la physique. Même constat pour Darren Linvill, codirecteur du Media Forensics Hub de l’université de Clemson : les images génératives sont plus saisissantes que la réalité. « En termes de contenu à partager et à regarder, une grande partie du contenu généré par l’IA surpasse la réalité », explique-t-il. Les explosions sont plus impressionnantes, le point de fuite des perspective n’est pas unique, les différences d’éclairages perceptibles… Farid cherche surtout les traces laissées par certains types de manipulation, notamment en analysant les pixels des images. « L’IA générative ignore tout de la physique et de la géométrie ». Pour vérifier les images, Hany Farid contrôle souvent si la géométrie de la scène est réaliste. Il a développé également un logiciel de lecture labiale automatique capable de repérer quand les mouvements de la bouche ne correspondent pas pas aux paroles… Mais reconnait-il, ces problèmes évoluent vite et les systèmes s’améliorant, la détection est de plus en plus difficile. « Le monde réel est incroyablement complexe à simuler, et les entreprises d’IA n’ont guère intérêt à pousser leurs modèles aussi loin. Après tout, leur objectif n’est pas de tromper les experts en criminalistique numérique comme Farid, mais simplement l’utilisateur lambda, un critère bien moins exigeant. « Le système visuel tolère toutes sortes d’absurdités sur les photos, car il n’y prête pas attention », explique-t-il. » Un de ses étudiants, Lyu, a développé deepfake-o-meter un système pour estimer la crédibilité des images. Mais un des principaux problèmes est que ces détecteurs fonctionnent mal avec des contenus très différents de leurs données d’entraînement. « Il n’existe pas de détecteur d’apprentissage automatique unique permettant aux utilisateurs de télécharger tous types de vidéos, photos, fichiers audio et d’obtenir une réponse fiable. »

Bien sûr, même l’enquête la plus approfondie et la plus rigoureuse ne convaincra pas toujours les sceptiques. Farid l’a appris à ses dépens en 2009, lorsqu’il a analysé une photo de 1963 montrant Lee Harvey Oswald tenant le fusil qu’il utiliserait plus tard pour assassiner le président John F. Kennedy. Les théoriciens du complot – et Oswald lui-même – affirmaient depuis longtemps que la photo était truquée, pointant du doigt des détails inhabituels comme les ombres sur le visage d’Oswald. Mais l’analyse de Farid n’a rien révélé d’anormal. Cela ne l’a pas empêché d’être accusé d’être partie prenante dans la dissimulation de la vérité !

Farid a également participé du développement de PhotoDNA qui repère les contenus pédopornographiques en ligne (voir notre article sur la modération automatisée depuis le livre de Tarleton Gillespie de 2019, Custodians of the internet, Yale, 2018). Développé en 2009 en collaboration avec Microsoft, cet outil analyse les contenus mis en ligne sur Google, Facebook, Reddit et d’autres plateformes, en comparant les fichiers à une base de données de contenus pédopornographiques connus. Le Centre canadien de protection de l’enfance (C3P) utilise ce logiciel dans le cadre du Projet Arachnide qui explore activement l’internet à la recherche de correspondances.

Mais Farid reconnaît qu’il est désormais submergé par le flot : au début de sa carrière, il recevait une ou deux demandes de vérification par mois, se souvient-il. Puis, chaque semaine. « Maintenant, c’est tous les jours. Sans blague, chaque matin, je me réveille avec une dizaine de courriels de journalistes du monde entier. »

Il est possible que quelqu’un parvienne à créer un faux document indétectable, explique-t-il. Mais son objectif est de rendre la tâche si difficile qu’elle reste hors de portée de la grande majorité des personnes mal intentionnées. « Chaque fois que je quitte ma maison, je verrouille ma porte d’entrée », explique Farid. « Cela empêche 99,99 % des gens de s’introduire chez moi, mais pas un serrurier. »

article précédent ↜ « LLM : vers un « monopole radical »