La participation ou l’IA ?

La tentation d’avoir recours à l’IA pour délibérer à la place des citoyens n’est pas un petit écueil devant nous…

Hubert Guillaud

On l’a dit plusieurs fois dans nos pages, la tentation d’avoir recours à l’IA pour délibérer à la place des citoyens n’est pas sans risques. Et les perspectives de l’utiliser pour « étendre » le débat démocratique au risque de refermer la participation aux productions de l’IA, n’est pas un petit écueil devant nous. 

De l’IA pour générer des publics

La chercheuse M.R. Sauter, professeure au collège d’information de l’université du Maryland, explique dans un article de recherche, que nombre de travaux proposent d’utiliser l’IA comme substituts ou compléments à la participation humaine dans nombre de processus démocratiques, comme les sondages ou les consultations. Et cette perspective est problématique. 

Pour elle, ces propositions ne sont pas de simples interventions techniques qui visent à réduire les coûts de la participation, mais s’appuient sur un imaginaire civique qui rend ces substitutions plausibles voire souhaitables. Si ces propositions s’entendent, estime-t-elle, c’est d’abord parce que nous avons assimilé une forme d’équivalence entre humains et données, parce que nous pensons que les systèmes génératifs nous permettent de révéler des vérités et parce que nous avons intégré également le caractère procédural de la démocratie, tant et si bien qu’elle nous semble pouvoir fonctionner en l’absence même des gouvernés. Les données synthétiques qui seraient capables de refléter l’opinion de tout un chacun s’alignent sur les croyances du développement de l’IA qui nous fait croire en leur capacité de représentativité, tout en sapant l’éthique démocratique de la participation. Or, rappelle la chercheuse, « ces systèmes, par nature, entravent la capacité d’interpellation des citoyens et transforment la participation en la rendant symbolique plutôt que relationnelle ». L’imaginaire de l’IA civique ne comble pas les déficits démocratiques, mais les aggrave. Elle offre surtout une couverture idéologique présentant l’efficacité, la substitution des citoyens par des machines statistiques et l’abstraction comme s’ils pouvaient être des progrès démocratiques

« Les institutions démocratiques contemporaines sont marquées par une érosion persistante de la participation. Dans ce contexte, les propositions de déploiement de systèmes d’IA dans la gouvernance participative et représentative se présentent souvent comme des interventions correctives, promettant efficacité, inclusion ou légitimité renouvelée. (…)  L’imaginaire de l’IA civique permet, encourage et excuse l’utilisation de systèmes informatiques comme substituts aux personnes dans les structures de gouvernance participative et représentative. » Mais pour la chercheuse, ces solutions risquent surtout d’éroder plus avant la participation

Reste que cet imaginaire d’une IA pour nous représenter tous repose sur le fait que l’efficacité, la quantification et l’optimisation sont déjà des enjeux très présents dans les structures de gouvernance, où l’importance consiste bien plus à mesurer ce que la participation produit. Plus encore, comme nous le disaient Nicolas Rio et Manon Loisel dans leur petit livre, Pour en finir avec la démocratie participative (Textuel, 2024, voir notre critique) la participation trop souvent ne permet pas d’élargir l’écoute, c’est-à-dire d’écouter ceux qui ne participent pas, quand cela devrait être sa fonction première. L’IA, malgré toutes les données qui sont les siennes, risque de rendre encore plus silencieux ceux qui n’y sont pas représentés. « La crise démocratique est une crise de l’écoute », disaient-ils. Mais écouter les données analysées par l’IA et ses biais, plutôt que les citoyens, ne la résoudra pas. 

Activer l’IA pour améliorer la démocratie répond parfaitement aux enjeux et valeurs des acteurs qui se proposent de produire les interfaces des consultations sous IA, plus qu’à ceux de la démocratie elle-même, conclut M.R. Sauter

Les simulations ne sont pas des opinons

Sur son blog, le professeur de mathématiques appliquées, Arthur Charpentier, résume parfaitement le problème en prenant un cas concret et en montrant comment l’IA est utilisée pour améliorer la représentation statistique. L’idée consiste à “inventer” des répondants supplémentaires pour mieux décrire de petits groupes, explique également le statisticien Thomas Delclite sur son blog sur Mediapart. Ces enjeux de calibration ne sont pas nouveaux, rappelle le professeur. « On modifie les poids de sondage pour respecter des contraintes connues sur la population, par exemple des totaux par sexe, âge ou région. » Mais ses corrections viennent avec un prix à payer : les données synthétiques ne produiront jamais la précision de personnes réelles et ont tendance à amplifier les biais d’échantillonnages non représentatifs. « La génération synthétique peut prolonger le biais, le lisser, le rendre plus cohérent, et surtout créer une fausse illusion », rendant l’incertitude plus invisible qu’elle n’est. Mais surtout, rappelle Charpentier, ces cas d’utilisations aggravent les risques de mauvaises interprétations et les pratiques manquent souvent de transparence sur leurs méthodes. « Ce n’est pas une querelle entre anciens statisticiens attachés aux preuves mathématiques, et nouvelles méthodes d’IA. Le cœur du problème est un problème très classique d’inférence. Qu’est-ce qui est aléatoire ? Qu’est-ce qui est observé ? Qu’est-ce qui est imputé ? Quel est le modèle ? Quelle incertitude est propagée ? Et que signifie exactement l’intervalle annoncé ? » « Le risque est fort de “corriger” ce qui ressemble à une anomalie statistique, alors que cette anomalie est peut-être précisément le signal politique ou sociologique que l’on cherchait à mesurer. »

On le comprend bien mieux quand on cherche à extrapoler les résultats. On pourrait ainsi générer des réponses de toute la population… mais dans ce cas là, ce que l’on génère, ce n’est pas la population, « c’est une image de la population selon un modèle, appris à partir de données limitées ». Si les données synthétiques peuvent être utiles, elles demandent une discipline méthodologique stricte. Or, les distinctions subtiles que ces techniques produisent  ne sont pas seulement techniques : elles deviennent rapidement démocratiques. 

Dans un second billet, Arthur Charpentier pointe une étude qui propose justement de demander à un modèle de langage de répondre à la place des personnes : la méthode s’appelle le silicon sampling, l’échantillonnage synthétique. L’attrait pour ces techniques est fort, on le comprend, notamment parce qu’elles permettent de réduire considérablement les coûts des sondages, enquêtes et pannels. Pour le statisticien Eli McKown-Dawson qui édite avec le statisticien Nate Silver le Silver Bulletin, ces modèles ne sont pas forcément inutiles, mais ils doivent rester ce qu’ils sont, des résultats de modèles et non pas des sondages :  les sondages IA sont d’abord de faux sondages. Le silicon sampling vise à produire une prédiction de ce qu’un sondage pourrait dire. « Les sondages eux-mêmes sont à traiter avec précaution. Ils reposent sur des pondérations, des corrections de non-réponse, parfois des modèles de vraisemblance de vote ou de post-stratification. Si un échantillon contient trop de diplômés ou trop peu de jeunes, on corrige. Si un groupe est difficile à atteindre, on pondère ou on modélise. Mais il repose sur un socle “empirique”, avec des personnes qui ont été contactées, certaines qui ont répondu, et l’incertitude statistique porte sur ce passage fragile d’un échantillon observé à une population.

Dans un sondage synthétique, le modèle ne corrige pas une enquête, il se substitue à l’enquête. » Dans l’étude originale sur le silicon sampling, l’idée est de chercher à produire une « fidélité algorithmique », où  le modèle est conditionné par des descriptions sociodémographiques issues de vrais répondants. Mais les auteurs formulent des conditions très exigeantes à leur usage. Dans une autre étude qui met en pratique l’échantillonnage synthétique, les chercheurs ont fait l’essai sur des données de l’élection présidentielle américaine de 2020… Dans un premier temps, les distributions simulées semblent être très proches des données. « Mais dès que l’on regarde par sous-groupes ou par thèmes, on commence à voir des soucis apparaître. Le modèle devient trop extrême pour certains groupes partisans. Les auteurs notent par exemple que les démocrates et républicains synthétiques votent presque unanimement pour leur camp, davantage que les répondants humains. Plus intéressant encore, le modèle se met à produire des réponses “inoffensives” (“harmless”) ou socialement attendues sur des sujets sensibles. Sur certaines questions de race, de genre, d’homosexualité, de santé ou d’immigration, les réponses générées semblent moins refléter la diversité des opinions humaines qu’une norme de prudence inscrite dans le modèle. Les auteurs parlent d’un biais vers des réponses “harmless”, qui peut varier selon les groupes simulés. Et c’est un point important ! Les modèles ne sont pas seulement des machines à reproduire ce qui se trouve dans les données d’entraînement. Ils sont aussi des machines alignées, filtrées, modérées, ajustées pour produire certains types de réponses. » Bref, « les simulations ne sont pas des opinions ». « Dans un sondage politique ou social, l’unité statistique n’est pas seulement une ligne dans un fichier. C’est une personne atteinte par un dispositif d’enquête, avec une probabilité d’inclusion, une réponse observée, une non-réponse possible, un poids, et une contribution à l’incertitude. Une ligne produite par un modèle n’a pas cette histoire. Elle dit quelque chose du modèle, pas forcément de la population. »

Pour Jamie Cummings, chercheur au LipLab de l’université de Gent, avoir recours à des participants artificiels peut « engendrer des résultats très variés, voire contradictoires, et aucune combinaison spécifique de choix ne permet d’obtenir des données correspondant parfaitement aux réponses humaines », explique-t-il dans un article de recherche discuté dans Science. En testant ces outils, lui aussi constate une grande variété de résultats selon les indicateurs et les critères retenus pour constituer ces publics synthétiques. « Si deux chercheurs différents menaient la même étude sur des échantillons synthétiques, en faisant des choix justifiés différents, ils pourraient aboutir à des conclusions opposées, explique-t-il. » Bref, il va falloir mieux documenter les situations où cet usage pourrait être approprié, comme par exemple pour des expériences pilotes ou pour tester des enquêtes. Le risque pourtant, c’est que la pratique se diffuse, notamment auprès d’acteurs bien peu académiques et bien peu regardant des limites de ces outils. 

… à l’IA pour traiter des sondages et consultations

Mais l’IA n’est pas seulement utilisée pour générer des publics synthétiques, elle est aussi de plus en plus utilisée pour traiter les enquêtes, sondages et autres consultations… notamment les plus massives, comme l’explique le journaliste Chris Stokel-Walker pour Tech Policy Press

En 2025, lors d’une réforme sur le secteur de l’eau, les agences britanniques ont reçu des milliers de contributions du public. Pour les examiner, ils ont eu recours à Consult, l’un des outils d’IA de la suite Humphrey* (qu’on pourrait qualifier d’Albert britannique ou de Mistral britannique puisque désormais il semble que ce soit plutôt Mistral qui soit l’IA envisagée pour équiper les fonctionnaires Français). L’outil a permis de classer les 50 000 réponses par thèmes évitant une fastueuse classification manuelle des réponses et de produire une analyse dédiée.  

Pour Chris Schmitz, chercheur à la Hertie School de Berlin, l’enjeu ne consiste pas seulement à analyser les documents de consultation, mais aussi à empêcher toute manipulation du processus lui-même (même si Schmitz n’explique pas du tout comment : l’analyse établie par l’IA n’assurant pas pour autant de la synthèse équitable et valide des réponses). Le risque pourtant est bien que ces processus qui font appel à la contribution publique soient submergés par l’analyse automatisée… Et en retour, que les espaces de participation des publics soient eux-mêmes augmentés et démultipliés par l’IA, par exemple via des outils IA qui permettent aux citoyens britanniques de contester les demandes de permis de construire, leur permettant de démultiplier les contestations et de produire des contestations plus argumentées et volumineuses (mais pas toujours plus solides juridiquement). 

Les analyses par IA de grands sondages ou de grandes cohortes sont souvent particulièrement problématiques. Bien souvent la méthodologie n’est pas transparente et les biais qui visent à qualifier automatiquement les réponses (par exemple en leur attribuant des notes selon des analyses sémantiques qui synthétisent les réponses en valeurs (positif ou négatif) ou en mots clés et réduisent les nuances et les expressions, souffrent de biais majeurs que beaucoup de cabinets de conseils qui mobilisent ces études pensent qu’ils se dissolvent dans le nombre… A l’image des études sur les réponses des cahiers de doléances des Français ou plus récemment l’étude du pluralisme des antennes de Radio France et de France Télévision produit par le très libéral et conservateur Institut Thomas Moore : une étude orientée pour démontrer que les programmes des émissions du service public seraient très orientés à gauche et qui a été largement dénoncé en se moquant du fait que l’étude par exemple classe les bulletins météo à gauche. 

Dans le secteur public, l’IA commence à être utilisée à d’autres endroits encore, explique Stokel-Walker. Le Sénat italien utilise l’IA pour gérer la surcharge d’amendements en regroupant les propositions similaires. La Commission européenne, elle, a publié un appel d’offre pour la fourniture de chatbots multilingues capables d’aider les citoyens à s’orienter parmi les obligations légales et notamment la réglementation européenne sur l’IA et le DSA. La Chambre des députés italienne soutient le projet GENAI4LEX-B, qui facilite la recherche et la rédaction législatives en synthétisant les amendements des commissions et en vérifiant la conformité des projets de loi aux normes de rédaction. D’autres pays utilisent également l’IA pour optimiser le processus d’élaboration des lois. 

Pour Schmitz, le problème est que les gouvernements considèrent l’intégration de l’IA comme une série de petites corrections techniques plutôt que comme une transformation structurelle de la manière dont les citoyens peuvent influencer l’État (et dont l’État peut influencer les consultations). Les outils de tri, de synthèse et de rédaction peuvent sembler être des améliorations logiques (on a déjà pointé certains biais des synthèses automatisées et les problèmes de dégradation des données quand l’IA les modifie comme les formes de sur-interprétations liées aux outils d’inférences) , mais « ce sont des solutions de fortune », soulignant qu’il ne constate « aucune réflexion systématique sur les conséquences à long terme pour la légitimité des processus de participation citoyenne ». Mais si les gouvernements l’utilisent principalement pour gérer les données générées par les machines ou pour gagner du temps dans les traitements, ils risquent d’aggraver la méfiance qu’ils cherchent justement à endiguer… c’est-à-dire à rendre la participation encore plus éloignée car de moins en moins représentée.

Hubert Guillaud

—-
* Non sans une certaine ironie, Humphrey tire son nom de la série télévisée satirique des années 80, Yes Minister, dans laquelle un nouveau ministre des affaires publiques est confronté à Humphrey Appleby, responsable de cette administration, qui use de tous les moyens à sa disposition pour décourager la moindre proposition du ministre… afin que rien ne bouge (merci à Aron West pour cette précision).