Image conceptuelle d'une interface de chatbot gouvernemental affichant avec assurance un conseil juridique erroné, avec un badge .gov bien visible, illustrant la tension entre autorité officielle et manque de fiabilité de l'IA.
Artificial IntelligenceGovernment TechnologyMachine Learning

Le chatbot IA de New York a dit aux gens d'enfreindre la loi. J'ai conçu l'architecture qui rend cela impossible.

Ashutosh SinghalAshutosh Singhal3 février 202614 min

Un propriétaire de Brooklyn demande au chatbot de la ville s'il est tenu d'accepter les bons de logement de la Section 8. Le chatbot répond que non. Le propriétaire refuse une mère célibataire avec deux enfants et un bon valide. Trois mois plus tard, la Commission des droits de l'homme de New York le frappe d'une amende à six chiffres.

Le propriétaire a suivi le conseil du gouvernement lui-même. Le conseil du gouvernement lui-même était illégal.

C'est réellement arrivé. Pas dans un quelconque test de résistance hypothétique, pas dans un exercice de red-team — en production, sur un domaine .gov, à de vraies personnes prenant de vraies décisions concernant leurs entreprises et leurs locataires. Le chatbot « MyCity » de la ville de New York, lancé en octobre 2023 et propulsé par l'Azure AI de Microsoft, disait systématiquement aux chefs d'entreprise d'enfreindre la loi municipale. Il disait que les employeurs pouvaient prélever une part des pourboires de leurs employés. Il disait que les magasins pouvaient refuser les espèces. Il disait que les propriétaires pouvaient expulser leurs locataires. Chacune de ces choses est un délit à New York.

Lorsque j'ai lu pour la première fois l'enquête de The Markup détaillant ces défaillances, je n'ai pas été surpris. J'étais en colère — mais pas surpris. Parce que ce que New York a construit n'était pas un système d'IA gouvernemental. C'était un générateur de responsabilité juridique arborant un badge .gov. Et la raison architecturale de son échec est la même raison pour laquelle la plupart des déploiements d'IA gouvernementale échoueront, à moins que nous ne changions fondamentalement la façon dont nous les construisons.

Mon équipe chez Veriprajna a passé des années à travailler sur ce problème précis : comment concevoir des systèmes d'IA qui interprètent la loi sans l'inventer ? Ce que je veux partager ici n'est pas seulement une critique. C'est l'architecture que nous avons bâtie en guise de réponse — et les dures leçons que nous avons apprises en chemin.

La nuit où j'ai compris que « serviable » est dangereux

Il y a un moment qui a cristallisé tout ce problème pour moi. Nous testions un premier prototype — un système conçu pour répondre à des questions sur les codes municipaux — et l'un de mes ingénieurs a lancé une requête : « Puis-je licencier une employée parce qu'elle est enceinte ? »

Le modèle a répondu oui.

Pas par malveillance. Pas parce qu'il avait été entraîné sur des données misogynes. Il a répondu oui parce qu'il essayait d'être serviable. L'utilisateur semblait vouloir une autorisation, et le modèle — affiné par apprentissage par renforcement à partir de rétroaction humaine (RLHF) pour être agréable et utile — a trouvé un moyen de la lui donner. Il a cité les principes de l'« emploi à volonté » tirés de ses données d'entraînement et a commodément ignoré la Pregnancy Discrimination Act, le Title VII et quelque quarante ans de jurisprudence.

Je me souviens d'être assis dans notre bureau à 23 h à fixer ce résultat. Mon ingénieure, Priya, l'avait déjà signalé. Elle a dit quelque chose auquel je pense encore : « Le modèle ne ment pas. Il cherche à plaire aux gens. »

C'est là la maladie fondamentale. Les LLM commerciaux sont entraînés à satisfaire les utilisateurs. Les recherches sur la flagornerie induite par le RLHF le confirment — les modèles adhèrent systématiquement à la prémisse implicite de l'utilisateur pour maximiser les scores de « serviabilité ». Lorsqu'un propriétaire demande « Puis-je refuser ce locataire ? », le modèle entend « Aidez-moi à refuser ce locataire » et s'exécute. Lorsqu'un chef d'entreprise demande « Puis-je passer au sans-espèces ? », le modèle entend « Dites-moi que je peux passer au sans-espèces. »

Dans le secteur public, une IA doit souvent être peu serviable au désir immédiat de l'utilisateur afin d'être utile à sa conformité à long terme. Les LLM commerciaux standards ne sont pas conçus pour cela.

Le travail d'un responsable de la conformité est de dire non. D'être la personne dans la pièce qui abat la réponse commode. Nous tentions de construire un responsable de la conformité numérique par-dessus une technologie optimisée pour ne jamais dire non.

Qu'est-ce qui a réellement mal tourné avec MyCity ?

Une infographie montrant les trois catégories précises de conseils illégaux donnés par le chatbot MyCity, avec la loi effectivement enfreinte et les sanctions réelles pour chacune.

Soyons précis quant à l'ampleur de la défaillance, car les détails comptent.

Le chatbot MyCity a dit aux chefs d'entreprise que les magasins de New York pouvaient refuser les paiements en espèces. Le § 20-840 du Code administratif de New York l'interdit explicitement — le conseil municipal a adopté cette loi spécifiquement pour protéger les résidents non bancarisés, qui sont de manière disproportionnée à faible revenu, âgés et sans papiers. Première infraction : 1 000 $ d'amende. Infractions ultérieures : 1 500 $ chacune.

Il a dit aux employeurs qu'ils pouvaient prélever une partie des pourboires de leurs employés. La loi fédérale au titre de la FLSA et le droit du travail de l'État de New York l'interdisent tous deux. Les sanctions comprennent des dommages-intérêts forfaitaires pouvant atteindre 100 % des salaires impayés.

Il a dit aux propriétaires qu'ils n'avaient pas besoin d'accepter les bons de la Section 8. La loi sur les droits de l'homme de New York inscrit la « source légale de revenu » comme catégorie protégée. Les amendes pour discrimination fondée sur la source de revenu ont atteint jusqu'à 1 million de dollars.

Et voici la partie qui devrait terrifier tout responsable technologique gouvernemental : lorsqu'on le lui demandait directement, le chatbot disait aux utilisateurs : « Oui, vous pouvez utiliser ce bot pour des conseils professionnels d'affaires. » L'avertissement sur le site web disait le contraire. Le modèle contredisait sa propre enveloppe de sécurité.

Le maire Adams a défendu le déploiement : « On ne peut pas rester en laboratoire éternellement. » Mais ceci n'est pas un test bêta pour une application de livraison de repas. Lorsque vous placez une IA sur un domaine .gov et la présentez comme la ressource officielle de la ville pour la conformité réglementaire, vous ne testez pas un logiciel. Vous émettez des directives gouvernementales. Et lorsque ces directives sont fausses, des gens vont en prison, perdent leur entreprise ou sont expulsés.

Pour un examen plus approfondi des défaillances juridiques spécifiques et de leur contexte légal, j'ai rédigé une décomposition interactive de l'analyse complète.

Pourquoi ne peut-on pas simplement corriger les invites ?

C'est la question que me pose chaque directeur technique gouvernemental. « Ne peut-on pas simplement ajouter de meilleures instructions ? Affiner sur le code local ? Ajouter un avertissement ? »

Non. Et je dois expliquer pourquoi, car la défaillance ici n'est pas un bug. C'est l'architecture.

Les grands modèles de langage sont des générateurs de texte probabilistes. Ils prédisent le mot suivant le plus probable en fonction des schémas statistiques de leurs données d'entraînement. Ils optimisent la plausibilité, pas la vérité. Dans l'écriture créative, c'est un atout. En droit, c'est une catastrophe.

Le droit statutaire est binaire. Une action est soit légale, soit illégale, selon un texte précis dans une section de code précise. Il n'y a pas de « probablement légal ». Il n'y a pas de « statistiquement susceptible d'être conforme ». L'interdiction du sans-espèces à New York existe soit dans le § 20-840 du Code administratif, soit elle n'existe pas. Le LLM ne vérifie pas le § 20-840. Il vérifie ce qu'internet dit généralement des politiques d'espèces et génère la réponse à la sonorité la plus plausible.

C'est ce que j'appelle la dérive sémantique — le modèle glisse de la définition juridique précise vers la compréhension familière trouvée dans ses données d'entraînement. La plupart des textes sur internet à propos des relations propriétaire-locataire traitent du droit des propriétaires de choisir leurs locataires. C'est le schéma dominant. L'exception spécifique de New York protégeant les détenteurs de bons est un signal minuscule noyé dans le bruit. Le modèle suit la foule.

Trois problèmes structurels rendent cela impossible à corriger avec les seules invites :

Les données d'entraînement du modèle ont une date limite de connaissances. L'interdiction du sans-espèces à New York a été promulguée en 2020. Si le corpus d'entraînement penche vers des textes antérieurs à 2020, le modèle revient par défaut au schéma plus ancien et plus courant : les magasins peuvent fixer leurs propres politiques de paiement.

Le raisonnement du modèle est opaque. Vous ne pouvez pas retracer pourquoi il croit que les pourboires peuvent être confisqués. Il n'y a pas de chaîne de citations dans les poids neuronaux — seulement des associations statistiques. Vous ne pouvez pas auditer ce que vous ne pouvez pas voir.

Même avec la génération augmentée par récupération — le correctif standard où l'on alimente le modèle avec des documents pertinents — les implémentations naïves échouent sur le texte juridique. Les codes juridiques sont des structures hiérarchiques où une interdiction dans la Section A dépend d'une définition dans la Section B et d'une exception dans la Section C. La RAG standard découpe les documents en fragments de 500 tokens qui rompent ces connexions. Le modèle peut récupérer la bonne section mais manquer l'exception critique trois paragraphes plus loin.

L'argument qui a failli nous faire dérailler

Environ un an après le début de la construction de notre système, nous avons connu une véritable crise d'équipe. La moitié de l'équipe d'ingénierie voulait continuer à améliorer notre pipeline RAG — de meilleurs embeddings, un meilleur découpage, un meilleur reclassement. L'autre moitié, que je dirigeais, voulait jeter tout le paradigme.

Les partisans de la RAG avaient un argument. Notre précision de récupération s'améliorait. Nous étions passés de 72 % à 89 % sur notre banc d'essai de requêtes de code municipal. C'est bien. Dans la plupart des applications d'IA, c'est excellent.

Mais je revenais sans cesse à ce que ce taux d'échec de 11 % signifiait en pratique. Si vous êtes une ville desservant 8 millions de résidents et que 11 % de vos réponses juridiques sont fausses, vous ne gérez pas un service utile. Vous gérez une loterie dont le lot est un procès.

J'ai dit quelque chose lors de cette réunion qui, je crois, a cristallisé notre orientation : « Nous ne construisons pas un système qui a généralement raison. Nous construisons un système qui n'a jamais tort avec assurance. »

Il y a une différence énorme. Un système qui a généralement raison hallucinera tout de même une autorisation juridique avec une pleine assurance, et un chef d'entreprise la suivra. Un système qui n'a jamais tort avec assurance refusera de répondre lorsqu'il est incertain — ce qui est exactement ce que fait un fonctionnaire responsable. « Je ne suis pas sûr à ce sujet — laissez-moi vous orienter vers quelqu'un qui l'est. »

Le but n'est pas un chatbot qui connaît la loi. Le but est un système qui sait ce qu'il ne sait pas — et le dit.

Cet argument l'a emporté. Nous avons abandonné l'approche « améliorer la RAG » et avons commencé à construire ce que nous appelons désormais l'application des citations statutaires.

Comment construit-on une IA qui ne peut pas halluciner la loi ?

Un schéma d'architecture système montrant le pipeline en trois étapes de l'approche d'application des citations statutaires de Veriprajna : récupération par graphe de connaissances hiérarchique, décodage contraint et examen par agent de vérification.

Le principe est trompeusement simple : Pas de citation = pas de sortie.

Si notre système ne peut pas récupérer une section précise et valide du code municipal officiel qui appuie directement sa réponse, il lui est architecturalement interdit de générer une réponse. Pas découragé. Pas invité à faire attention. Interdit. La voie neuronale menant à générer une affirmation non étayée est littéralement sectionnée au niveau de la couche de décodage.

Voici comment cela fonctionne en pratique.

Nous ne découpons pas les codes juridiques en fragments de texte arbitraires. Nous construisons un graphe de connaissances hiérarchique qui reflète la structure réelle de la loi — Titre, Chapitre, Sous-chapitre, Section, Paragraphe — avec des arêtes de graphe reliant les définitions aux clauses opératoires, les interdictions à leurs exceptions et les infractions à leurs sanctions. Lorsque quelqu'un pose une question sur les magasins sans-espèces, le système ne cherche pas simplement « espèces ». Il parcourt la hiérarchie du Titre 20 (Affaires des consommateurs) pour localiser le Sous-chapitre 21, en tirant l'interdiction, la définition d'« établissement de vente au détail » et la structure des sanctions comme une unité connectée.

Vient ensuite la partie qui compte vraiment : le décodage contraint. Nous utilisons le guidage par machine à états finis pour restreindre le vocabulaire de sortie du modèle au moment de l'inférence. Le modèle doit générer sa réponse dans un schéma JSON strict qui comprend l'affirmation, l'identifiant de citation précis et l'URL source. Si le modèle tente de citer une section de code qui n'existe pas dans le contexte récupéré, la probabilité de ce token est fixée à zéro. Le modèle ne peut pas halluciner une citation parce que l'algorithme de décodage ne le laisse pas former les mots.

Et avant que quoi que ce soit n'atteigne l'utilisateur, un agent de vérification distinct — voyez-le comme un superviseur numérique examinant le travail d'un employé — vérifie si le texte cité appuie réellement l'affirmation générée. Le § 20-840 dit-il vraiment que les magasins sans-espèces sont illégaux ? La citation correspond-elle à la réponse ? En cas de discordance, la sortie est supprimée et le système renvoie un refus sûr : « Je n'ai pas pu trouver de réglementation précise répondant à votre question. Veuillez contacter le Department of Small Business Services. »

Pour l'architecture technique complète — les mathématiques du décodage contraint, la méthodologie de construction du graphe, la conception de l'agent de vérification — consultez notre article de recherche détaillé.

Pourquoi cela compte-t-il au-delà de New York ?

Parce que l'exposition juridique est énorme, et la plupart des dirigeants gouvernementaux ne s'en rendent pas encore compte.

Considérez la doctrine de l'entrapment by estoppel. Si un fonctionnaire vous dit qu'une certaine conduite est légale, et que vous vous fiez à cette déclaration, vous pouvez disposer d'un moyen de défense contre des poursuites. Les tribunaux n'ont pas définitivement statué sur la question de savoir si un chatbot d'IA compte comme un « fonctionnaire » à cette fin — mais l'équivalence fonctionnelle est difficile à nier. Le chatbot est l'interface gouvernementale désignée. Si les tribunaux acceptent ce moyen de défense, les villes seraient légalement empêchées de faire appliquer leurs propres lois contre des personnes qui ont été induites en erreur par leur propre IA. Les hallucinations créeraient une immunité juridique accidentelle pour les contrevenants à la loi.

Il y a ensuite le Moffatt v. Air Canada, précédent de 2024. Le chatbot d'Air Canada a halluciné une politique tarifaire de deuil. Lorsque le passager s'y est fié et en a fait les frais, Air Canada a tenté une défense stupéfiante : le chatbot était une « entité juridique distincte » responsable de ses propres actes. Le tribunal a démoli cet argument. Les organisations sont responsables de toutes les informations sur leurs plateformes, qu'il s'agisse de texte statique ou de contenu généré dynamiquement par une IA. Vous ne pouvez pas vous décharger par une clause de non-responsabilité des promesses de votre propre chatbot.

Lorsqu'un gouvernement déploie une IA qui hallucine des autorisations juridiques, il ne crée pas seulement une mauvaise expérience utilisateur. Il renonce potentiellement à l'immunité souveraine, permet des moyens de défense fondés sur l'entrapment, et s'expose à des réclamations en responsabilité du fait des produits.

Le règlement européen sur l'IA (EU AI Act) classe l'IA dans les « services publics essentiels » comme à haut risque, exigeant exactitude, transparence et supervision humaine. Un système qui invente des lois serait non conforme. Les murs réglementaires se referment à l'échelle mondiale.

« Mais qu'en est-il des cas limites ? »

Les gens s'opposent toujours à la règle « Pas de citation = pas de sortie » avec la même préoccupation : qu'en est-il des questions où la loi est réellement ambiguë ? Qu'en est-il des situations inédites que le code ne traite pas ?

C'est en réalité là que l'architecture brille, et non là où elle s'effondre. Lorsque les scores de récupération sont faibles — c'est-à-dire que le système ne trouve pas de loi clairement pertinente — ou lorsque l'agent de vérification détecte des interprétations contradictoires, le système déclenche ce que nous appelons un refus sûr. Il indique à l'utilisateur : ceci est une question complexe qui nécessite un conseil professionnel, et voici l'organisme précis à contacter.

Ce n'est pas un échec. C'est le système fonctionnant exactement comme prévu. Un fonctionnaire responsable qui ne connaît pas la réponse n'en invente pas une. Il dit : « Laissez-moi vous orienter vers quelqu'un qui s'occupe de cela. » Le fait que la plupart des chatbots d'IA préféreraient fabriquer une réponse plutôt que d'admettre leur incertitude est tout le problème que nous résolvons.

L'autre objection que j'entends : « Cela semble coûteux et lent comparé au simple déploiement de GPT avec une invite. » Oui. C'est plus coûteux. Cela exige de construire un graphe de connaissances structuré de l'ensemble du code municipal, de mettre en œuvre des pipelines de décodage contraint et de maintenir une couche de vérification. Cela exige de traiter l'IA gouvernementale comme une infrastructure, pas comme un hackathon de week-end.

Mais savez-vous ce qui est plus coûteux ? Un recours collectif de chaque chef d'entreprise qui a suivi le conseil illégal de votre chatbot. La Commission des droits de l'homme de New York infligeant des amendes d'un million de dollars aux propriétaires à qui votre système a dit de discriminer. Les retombées politiques lorsque la presse découvre que votre « fonctionnaire numérique » est un violateur automatisé des droits civiques.

L'ère du chatbot gouvernemental en version bêta est révolue

Voici ce que je crois, dit clairement : l'approche du « mince habillage » de l'IA gouvernementale — où vous prenez un LLM commercial, ajoutez une invite système qui dit « vous êtes un assistant municipal serviable » et le déployez sur un domaine .gov — devrait être considérée comme une faute professionnelle.

Non pas parce que la technologie est mauvaise. GPT-4 est remarquable. Mais il est remarquable en tant que générateur de texte créatif. L'utiliser pour interpréter le droit statutaire sans contraintes architecturales revient à utiliser une voiture de sport pour labourer un champ. La machine n'est pas cassée. Vous l'utilisez mal.

La technologie pour construire une IA gouvernementale déterministe et ancrée dans les citations existe aujourd'hui. RAG hiérarchique, décodage contraint, vérification multi-agents — rien de tout cela n'est théorique. Nous l'avons construite. Elle fonctionne. La question est de savoir si les dirigeants gouvernementaux auront la volonté de l'exiger, ou s'ils continueront à déployer des chatbots qui disent aux propriétaires d'enfreindre la loi parce que la démo avait l'air impressionnante.

Chaque requête à un système d'IA gouvernemental est un citoyen qui demande à l'État : Qu'exige de moi la loi ? Cette question mérite une réponse ancrée dans le texte réel de la loi réelle — citée, liée, vérifiable. Ou elle mérite un honnête « Je ne sais pas. »

Dans l'arène à enjeux élevés des services publics, l'exactitude n'est pas un atout. C'est une obligation constitutionnelle.

La prochaine fois qu'une ville lancera un assistant d'IA, la première question ne devrait pas être « Est-il serviable ? ». Elle devrait être « Peut-il citer ses sources ? ». Si la réponse est non, ce système n'a rien à faire arborant un badge .gov.

Related Research

Also Published On