IA GOUVERNEMENTALE & MUNICIPALE
Le chatbot MyCity de New York a dit aux propriétaires qu'ils pouvaient refuser les bons de la Section 8. Il a dit aux commerces qu'ils pouvaient ignorer l'interdiction du sans-espèces. Il a dit aux employeurs qu'ils pouvaient prélever les pourboires des travailleurs. Chaque réponse était illégale. Chaque réponse portait la caution de la ville. Nous construisons une IA gouvernementale où chaque réponse remonte à une loi précise, sinon le système reste silencieux.
17-33 %
Taux d'hallucination des principaux outils d'IA juridique
Stanford/JELS, Magesh et al., 2025
78 projets de loi
Projets de loi sur la sécurité des chatbots d'État dans 27 États en 2026
AI2Work Legislative Tracker, 2026
15 M€
Sanction de l'EU AI Act pour non-conformité à haut risque
EU AI Act, article 99, 2024
Que vous évaluiez l'IA pour les services aux citoyens pour la première fois, que vous vous releviez d'un déploiement raté ou que vous cherchiez à rendre un chatbot existant juridiquement défendable, cette page expose ce qui fonctionne réellement, ce qui ne fonctionne pas et ce qu'il faut pour construire une IA gouvernementale qui résiste à l'examen.
L'échec n'est pas hypothétique. Il s'est produit sur un domaine .gov, auprès de véritables chefs d'entreprise, avec de véritables conséquences juridiques.
En octobre 2023, New York a lancé MyCity sur Microsoft Azure AI, entraîné sur plus de 2 000 pages web de la ville. L'enquête de The Markup en mars 2024 a documenté des conseils illégaux systématiques dans des domaines fondamentaux du droit new-yorkais :
| Domaine juridique | Ce que MyCity a dit | Ce que la loi dit réellement | Sanction encourue en suivant le conseil |
|---|---|---|---|
| Travail / Salaires | « Oui, vous pouvez prélever une part des pourboires de votre employé » | Illégal en vertu du FLSA et de la NY Labor Law § 196-d. Les employeurs ne peuvent retenir aucune partie des pourboires des employés. | Poursuites pour vol de salaire, enquête du DOL, dommages-intérêts forfaitaires pouvant atteindre 100 % des salaires impayés |
| Protection des consommateurs | « Aucune réglementation n'oblige les entreprises à accepter les espèces » | Illégal. Le NYC Admin Code § 20-840 interdit les magasins sans espèces afin de protéger les citoyens non bancarisés. | 1 000 $ pour la première infraction, 1 500 $ pour les infractions ultérieures |
| Droit au logement | « Les propriétaires n'ont pas besoin d'accepter les bons de la Section 8 » | Illégal. La NYC Human Rights Law interdit la discrimination fondée sur la source des revenus depuis 2008. | Amendes pouvant atteindre 250 000 $, dommages-intérêts compensatoires, modifications obligatoires des politiques |
| Droit locatif | « Il est légal d'enfermer un locataire dehors » | Illégal. L'expulsion illicite est une infraction pénale après 30 jours d'occupation. | Poursuites pénales, dommages-intérêts triplés, rétablissement immédiat de la possession |
La ville a ajouté des avertissements. Le chatbot lui-même disait aux utilisateurs : « Oui, vous pouvez utiliser ce robot pour des conseils professionnels aux entreprises. » Le maire entrant Mamdani a qualifié l'outil de « fonctionnellement inutilisable » et a entrepris de mettre fin au programme d'environ 500 000 $.
Le problème est architectural, et non une question de réglage. Les grands modèles de langage sont des moteurs probabilistes optimisés pour produire un résultat qui semble plausible. Lorsqu'un propriétaire demande « Puis-je refuser un locataire de la Section 8 ? », le modèle s'appuie sur le motif statistiquement dominant de ses données d'entraînement : le droit général des contrats (la liberté de choisir ses locataires). La disposition spécifique de la NYC Human Rights Law interdisant la discrimination fondée sur la source des revenus est une exception locale qui se voit supplantée par le signal d'entraînement plus large du modèle.
Les modèles entraînés par RLHF aggravent cela. Ils sont réglés pour être « serviables », ce qui en pratique signifie abonder dans le sens de l'intention implicite de l'utilisateur. Un propriétaire qui s'interroge sur le refus de locataires obtient un « oui » parce que le modèle interprète la question comme « aide-moi à refuser ce locataire » plutôt que « que dit la loi ». Une IA gouvernementale doit souvent être peu serviable face au désir immédiat de l'utilisateur afin d'être exacte sur le plan du droit.
Ajouter du RAG ne résout pas le problème. L'étude de Stanford de 2025 a testé des outils commerciaux d'IA juridique dotés de génération augmentée par récupération : même le meilleur (LexisNexis Lexis+ AI) hallucine 17 % du temps. L'AI-Assisted Research de Westlaw atteint 33 %. L'étape de récupération peut extraire la bonne loi, mais l'étape de génération peut tout de même la mal interpréter, l'ignorer au profit des a priori d'entraînement, ou synthétiser une réponse qui semble plausible à partir de la mauvaise combinaison de passages récupérés.
Les chatbots gouvernementaux qui donnent des conseils juridiques opèrent dans la zone de la « fonction propriétaire ». Lorsqu'une ville déploie une IA qui fournit des orientations commerciales précises et concrètes, elle agit comme un consultant et n'exerce pas un pouvoir gouvernemental discrétionnaire. Cette distinction compte parce que les fonctions propriétaires ne bénéficient pas de la protection de l'immunité souveraine. Un consultant privé qui aurait donné les conseils que MyCity a donnés serait exposé à des actions pour faute professionnelle.
Le NY Senate Bill S7263, qui est parvenu en séance plénière du Sénat le 26 février 2026, créerait une responsabilité civile explicite lorsque les chatbots donnent des conseils professionnels substantiels. Il crée un droit d'action privé pour les dommages réels, plus les honoraires d'avocat en cas de violations délibérées. Le projet de loi a été adopté en commission par 6 voix contre 0. L'EU AI Act classe l'IA gouvernementale tournée vers les citoyens comme à haut risque au titre de l'Annexe III, avec des sanctions pouvant atteindre 15 millions d'euros ou 3 % du chiffre d'affaires mondial, à compter d'août 2026. Ce n'est pas un problème futur. C'est une réalité réglementaire actuelle qui converge vers chaque administration ayant déployé un chatbot sans imposition de citations.
Un repère pour évaluer vos options. Les lacunes de ce tableau sont là où la plupart des déploiements échouent.
| Catégorie | Acteurs clés | Ce qu'ils livrent réellement | Lacune |
|---|---|---|---|
| Plateformes cloud | Microsoft Azure Government, AWS GovCloud, Google Public Sector | Infrastructure autorisée FedRAMP, LLM généralistes (GPT-4, Bedrock, Gemini), outillage RAG de base | Une plateforme, pas une solution. Azure faisait tourner MyCity. Le problème d'hallucination se situe au-dessus de la couche plateforme. |
| Éditeurs d'IA juridique | Thomson Reuters CoCounsel, LexisNexis Lexis+ AI | Recherche juridique à citations vérifiées pour les avocats. CoCounsel compte plus d'un million d'utilisateurs, avec une recherche agentique appuyée sur des citations issues de Westlaw. | Conçu pour les avocats, pas pour les citoyens. Tarification pour cabinets d'avocats (plus de 200 $/utilisateur/mois). Aucune spécialisation en codes municipaux. Aucune intégration 311/CRM. |
| Éditeurs de codes municipaux | Municode (LexisNexis), American Legal Publishing, CivicPlus | Bases de données structurées de codes municipaux. Municode.ai propose un chat fondé sur le RAG portant sur les codes. CivicPlus a lancé 6 produits d'IA en janvier 2026. | Municode.ai en est à ses débuts, sans antécédents en marchés publics gouvernementaux. CivicPlus AI relève du niveau chatbot, sans imposition de citations. Aucune couche de décodage contraint ni de vérification. |
| Big 4 / grands intégrateurs (SI) | Deloitte, Accenture Federal, CGI | Gestion de programme, navigation des marchés publics, documentation ATO. Déploient des plateformes éditeur dans les périmètres du cloud gouvernemental. Accenture a enregistré 3,6 Md$ de travaux d'IA pour l'exercice 2025. | Ils implémentent des plateformes, ils ne construisent pas une intelligence sur mesure. 60 à 70 % du coût va à la gestion de programme et à la documentation. Les missions s'échelonnent de 500 K$ à plus de 5 M$. L'architecture de MyCity est le genre de chose qu'ils déploieraient. |
| Éditeurs de chatbots GovTech | Citibot, Polimorphic, CrafterQ | Chatbots tournés vers les citoyens pour les services 311. Sunny, à Denver, prend en charge 72 langues. Conçus spécifiquement pour l'expérience utilisateur gouvernementale. | Une couche conversationnelle au-dessus d'une récupération basique. Aucun décodage contraint, aucune imposition de citations légales, aucune vérification multi-agents. Une exactitude de surface. |
| Veriprajna | Construction sur mesure | IA municipale à citations imposées, dotée d'un RAG hiérarchique, d'un décodage contraint, d'agents de vérification et de pistes d'audit. Déployée à l'intérieur de votre périmètre FedRAMP existant. | Cabinet de plus petite taille. Pas d'accords-cadres (MSA) gouvernementaux existants. Ne gère pas la navigation des marchés publics ni la gestion de programme (les SI le font mieux). Ce n'est pas une plateforme. |
Lacune assumée : l'adhésion de l'organisation et la conduite du changement sont des obstacles réels qu'aucun prestataire, nous compris, ne résout par la technologie. Si votre personnel ne fait pas confiance au système, il le contournera, quelle que soit son exactitude.
Quatre capacités, chacune répondant à un mode de défaillance précis des déploiements d'IA gouvernementale actuels.
Chaque requête citoyenne renvoie une réponse structurée avec la loi précise, l'article de code et l'URL source, sinon le système refuse de répondre. Il s'agit de décodage contraint au niveau du token : le vocabulaire du modèle est masqué dynamiquement pendant la génération, de sorte qu'il lui est littéralement impossible de produire un identifiant de citation qui n'existe pas dans le contexte récupéré.
Nous recourons à l'indexation hiérarchique parce que les codes municipaux sont des arbres, et non des documents plats. Une question d'urbanisme sur les food trucks exige une traversée du Titre 17 (urbanisme), du Titre 8 (santé), du Titre 20 (affaires des consommateurs) et des règles applicables du DCA. Le découpage RAG standard rompt ces références croisées. Notre index enrichi par graphe préserve la structure : des nœuds parents pour l'intention, des nœuds enfants pour le texte opérationnel, et des définitions liées pour les termes qui les relient.
Les codes municipaux arrivent sous forme de vidages PDF du greffe de la ville, de fragments HTML de Municode ou d'American Legal Publishing, d'exports de CMS propriétaires et, parfois, d'images numérisées d'amendements. Nous construisons des pipelines automatisés qui normalisent tout cela en un graphe de connaissances structuré doté d'un versionnage tenant compte du temps.
Chaque disposition porte des métadonnées : date d'entrée en vigueur, date d'abrogation (le cas échéant), montant de la sanction, agence chargée de l'application et liens de références croisées. Lorsque le conseil adopte une ordonnance, le pipeline ingère la mise à jour et réindexe. Les lois abrogées passent dans un index historique. Le système ne cite jamais de droit caduc. Des contrôles de réconciliation hebdomadaires comparent le graphe au code en vigueur de l'éditeur pour détecter tout ce que le pipeline automatisé aurait manqué.
Avant qu'un citoyen ne voie une réponse, nous soumettons le système à un red team contre des requêtes adverses : « Comment expulser un locataire ? », « Puis-je licencier des employées enceintes ? », « Comment éviter de payer les heures supplémentaires ? » Nous cartographions chaque chemin de requête et identifions où l'hallucination crée une exposition juridique.
Nous testons par rapport au paysage réglementaire précis auquel votre juridiction est confrontée : les limites des conseils professionnels du NY S7263, les obligations à haut risque de l'EU AI Act (échéance d'août 2026), les exigences d'accessibilité de la Section 508, l'alignement sur le NIST AI RMF pour la notation des marchés publics, et la législation spécifique de votre État sur les chatbots. Le résultat est une piste d'audit documentée qui satisfait à la fois les comités de revue internes et les exigences de conformité externes.
Lorsque la confiance de récupération tombe sous le seuil, le système ne dit pas « Je ne sais pas, appelez le 311. » Il achemine vers le bon service avec le contexte : la requête initiale, les résultats de récupération partiels et une classification suggérée. Le citoyen obtient une orientation précise, et l'agent destinataire voit ce que le système a déjà trouvé.
Nous construisons cette couche de triage avec une intégration bidirectionnelle à votre CRM existant (Salesforce Government Cloud, ServiceNow ou votre plateforme 311). Un interrupteur d'arrêt au niveau du sujet permet aux administrateurs de désactiver des domaines de requête précis sans arrêter l'ensemble du système. Si une erreur émerge dans les requêtes liées au logement, vous pouvez fermer le nœud logement tandis que la délivrance des licences commerciales continue de fonctionner.
Une requête réelle qui exige de traverser le droit de l'urbanisme, la réglementation du service de santé, la délivrance des licences commerciales et les règles du DCA. C'est le genre de question qui révèle si un système est réellement ancré dans le code ou se contente de générer un texte plausible.
Le système identifie qu'« ouvrir un food truck » est une requête multi-domaines. Il la décompose en quatre cibles de récupération : les permis de vente ambulante de nourriture (DCA), les licences d'établissement de service alimentaire (Santé), les restrictions d'urbanisme sur les vendeurs ambulants (Urbanisme) et les exigences générales de licence commerciale (Finances).
Pour chaque cible, le système traverse le graphe de connaissances. Pour la question d'urbanisme en particulier : il navigue du Titre 17 (Urbanisme) vers les dispositions sur les vendeurs ambulants, récupère le NYC Admin Code § 17-315 (qui interdit les food trucks sur la 5e Avenue entre la 42e et la 59e Rue), recoupe les exigences de licence de vendeur ambulant du DCA et extrait les normes de service alimentaire de l'Article 81 du service de santé. Chaque disposition récupérée porte son identifiant de citation, sa date d'entrée en vigueur et sa clause de sanction.
Le LLM génère une réponse, mais sous contrainte. Les identifiants de citation autorisés se limitent aux articles précis récupérés à l'étape 2. Si le modèle tente de référencer une loi absente de l'ensemble récupéré, ce token est masqué à une probabilité de zéro. Le résultat doit se conformer à un schéma JSON exigeant : claim, citation_id, source_url et confidence_score pour chaque affirmation factuelle.
Avant que la réponse n'atteigne le citoyen, un agent de vérification distinct effectue trois contrôles. Implication : le texte cité étaye-t-il réellement l'affirmation ? (Le modèle pourrait citer la bonne loi mais la mal interpréter.) Conflit : existe-t-il des dispositions contradictoires dans l'ensemble récupéré ? Actualité : la loi citée est-elle toujours en vigueur ? Si l'un des contrôles échoue, le système se rabat sur un refus sûr accompagné d'une orientation précise vers un service.
Le citoyen reçoit une réponse structurée avec des citations hyperliées : « Exploiter un food truck à New York requiert une Mobile Food Vendor License du DCA [§ 17-307], un Food Service Establishment Permit du service de santé [Article 81.09] et le respect des restrictions de localisation. Les food trucks sont interdits sur la 5e Avenue entre la 42e et la 59e Rue [§ 17-315]. Confiance : élevée (4 dispositions correspondantes). Pour l'éligibilité d'urbanisme complète à votre emplacement précis, contactez le DCA à [lien direct]. »
L'intégralité de l'interaction génère un enregistrement d'audit : requête reçue, cibles de décomposition, lois récupérées avec leurs scores de pertinence, contraintes de génération appliquées, résultats de vérification et réponse finale. Cet enregistrement est stocké dans votre système de conformité et satisfait à la fois aux exigences de documentation du NIST AI RMF et aux obligations de surveillance continue de FedRAMP et StateRAMP.
Quatre phases, chacune avec un livrable défini. Nous commençons par un seul service au sein d'une seule juridiction et n'étendons qu'une fois les jalons d'exactitude atteints.
Nous ingérons le code municipal de votre éditeur (Municode, American Legal Publishing ou sources directes de la ville) et le convertissons en un graphe de connaissances hiérarchique. Chaque disposition est un nœud doté de métadonnées : date d'entrée en vigueur, sanction, agence chargée de l'application, références croisées et texte précis.
Délai : 4 à 6 semaines pour le code complet d'une seule juridiction.
Réserve : La qualité du corpus de code varie énormément. Les bases de données Municode bien tenues se convertissent en 4 semaines. Les juridictions disposant de codes uniquement en PDF, d'une numérotation incohérente ou de décennies d'ordonnances non codifiées prennent plus de temps. Nous menons une évaluation du corpus dès la première semaine afin d'éviter toute surprise sur les délais.
Livrable : Un graphe de connaissances interrogeable avec une couverture législative complète pour le service pilote, plus un pipeline de mise à jour automatisé connecté au flux de votre éditeur de codes.
Nous déployons les agents de vérification et lançons des tests adverses. Le red team bombarde le système avec les requêtes qui ont causé les échecs de MyCity (pourboires, sans-espèces, bons, mises à la porte), plus des cas limites propres à votre juridiction fournis par votre équipe juridique.
Délai : 3 à 4 semaines, en chevauchement avec la Phase 1.
Jalon : Rejet à 100 % des invites de conseils illégaux connues. Si le système donne une orientation juridique erronée sur une quelconque requête adverse, nous ne passons pas à la Phase 3.
Livrable : Un rapport de red team documentant tous les scénarios testés, les résultats et les actions correctives. Il devient une partie de votre documentation ATO.
Déploiement auprès d'un seul service (nous recommandons les licences commerciales ou la FAQ du 311 comme pilote) avec l'architecture d'imposition des citations activée. Le système fonctionne en parallèle des processus existants pendant les 2 premières semaines, afin que le personnel puisse valider les résultats par rapport à ses propres connaissances.
Délai : 2 à 3 semaines pour l'intégration et la période de fonctionnement en parallèle.
Livrable : Un système en production au service des citoyens sur le domaine pilote, avec des pistes d'audit alimentant votre système de conformité et des routes d'escalade connectées à votre CRM.
Chaque interaction citoyenne est journalisée et passée en revue. Nous surveillons la dérive de récupération (quand des mises à jour du code changent la bonne réponse mais que le graphe n'a pas encore rattrapé son retard), les nouveaux motifs adverses et les domaines de requête où le système déclenche trop fréquemment des refus sûrs (signe de lacunes de couverture).
Coût récurrent : 3 000 à 5 000 $/mois par juridiction pour la maintenance du corpus, la surveillance et la réconciliation.
Expansion : Ajouter un nouveau service à une juridiction existante prend généralement 2 à 3 semaines. Ajouter une nouvelle juridiction nécessite de revenir à la Phase 1 pour le corpus de code de cette juridiction.
Évaluez votre position actuelle sur les cinq dimensions qui déterminent si un déploiement d'IA gouvernementale crée de la valeur ou de la responsabilité. Chaque dimension est notée indépendamment afin que vous puissiez voir exactement où se situent les lacunes.
Comment votre code municipal est-il actuellement tenu à jour et accessible ?
Quel est votre statut actuel d'autorisation cloud ?
Quelle législation relative aux chatbots s'applique à votre juridiction ?
Quels systèmes traitent aujourd'hui les demandes des citoyens ?
Quel est l'historique de votre agence en matière de déploiements d'IA ou de chatbots ?
Nous construisons sur une infrastructure qui détient déjà l'autorisation. La couche d'IA que nous bâtissons s'exécute à l'intérieur de votre périmètre autorisé FedRAMP existant, qu'il s'agisse d'Azure Government, d'AWS GovCloud ou de Google Public Sector. Le moteur de décodage contraint, le graphe de connaissances et les agents de vérification sont des composants de la couche applicative qui héritent de l'autorisation de la plateforme sous-jacente. Cela compte parce que la poursuite d'une autorisation FedRAMP autonome pour un système d'IA sur mesure prend de 12 à 18 mois et coûte de 500 K$ à 2 M$ rien qu'en frais d'évaluation. En concevant l'architecture à l'intérieur d'un périmètre déjà autorisé, nous évitons entièrement ce délai. Pour les exigences StateRAMP, qu'environ 15 États imposent désormais pour les services cloud, le même principe s'applique. Nous documentons nos contrôles de couche applicative en addendum à votre System Security Plan existant. La piste d'audit que nous générons pour chaque paire requête-réponse satisfait également aux exigences de surveillance continue qu'imposent FedRAMP et StateRAMP, car chaque interaction est déjà journalisée avec les identifiants de citation, les scores de confiance de récupération et les résultats de vérification.
Les déploiements de chatbots municipaux vont de 20 000 $ pour des implémentations basiques (comme Archie, à Fairfield, en Californie) à 375 000 $ pour des programmes complets (Roseville, Californie). New York a dépensé environ 500 000 $ pour MyCity avant que le maire entrant n'entreprenne d'y mettre fin. Une mission Veriprajna pour une IA municipale à citations imposées se situe généralement dans la fourchette de 150 000 à 400 000 $ pour la première juridiction, selon la complexité du corpus de code et les exigences d'intégration. Comparez cela à l'exposition à la responsabilité. Le NY Senate Bill S7263, parvenu en séance plénière du Sénat en février 2026, crée un droit d'action privé pour dommages réels, plus les honoraires d'avocat en cas de violations délibérées lorsque les chatbots donnent des conseils professionnels. L'EU AI Act impose des sanctions pouvant atteindre 15 millions d'euros ou 3 % du chiffre d'affaires mondial pour non-conformité d'une IA à haut risque. Au-delà des sanctions légales, l'exception de fonction propriétaire à l'immunité souveraine signifie que votre municipalité pourrait faire l'objet d'actions pour fausse déclaration par négligence de la part de chaque citoyen ayant suivi un mauvais conseil de chatbot. Une seule action collective de chefs d'entreprise qui se sont fiés à des orientations de permis hallucinées éclipserait à elle seule le coût total du déploiement.
Oui, et l'architecture d'intégration est précisément là où la plupart des projets de chatbots gouvernementaux échouent en silence. Le moteur de citations expose une API REST qui accepte des requêtes en langage naturel et renvoie un JSON structuré comportant la réponse, les identifiants de citation, les URL sources, les scores de confiance et le statut de vérification. Cette API se connecte à Salesforce Government Cloud via un Lightning Web Component sur mesure, ou à ServiceNow via une application à portée définie. Pour les plateformes 311 en particulier, nous construisons une intégration bidirectionnelle : les requêtes entrantes du système 311 atteignent le moteur de citations, et lorsque le moteur déclenche un refus sûr (confiance sous le seuil), il crée un dossier dans votre CRM avec la requête initiale, les résultats de récupération partiels et un routage de service suggéré. Le citoyen obtient une orientation précise, pas un message générique « appelez le 311 ». Pour les interfaces de chatbot existantes comme CivicPlus ou des widgets web sur mesure, nous fournissons un script d'intégration qui remplace la couche de réponse probabiliste tout en préservant votre interface existante. Le délai d'intégration typique est de 2 à 3 semaines pour la connexion à l'API et de 4 à 6 semaines pour l'intégration complète du flux CRM, tests compris.
Deloitte et Accenture Federal sont des intégrateurs de plateformes. Ils déploient Azure AI ou AWS Bedrock à l'intérieur d'un périmètre de cloud gouvernemental, configurent du RAG sur vos documents et ajoutent une couche d'ingénierie d'invites. C'est exactement l'architecture qui a produit MyCity. Leur valeur réside dans la navigation des marchés publics, la documentation ATO et la gestion de programme, et ce sont là de réelles compétences qui valent la peine d'être payées sur de grands programmes. Ce qu'ils ne construisent pas, c'est la couche de décodage contraint qui empêche l'hallucination au niveau du token, le graphe de connaissances hiérarchique qui préserve les références croisées entre lois connexes, ni le pipeline de vérification multi-agents qui détecte les erreurs de récupération avant qu'elles n'atteignent les citoyens. Ce sont des choix d'architecture, pas des options de configuration dans Azure AI Studio. Une mission Big 4 pour de l'IA gouvernementale s'élève généralement de 500 000 à 5 millions de dollars, dont 60 à 70 % du coût vont à la gestion de programme, à la documentation et au soutien aux marchés publics, plutôt qu'à l'architecture technique. Nous construisons la couche technique qui manque à leurs implémentations. Dans certaines missions, nous travaillons aux côtés d'un SI qui gère les marchés publics et la gestion de programme pendant que nous construisons l'architecture d'imposition des citations. Cette combinaison vous donne expertise des marchés publics et profondeur technique sans payer les tarifs Big 4 pour de l'ingénierie d'IA sur mesure.
Tout système gouvernemental tourné vers les citoyens doit satisfaire à la Section 508 du Rehabilitation Act et aux normes WCAG 2.1 AA. Pour l'IA en particulier, cela signifie un formatage des réponses compatible avec les lecteurs d'écran, des interfaces navigables au clavier, un contraste de couleurs suffisant dans l'affichage des citations et un texte alternatif pour tout élément visuel de la réponse. Nous construisons la couche de réponse avec un HTML sémantique que les lecteurs d'écran analysent correctement, y compris des liens de citation correctement balisés et un formatage de réponse structuré. La prise en charge multilingue est un défi d'ingénierie distinct de la traduction. On ne peut pas simplement traduire les sorties de l'IA, parce que la terminologie juridique a des significations propres à chaque juridiction que les modèles de traduction génériques rendent mal. Nous traitons cela en tenant à jour des graphes de connaissances parallèles pour chaque langue prise en charge, où le texte législatif est la version officielle traduite publiée par la juridiction, et non une traduction automatique. Pour les juridictions qui ne publient pas de traductions officielles, nous signalons la réponse comme issue de l'anglais et acheminons les requêtes multilingues vers du personnel humain. Le chatbot Sunny de Denver revendique une prise en charge de 72 langues, mais il s'agit d'une traduction d'interface de surface, et non d'une interprétation législative multilingue juridiquement exacte. Nous privilégions l'exactitude au nombre de langues.
C'est le problème opérationnel le plus difficile de l'IA gouvernementale, et la raison pour laquelle la plupart des déploiements de chatbots se dégradent dans les mois qui suivent leur lancement. Les codes municipaux sont modifiés par des ordonnances adoptées par le conseil municipal, par des mises à jour réglementaires des services et par des changements de préemption d'État qui supplantent le droit local. Une seule séance du conseil municipal peut produire 20 à 30 amendements de code. Nous construisons des pipelines d'ingestion automatisés qui surveillent trois types de sources : les flux officiels des éditeurs de codes que sont Municode ou American Legal Publishing (qui fournissent des mises à jour XML/HTML structurées), les systèmes de suivi législatif des greffes municipaux qui publient les ordonnances en PDF, et les flux des assemblées législatives d'État pour les changements de préemption. Chaque mise à jour déclenche un flux de réindexation. Le graphe de connaissances utilise un versionnage tenant compte du temps, où chaque disposition porte une plage de dates d'entrée en vigueur. Lorsqu'une loi est abrogée ou modifiée, l'ancienne version passe dans un index historique, et la nouvelle version devient la cible de récupération active. Le système ne cite jamais de droit abrogé. Nous menons aussi un contrôle de réconciliation hebdomadaire qui compare le graphe de connaissances au code en ligne actuel de l'éditeur afin de détecter toute mise à jour que le pipeline automatisé aurait manquée. Pour la juridiction pilote, cette couche opérationnelle ajoute environ 3 000 à 5 000 $ par mois de maintenance récurrente, qui couvre la surveillance de l'ingestion, la réconciliation et la réindexation d'urgence lors de l'adoption de paquets législatifs majeurs.
L'architecture technique détaillée qui sous-tend cette page de solution.
De la responsabilité civile au service public : l'imposition de citations législatives pour une IA gouvernementale déterministeAnalyse complète des risques juridiques dans les déploiements d'IA gouvernementale actuels, des causes techniques profondes des hallucinations juridiques et de l'architecture Veriprajna complète pour les systèmes d'IA municipale à citations imposées.
Les échecs de chatbots municipaux coûtent plus de 500 K$ à arrêter et laissent une exposition à la responsabilité qui éclipse le budget de déploiement.
Que vous ayez besoin d'un audit de responsabilité de votre chatbot existant, d'un système à citations imposées pour un nouveau déploiement, ou d'une revue d'architecture technique avant votre prochain appel d'offres, nous pouvons cadrer la mission en une seule conversation.