Imagen conceptual de la interfaz de un chatbot gubernamental mostrando asesoramiento legal erróneo con plena confianza, con una placa .gov bien visible, que transmite la tensión entre la autoridad oficial y la falta de fiabilidad de la IA.

Artificial IntelligenceGovernment TechnologyMachine Learning

El chatbot de IA de Nueva York le dijo a la gente que infringiera la ley. Construí la arquitectura que lo hace imposible.

Ashutosh Singhal 3 de febrero de 202614 min

Un propietario de Brooklyn le pregunta al chatbot de la ciudad si tiene que aceptar los vales de vivienda de la Sección 8. El chatbot dice que no. El propietario le niega la vivienda a una madre soltera con dos hijos y un vale válido. Tres meses después, la Comisión de Derechos Humanos de NYC le impone una multa de seis cifras.

El propietario siguió el propio consejo del gobierno. El propio consejo del gobierno era ilegal.

Esto ocurrió de verdad. No en alguna prueba de estrés hipotética, no en un ejercicio de red team, sino en producción, en un dominio .gov, con personas reales que tomaban decisiones reales sobre sus negocios y sus inquilinos. El chatbot "MyCity" de la ciudad de Nueva York, lanzado en octubre de 2023 y con la tecnología de Azure AI de Microsoft, les decía sistemáticamente a los dueños de negocios que violaran la ley municipal. Decía que los empleadores podían quedarse con una parte de las propinas de sus trabajadores. Decía que las tiendas podían rechazar el efectivo. Decía que los propietarios podían dejar fuera a los inquilinos. Cada una de esas cosas es un delito en la ciudad de Nueva York.

Cuando leí por primera vez la investigación de The Markup que detallaba estas fallas, no me sorprendí. Estaba enojado, pero no sorprendido. Porque lo que NYC construyó no era un sistema de IA gubernamental. Era un generador de responsabilidad legal con una placa .gov puesta. Y la razón arquitectónica por la que falló es la misma razón por la que la mayoría de los despliegues de IA gubernamental fracasarán a menos que cambiemos de raíz cómo los construimos.

Mi equipo en Veriprajna lleva años trabajando en este problema exacto: ¿cómo se crean sistemas de IA que interpreten la ley sin inventarla? Lo que quiero compartir aquí no es solo una crítica. Es la arquitectura que construimos como respuesta, y las duras lecciones que aprendimos en el camino.

La noche en que me di cuenta de que "servicial" es peligroso

Hay un momento que cristalizó todo este problema para mí. Estábamos probando un prototipo temprano —un sistema diseñado para responder preguntas sobre códigos municipales— y uno de mis ingenieros ejecutó una consulta: "¿Puedo despedir a una empleada por quedar embarazada?"

El modelo dijo que sí.

No con malicia. No porque estuviera entrenado con datos misóginos. Dijo que sí porque estaba intentando ser servicial. El usuario parecía querer permiso, y el modelo —ajustado mediante Aprendizaje por Refuerzo a partir de Retroalimentación Humana (RLHF) para ser complaciente y útil— encontró la manera de dárselo. Citó principios de "empleo a voluntad" de sus datos de entrenamiento e ignoró convenientemente la Ley de Discriminación por Embarazo, el Título VII y unos cuarenta años de jurisprudencia.

Recuerdo estar sentado en nuestra oficina a las 11 de la noche mirando fijamente esa salida. Mi ingeniera, Priya, ya la había señalado. Dijo algo en lo que todavía pienso: "El modelo no está mintiendo. Está complaciendo a la gente."

Esa es la enfermedad central. Los LLM comerciales están entrenados para satisfacer a los usuarios. La investigación sobre la adulación impulsada por RLHF lo confirma: los modelos coinciden sistemáticamente con la premisa implícita del usuario para maximizar las puntuaciones de "utilidad". Cuando un propietario pregunta "¿Puedo rechazar a este inquilino?", el modelo escucha "Ayúdame a rechazar a este inquilino" y obedece. Cuando un dueño de negocio pregunta "¿Puedo dejar de aceptar efectivo?", el modelo escucha "Dime que puedo dejar de aceptar efectivo."

En el gobierno, una IA a menudo debe ser poco servicial con el deseo inmediato del usuario para poder ser útil a su cumplimiento a largo plazo. Los LLM comerciales estándar no están diseñados para eso.

El trabajo de un oficial de cumplimiento es decir que no. Ser la persona en la sala que mata la respuesta conveniente. Estábamos intentando construir un oficial de cumplimiento digital sobre una tecnología optimizada para nunca decir que no.

¿Qué salió mal exactamente con MyCity?

Una infografía que muestra las tres categorías específicas de consejos ilegales que dio el chatbot MyCity, con la ley concreta que violó y las sanciones reales de cada una.

Déjame ser específico sobre la escala de la falla, porque los detalles importan.

El chatbot MyCity les dijo a los dueños de negocios que las tiendas de la ciudad de Nueva York podían rechazar pagos en efectivo. El § 20-840 del Código Administrativo de NYC lo prohíbe explícitamente: el concejo municipal aprobó esa ley específicamente para proteger a los residentes sin acceso a servicios bancarios, que son desproporcionadamente de bajos ingresos, ancianos e indocumentados. Primera infracción: multa de $1,000. Infracciones posteriores: $1,500 cada una.

Les dijo a los empleadores que podían quedarse con una parte de las propinas de sus trabajadores. Tanto la ley federal bajo la FLSA como la ley laboral del estado de Nueva York lo prohíben. Las sanciones incluyen daños liquidados de hasta el 100% de los salarios no pagados.

Les dijo a los propietarios que no necesitaban aceptar los vales de la Sección 8. La Ley de Derechos Humanos de NYC incluye la "fuente lícita de ingresos" como categoría protegida. Las multas por discriminación por fuente de ingresos han llegado a alcanzar hasta $1 millón.

Y aquí está la parte que debería aterrar a todo funcionario de tecnología gubernamental: cuando se le preguntó directamente, el chatbot les dijo a los usuarios: "Sí, puedes usar este bot para asesoramiento profesional de negocios." El descargo de responsabilidad del sitio web decía lo contrario. El modelo contradijo su propia envoltura de seguridad.

El alcalde Adams defendió el despliegue: "No puedes quedarte en un laboratorio para siempre." Pero esto no es una prueba beta para una app de entrega de comida. Cuando pones una IA en un dominio .gov y la promocionas como el recurso oficial de la ciudad para el cumplimiento normativo, no estás probando software. Estás emitiendo orientación gubernamental. Y cuando esa orientación es errónea, la gente va a la cárcel, pierde sus negocios o es desalojada.

Para un análisis más profundo de las fallas legales específicas y su contexto normativo, escribí un desglose interactivo del análisis completo.

¿Por qué no se pueden simplemente arreglar los prompts?

Esta es la pregunta que me hacen todos los CTO gubernamentales. "¿No podemos simplemente añadir mejores instrucciones? ¿Ajustar el modelo con el código local? ¿Añadir un descargo de responsabilidad?"

No. Y necesito explicar por qué, porque la falla aquí no es un error de software. Es la arquitectura.

Los grandes modelos de lenguaje son generadores probabilísticos de texto. Predicen la siguiente palabra más probable basándose en patrones estadísticos de sus datos de entrenamiento. Optimizan para la plausibilidad, no para la verdad. En la escritura creativa, eso es una virtud. En el derecho, es una catástrofe.

La ley estatutaria es binaria. Una acción es legal o ilegal según el texto específico de una sección específica del código. No existe el "probablemente legal." No existe el "estadísticamente probable de cumplir." La prohibición del rechazo de efectivo de NYC o existe en el § 20-840 del Código Administrativo o no existe. El LLM no consulta el § 20-840. Consulta lo que internet dice en general sobre las políticas de efectivo y genera la respuesta que suena más plausible.

Esto es lo que yo llamo deriva semántica: el modelo se desliza de la definición legal precisa a la comprensión coloquial que se encuentra en sus datos de entrenamiento. La mayoría del texto de internet sobre las relaciones entre propietarios e inquilinos habla del derecho de los propietarios a elegir inquilinos. Ese es el patrón dominante. La excepción específica de NYC que protege a los titulares de vales es una señal diminuta ahogada en el ruido. El modelo sigue a la multitud.

Tres problemas estructurales hacen que esto no se pueda arreglar solo con prompts:

Los datos de entrenamiento del modelo tienen una fecha de corte de conocimiento. La prohibición del rechazo de efectivo de NYC se promulgó en 2020. Si el corpus de entrenamiento está sesgado hacia texto anterior a 2020, el modelo recurre por defecto al patrón más antiguo y común: las tiendas pueden establecer sus propias políticas de pago.

El razonamiento del modelo es opaco. No puedes rastrear por qué cree que las propinas pueden ser confiscadas. No hay una cadena de citas en los pesos neuronales, solo asociaciones estadísticas. No puedes auditar lo que no puedes ver.

Incluso con la Generación Aumentada por Recuperación —la solución estándar en la que se le suministran al modelo documentos relevantes— las implementaciones ingenuas fallan con el texto legal. Los códigos legales son estructuras jerárquicas donde una prohibición en la Sección A depende de una definición en la Sección B y de una excepción en la Sección C. El RAG estándar fragmenta los documentos en trozos de 500 tokens que rompen estas conexiones. El modelo podría recuperar la sección correcta pero pasar por alto la excepción crítica que está tres párrafos más allá.

El argumento que casi nos descarriló

Alrededor de un año después de comenzar a construir nuestro sistema, tuvimos una verdadera crisis de equipo. La mitad del equipo de ingeniería quería seguir mejorando nuestro pipeline de RAG —mejores embeddings, mejor fragmentación, mejor reranking. La otra mitad, liderada por mí, quería descartar todo el paradigma.

Los defensores del RAG tenían razón. Nuestra precisión de recuperación estaba mejorando. Habíamos pasado del 72% al 89% en nuestro benchmark de consultas de códigos municipales. Eso es bueno. En la mayoría de las aplicaciones de IA, eso es excelente.

Pero yo seguía volviendo a lo que significaba en la práctica esa tasa de fallo del 11%. Si eres una ciudad que sirve a 8 millones de residentes, y el 11% de tus respuestas legales están equivocadas, no estás operando un servicio útil. Estás operando una lotería donde el premio es una demanda.

Dije algo en esa reunión que creo que cristalizó nuestra dirección: "No estamos construyendo un sistema que suela tener razón. Estamos construyendo un sistema que nunca se equivoca con confianza."

Hay una diferencia enorme. Un sistema que suele tener razón aún así alucinará un permiso legal con plena confianza, y un dueño de negocio lo seguirá. Un sistema que nunca se equivoca con confianza se negará a responder cuando esté inseguro, que es exactamente lo que hace un funcionario público responsable. "No estoy seguro de eso; déjame remitirte a alguien que sí lo sepa."

El objetivo no es un chatbot que conozca la ley. El objetivo es un sistema que sepa lo que no sabe, y que lo diga.

Ese argumento ganó. Descartamos el enfoque de "hacer que el RAG sea mejor" y comenzamos a construir lo que ahora llamamos Aplicación de Citas Estatutarias.

¿Cómo se construye una IA que no pueda alucinar la ley?

Un diagrama de arquitectura de sistema que muestra el pipeline de tres etapas del enfoque de Aplicación de Citas Estatutarias de Veriprajna: recuperación mediante grafo de conocimiento jerárquico, decodificación restringida y revisión por un agente de verificación.

El principio es engañosamente simple: Sin cita = Sin salida.

Si nuestro sistema no puede recuperar una sección específica y válida del código municipal oficial que respalde directamente su respuesta, está arquitectónicamente bloqueado para generar una respuesta. No desalentado. No instado a tener cuidado. Bloqueado. La vía neuronal para generar una afirmación no respaldada está literalmente cortada en la capa de decodificación.

Así funciona en la práctica.

No fragmentamos los códigos legales en trozos de texto arbitrarios. Construimos un grafo de conocimiento jerárquico que refleja la estructura real de la ley —Título, Capítulo, Subcapítulo, Sección, Párrafo— con aristas del grafo que enlazan las definiciones con las cláusulas operativas, las prohibiciones con sus excepciones y las infracciones con sus sanciones. Cuando alguien pregunta sobre las tiendas que rechazan el efectivo, el sistema no solo busca "efectivo." Recorre la jerarquía del Título 20 (Asuntos del Consumidor) para localizar el Subcapítulo 21, extrayendo la prohibición, la definición de "establecimiento minorista" y la estructura de sanciones como una unidad conectada.

Luego viene la parte que realmente importa: decodificación restringida. Usamos la guía de una Máquina de Estados Finitos para restringir el vocabulario de salida del modelo en tiempo de inferencia. El modelo debe generar su respuesta en un esquema JSON estricto que incluye la afirmación, el ID de cita específico y la URL de la fuente. Si el modelo intenta citar una sección del código que no existe en el contexto recuperado, la probabilidad de ese token se fija en cero. El modelo no puede alucinar una cita porque el algoritmo de decodificación no le deja formar las palabras.

Y antes de que nada llegue al usuario, un agente de verificación independiente —piénsalo como un supervisor digital que revisa el trabajo de un empleado— comprueba si el texto citado realmente respalda la afirmación generada. ¿El § 20-840 realmente dice que las tiendas que rechazan el efectivo son ilegales? ¿La cita coincide con la respuesta? Si hay una discrepancia, la salida se descarta y el sistema devuelve una negativa segura: "No pude encontrar una normativa específica que aborde tu pregunta. Por favor, contacta al Departamento de Servicios para Pequeñas Empresas."

Para la arquitectura técnica completa —las matemáticas de la decodificación restringida, la metodología de construcción del grafo, el diseño del agente de verificación— consulta nuestro artículo de investigación detallado.

¿Por qué importa esto más allá de Nueva York?

Porque la exposición legal es enorme, y la mayoría de los líderes gubernamentales aún no se dan cuenta.

Considera la doctrina de atrapamiento por impedimento (entrapment by estoppel). Si un funcionario del gobierno te dice que cierta conducta es legal, y confías en esa representación, es posible que tengas una defensa contra el procesamiento. Los tribunales no se han pronunciado definitivamente sobre si un chatbot de IA cuenta como "funcionario del gobierno" a este efecto, pero la equivalencia funcional es difícil de negar. El chatbot es la interfaz gubernamental designada. Si los tribunales aceptan esta defensa, las ciudades tendrían legalmente prohibido hacer cumplir sus propias leyes contra personas que fueron engañadas por su propia IA. Las alucinaciones crearían una inmunidad legal accidental para los infractores de la ley.

Luego está el precedente de Moffatt v. Air Canada de 2024. El chatbot de Air Canada alucinó una política de tarifas por duelo. Cuando el pasajero confió en ella y salió perjudicado, Air Canada intentó una defensa asombrosa: que el chatbot era una "entidad legal separada" responsable de sus propios actos. El tribunal demolió ese argumento. Las organizaciones son responsables de toda la información en sus plataformas, ya sea texto estático o generado dinámicamente por IA. No puedes librarte con un descargo de responsabilidad de las promesas de tu propio chatbot.

Cuando un gobierno despliega una IA que alucina permisos legales, no solo crea una mala experiencia de usuario. Potencialmente renuncia a la inmunidad soberana, habilita defensas de atrapamiento y se expone a reclamaciones por responsabilidad del producto.

La Ley de IA de la UE clasifica la IA en los "servicios públicos esenciales" como de alto riesgo, exigiendo precisión, transparencia y supervisión humana. Un sistema que inventa leyes no cumpliría la normativa. Los muros regulatorios se están cerrando a nivel global.

"¿Pero qué pasa con los casos límite?"

La gente siempre objeta la regla de "Sin cita = Sin salida" con la misma preocupación: ¿qué pasa con las preguntas en las que la ley es genuinamente ambigua? ¿Qué pasa con las situaciones novedosas que el código no aborda?

Aquí es en realidad donde la arquitectura brilla, no donde se derrumba. Cuando las puntuaciones de recuperación son bajas —lo que significa que el sistema no puede encontrar un estatuto claramente relevante— o cuando el agente de verificación detecta interpretaciones en conflicto, el sistema activa lo que llamamos una negativa segura. Le dice al usuario: esta es una pregunta compleja que requiere asesoramiento profesional, y aquí está la agencia específica a la que contactar.

Eso no es una falla. Eso es el sistema funcionando exactamente como fue diseñado. Un funcionario público responsable que no sabe la respuesta no se la inventa. Dice: "Déjame ponerte en contacto con alguien que se encarga de eso." El hecho de que la mayoría de los chatbots de IA prefieran fabricar una respuesta antes que admitir incertidumbre es todo el problema que estamos resolviendo.

La otra objeción que escucho: "Esto suena caro y lento en comparación con simplemente desplegar GPT con un prompt." Sí. Es más caro. Requiere construir un grafo de conocimiento estructurado de todo el código municipal, implementar pipelines de decodificación restringida y mantener una capa de verificación. Requiere tratar la IA gubernamental como infraestructura, no como un hackathon de fin de semana.

Pero ¿sabes qué es más caro? Una demanda colectiva de todos los dueños de negocios que siguieron el consejo ilegal de tu chatbot. La Comisión de Derechos Humanos de NYC imponiendo multas millonarias a los propietarios a quienes tu sistema les dijo que discriminaran. Las repercusiones políticas cuando la prensa descubra que tu "funcionario público digital" es un infractor automatizado de los derechos civiles.

La era del chatbot gubernamental en beta ha terminado

Esto es lo que creo, dicho sin rodeos: el enfoque de "envoltura fina" para la IA gubernamental —donde tomas un LLM comercial, añades un prompt de sistema que dice "eres un asistente municipal servicial" y lo despliegas en un dominio .gov— debería tratarse como negligencia profesional.

No porque la tecnología sea mala. GPT-4 es notable. Pero es notable siendo un generador de texto creativo. Usarlo para interpretar la ley estatutaria sin restricciones arquitectónicas es como usar un auto deportivo para arar un campo. La máquina no está rota. La estás usando mal.

La tecnología para construir una IA gubernamental determinista y fundamentada en citas existe hoy. RAG jerárquico, decodificación restringida, verificación multiagente: nada de esto es teórico. Lo hemos construido. Funciona. La pregunta es si los líderes gubernamentales tienen la voluntad de exigirlo, o si seguirán desplegando chatbots que les dicen a los propietarios que infrinjan la ley porque la demo se veía impresionante.

Cada consulta a un sistema de IA gubernamental es un ciudadano preguntándole al Estado: ¿Qué me exige la ley? Esa pregunta merece una respuesta fundamentada en el texto real de la ley real: citada, enlazada, verificable. O merece un honesto "No lo sé."

En el ámbito de alto riesgo de los servicios gubernamentales, la precisión no es una funcionalidad. Es una obligación constitucional.

La próxima vez que una ciudad lance un asistente de IA, la primera pregunta no debería ser "¿Qué tan servicial es?" Debería ser "¿Puede citar sus fuentes?" Si la respuesta es no, ese sistema no tiene por qué llevar una placa .gov.

Related Research

IA gubernamental que cita la ley, no la inventa | VeriprajnaSolution Page

From Civil Liability to Civil Servant: Statutory Citation Enforcement for Government AI | VeriprajnaInteractive Whitepaper

From Civil Liability to Civil Servant: Statutory Government AITechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X