Construimos motores de IA conversacional sobre los archivos de los editores. Respuestas con citas obligatorias, razonamiento temporal, resolución de entidades GraphRAG y una estrategia paralela de licenciamiento que captura ingresos de los motores de IA que usted no controla. Para editores de tamaño medio que no pueden permitirse un equipo de ML de seis ingenieros, pero que tampoco pueden permitirse esperar.
48%
de las consultas de Google ahora muestran Resúmenes de IA
theStacc / Search Engine Land, marzo de 2026
-33%
tráfico de búsqueda de editores interanual, hasta noviembre de 2025
Reuters Institute, 2026
-43%
caída adicional que los ejecutivos de medios prevén para 2029
Encuesta Trends 2026 del Reuters Institute
Un escenario concreto, no un problema abstracto.
Un diario regional con 4 millones de usuarios únicos mensuales y un archivo de 32 años analiza las cifras en su informe para el consejo de febrero de 2026. Las referencias de búsqueda orgánica han caído un 41% interanual. Los CPM programáticos han bajado otro 18%. Sus ingresos por afiliación, que mantuvieron a flote el modelo de negocio en 2023, se han desplomado a un tercio de su máximo. La misma trayectoria que Penske Media citó en su demanda antimonopolio contra Google en septiembre de 2025. El director financiero hace la pregunta obvia: ¿qué nos debe Google exactamente y cómo hacemos que pague?
La respuesta es incómoda. Google no les debe nada contractualmente. El acuerdo tácito (tú nos rastreas, tú nos envías tráfico) fue reescrito unilateralmente cuando los Resúmenes de IA empezaron a aparecer en el 48% de las consultas. Cuando un Resumen de IA aparece por encima de un enlace orgánico, el Daily Mail midió una caída del 89% en los clics desde escritorio. El panel de marzo de 2025 de Pew descubrió que los usuarios que se encontraban con un Resumen de IA hacían clic hacia un enlace tradicional en apenas el 8% de todas las visitas. El contenido del editor sigue leyéndose. Al editor ya no se le paga.
Mientras tanto, la respuesta obvia, «construir nuestra propia IA», tiene sus propias cicatrices. The Washington Post lanzó Ask The Post AI en noviembre de 2024. En diciembre de 2025, se filtraron mensajes internos de Slack del editor de estándares: su pódcast generado por IA estaba inventando citas, atribuyendo mal las fuentes e insertando comentarios como si fueran la posición editorial del periódico. «Es verdaderamente asombroso que se permitiera siquiera que esto saliera adelante», escribió un editor, «nunca habría imaginado que el Washington Post deformara deliberadamente su propio periodismo y luego difundiera estos errores a nuestra audiencia a gran escala». El fallo técnico fue un paso de verificación de citas que faltaba. El daño reputacional fue global.
Esta es la verdadera forma del problema. Los editores de tamaño medio no pueden permitirse no hacer nada. El motor de búsqueda que construyó su distribución es ahora su mayor competidor. Tampoco pueden permitirse lanzar un chatbot que alucina bajo su propia cabecera. Y no pueden replicar los equipos internos de ML que el FT, Bloomberg y The New York Times construyeron antes del precipicio. Necesitan un socio de desarrollo que haya hecho el trabajo poco glamuroso: ingesta de archivos, resolución de entidades, aplicación de citas, colas de revisión editorial y una estrategia paralela de licenciamiento que capture ingresos de los motores de IA que nunca poseerán.
Saque esto en su próxima reunión de estrategia. Hemos intentado ser honestos sobre lo que cada opción hace y lo que no hace.
| Opción | Lo que realmente hace | Dónde se queda corta |
|---|---|---|
| Proveedor de chatbot SaaS (Tars, envoltorios básicos de búsqueda en el sitio) | Coloca un widget de chat en su sitio. Embeddings vectoriales de sus artículos. Cotizado en 60K-120K USD, desplegado en semanas. | Sin resolución de entidades. Sin razonamiento temporal. Sin verificación de citas. Alucina en las consultas que importan (de múltiples saltos, longitudinales). Su archivo queda en la nube de ellos. |
| Desarrollo interno de los Cinco Grandes (FT, NYT, Bloomberg, WaPo, Guardian) | RAG personalizado sobre el archivo propietario. Ask FT funciona con Anthropic Claude con citas obligatorias. Bloomberg tiene BloombergGPT y traducción de BQL. | Construido por equipos de ML de 6 a 20 ingenieros a lo largo de 12-24 meses. El coste asciende a siete cifras. Los editores de tamaño medio no pueden replicar la plantilla, punto. |
| Big 4 / gran integrador de sistemas (Accenture, Deloitte, IBM iX) | Lo construirán. Han hecho trabajo de IA generativa para industrias adyacentes. | Los proyectos cuestan entre 1,5M y más de 5M USD con una fase de descubrimiento que dura más que su margen de supervivencia. Recurren al mismo stack de Microsoft GraphRAG y Neo4j que nosotros, pero cobran por encima una consultoría de nivel socio. No han construido cinco archivos de editores uno tras otro. |
| Cloudflare Pay Per Crawl (enero de 2026) | Bloquea por defecto a los rastreadores de IA en ~20% del tráfico web global. Le permite establecer Permitir / Cobrar / Bloquear por rastreador a un precio por solicitud aplicado a todo el dominio. | No impide que los Resúmenes de IA resuman su contenido (lo recuperan en el momento de la consulta). No genera retención. Pura captura de fugas, y el descubrimiento de precios aún es inmaduro. |
| News/Media Alliance + ProRata (marzo de 2026) | Bolsa de licenciamiento colectivo para 2.200 editores pequeños/medianos. Reparto de ingresos 50/50 sobre respuestas de IA con atribución rastreada a través de Gist.ai. La NMA gestiona el papeleo. | Los ingresos dependen de que Gist.ai gane adopción frente a ChatGPT, Perplexity y Gemini. Etapa inicial. El acuerdo paralelo NMA+Bria es solo RAG empresarial. |
| Tollbit / peajes directos a bots | Cobra por solicitud de rastreo, mecanismo similar a Cloudflare pero configurable bot por bot. Boston Globe, Vox y Future lo han probado en piloto. | El mismo límite estructural que Cloudflare: captura ingresos de los rastreadores, no ingresos de las consultas. Los editores honestos deberían ejecutar tanto Tollbit como una jugada del lado de las consultas. |
| Veriprajna (nosotros) | Desarrollo personalizado del motor conversacional sobre su stack, con aplicación de citas, resolución de entidades GraphRAG, razonamiento temporal y gobernanza editorial. Más la integración de ProRata, Bria, Tollbit y Cloudflare en una única estrategia de ingresos. | Somos una consultora, no un SaaS. No resolvemos la asimetría de poder de las plataformas. Solo su gobierno puede hacerlo. No fingiremos que los dólares de licenciamiento de ProRata o Bria reemplazarán el 100% de los ingresos de búsqueda perdidos. No lo harán, en 2026. |
Cada proyecto es personalizado. Estas son las cuatro áreas de capacidad que nos siguen pidiendo combinar.
El 60% poco glamuroso de cada proyecto. OCR consciente del diseño para microfilmes escaneados y PDF anteriores a 2005 (Tesseract para documentos limpios, Azure Document Intelligence o Google Document AI para páginas de periódico con muchas columnas). Fragmentación semántica que respeta titulares, sumarios y firmas en lugar de cortar cada 500 palabras. Enriquecimiento de metadatos con fecha de publicación, autor, sección y Reconocimiento de Entidades Nombradas para Personas, Organizaciones, Ubicaciones, Proyectos de Ley y Casos.
Luego el paso de resolución de entidades: colapsar «Sr. Musk», «Elon Musk», «director ejecutivo de Tesla» en un solo nodo, y desambiguar «John Smith el concejal» de «John Smith el director de escuela» a lo largo de 25 años de firmas. Combinamos extracción basada en LLM con reglas deterministas afinadas a su temática, y luego revisión humana para las 200 entidades principales por número de artículos. Senzing o Neo4j Graph Data Science se encargan del lado algorítmico. Las decisiones de criterio son nuestras y suyas, conjuntamente.
La búsqueda vectorial por sí sola no puede responder «¿Cómo cambió la postura del alcalde sobre la vivienda entre 2010 y 2024?» porque la respuesta no está en ningún fragmento individual. Procesamos el archivo en un grafo de conocimiento de Neo4j o Amazon Neptune con aristas tipadas (HAS_STANCE, ENDORSED_BY, VOTED_ON), y luego versionamos cada arista con marcas de tiempo valid_start y valid_end derivadas de las fechas de publicación.
En el momento de la consulta, un planificador agéntico descompone la pregunta en subconsultas temporales, recorre el grafo y ensambla una narrativa cronológica con citas en línea. Usamos Microsoft GraphRAG como la base de código abierto y personalizamos los prompts de extracción de entidades a sus temáticas específicas. Para archivos más extensos añadimos una capa de T-GRAG (arXiv 2510.13590) para recuperación sensible al tiempo. Esta es la diferencia entre un chatbot que encuentra artículos y uno que sintetiza la historia a través de ellos.
El incidente del pódcast del Washington Post es el caso aleccionador. Tres capas, sin atajos. Primero, un prompt de sistema de anclaje estricto prohíbe cualquier afirmación que no esté en el contexto recuperado. Segundo, un verificador a posteriori (una llamada a un LLM aparte) comprueba cada oración generada contra su fuente citada y descarta cualquier oración cuya cita no contenga realmente la afirmación. Tercero, un umbral de confianza encamina las respuestas de baja confianza hacia una cola de revisión editorial antes de que lleguen al usuario, con niveles de gravedad configurables.
Instrumentamos el registro de respuestas para que su mesa de estándares pueda auditar cualquier sesión en menos de una hora. También construimos un «interruptor de emergencia», un único control de panel que desactiva el widget público mientras mantiene el back end funcionando para ingeniería. Aburrido, esencial, nunca presente en un chatbot SaaS.
La mayoría de las consultoras le venden una sola jugada. La respuesta honesta es que necesita ambas. La jugada de retención es su propio motor conversacional, empaquetado como un nivel de suscripción premium de «Inteligencia» (el modelo de Ask FT: más de 1.000 USD al año por usuario profesional con consultas agénticas ilimitadas). La jugada de captura de fugas es optar por ProRata (reparto de ingresos 50/50 a través de Gist.ai), Bria (uso empresarial de IA interna) y Tollbit (peajes directos a bots), además de una postura de Cloudflare Pay Per Crawl que bloquea GPTBot, ClaudeBot, CCBot y Google-Extended mientras cobra a Perplexity y Mistral.
Integramos los paneles de licenciamiento con su analítica de ingresos existente para que su director financiero vea una única vista, no cinco. No prometeremos que los dólares de licenciamiento reemplazarán los ingresos de búsqueda perdidos en 2026. Sí prometeremos que usted no los está dejando sobre la mesa.
Sin presentación de descubrimiento que lleve un trimestre. Sin documento de estrategia de 80 páginas. Entregamos un widget de chat funcional ante su equipo editorial en la semana 8 e iteramos a partir de ahí.
Tomamos una muestra del 1% de su archivo, medimos la dificultad de ingesta (exportación limpia de Arc XP vs. microfilme escaneado vs. HTML roto de 2003), redactamos un inventario de entidades de sus 200 Personas/Organizaciones/Lugares principales, y cotizamos el desarrollo completo con un intervalo de confianza defendible. La variación entre el mejor y el peor caso solo para la ingesta es de aproximadamente 8 a 1 en esfuerzo. Le damos a su director financiero una cifra, no un rango.
Construir la canalización de ingesta (OCR, fragmentación semántica, enriquecimiento de metadatos). Levantar la capa de recuperación híbrida: búsqueda dispersa BM25 para coincidencias exactas de entidades más embeddings vectoriales densos para similitud semántica, con un reordenador Cohere o BGE por encima. Desplegar el widget de chat en un entorno de pruebas que sus editores puedan romper en privado.
Ejecutar la extracción y resolución de entidades en todo el archivo. Levantar Neo4j con aristas versionadas. Añadir el descompositor de consultas temporales. Al final de la Fase 2 el widget de chat puede responder «cómo evolucionó X a lo largo de Y años» con una respuesta ordenada cronológicamente y respaldada por citas.
Desplegar el verificador de citas a posteriori, la cola de revisión por umbral de confianza y las herramientas de auditoría de la mesa de estándares. Abrir el widget a un pequeño porcentaje de suscriptores autenticados tras un feature flag. Ajustar la política de longitud de respuestas y las plantillas de rechazo contra registros de consultas reales, no contra benchmarks sintéticos.
Conectar la atribución de ProRata y Bria a su panel de ingresos. Configurar las reglas de Cloudflare Pay Per Crawl por rastreador. Ayudar a producto y precios a diseñar el nivel Inteligencia y su flujo de prueba. Transferir la propiedad operativa a su equipo con un período de soporte conjunto de 90 días.
Advertencia honesta: los plazos asumen un archivo de 100K-500K artículos en Arc XP, Brightspot o WordPress VIP. Un archivo académico de 5 millones de artículos en Atypon, o una pila de microfilmes escaneados de los años 90, pueden añadir de 8 a 16 semanas solo a la Fase 1. La auditoría de la Fase 0 existe para detectar esto antes de que usted firme una cifra.
Ocho preguntas. Le dice qué fase dominará el coste de su desarrollo y qué corregir antes de pedir cotización a cualquier proveedor.
Para un archivo de 10-25 años con 100K-500K artículos, un motor conversacional de calidad de producción cuesta aproximadamente 180K-450K USD para el desarrollo inicial, más 4K-15K USD mensuales para inferencia, almacenamiento vectorial y llamadas al reordenador a volúmenes de consulta típicos de un editor de tamaño medio. La canalización de ingesta es la partida más grande, normalmente el 50-60% del coste de desarrollo. La variación depende de tres cosas: cuán limpio está ya el archivo (exportaciones modernas de Arc XP vs. microfilme escaneado de los años 90), si necesita una capa de grafo de conocimiento para consultas de múltiples saltos, y la profundidad de las herramientas de revisión editorial. Un envoltorio de chatbot SaaS vendido por un proveedor de plataforma le cotizará 60K USD pero alucinará en las consultas que importan, porque nunca construyó una vista con entidades resueltas de su archivo específico.
Los primeros datos de FT Professional y Bloomberg Terminal apuntan en la otra dirección. Ask FT aumentó lo que el FT llama internamente la interacción del Lector Central Real al hacer aflorar contenido de archivo perenne que los suscriptores de otro modo nunca encontrarían. El temor a la canibalización asume una bolsa estática de intención. En realidad, las consultas conversacionales atraen a los usuarios hacia sesiones más profundas sobre temas que habrían abandonado tras hojear un solo resultado de búsqueda. El riesgo es real para el contenido de noticias generales liviano donde el chatbot puede resumir un único artículo en un párrafo. Es mucho menor para el contenido analítico, longitudinal e investigativo donde la experiencia de chat es un asistente de investigación, no un TL;DR. Dimensionamos el nivel de precios y la política de longitud de respuestas para que coincidan con la profundidad de su contenido, no para copiar una plantilla de un editor distinto.
Cloudflare Pay Per Crawl, lanzado en enero de 2026 en aproximadamente el 20 por ciento del tráfico web global, le permite establecer Permitir, Cobrar o Bloquear por rastreador a un precio aplicado a todo el dominio. La respuesta técnicamente correcta es que puede bloquear GPTBot, ClaudeBot, CCBot y PerplexityBot mientras sigue permitiendo Googlebot y Bingbot, porque Google separa públicamente el rastreo de Googlebot de Google-Extended (el recolector de entrenamiento de Gemini). Bloquear Google-Extended no afecta al posicionamiento en búsqueda. La preocupación política es que los Resúmenes de IA de Google siguen mostrando contenido de páginas indexadas incluso cuando Google-Extended está bloqueado, porque lo recuperan en el momento de la consulta. Así que bloquear no impide que su contenido sea resumido en los AIO, solo impide que se use para entrenar futuras versiones de Gemini. Una postura defendible para la mayoría de los editores de tamaño medio en 2026 es: Bloquear GPTBot, ClaudeBot, CCBot y Google-Extended. Cobrar a PerplexityBot y Mistral. Permitir Googlebot y Bingbot. Luego encaminar los dólares de licenciamiento a través de ProRata, Bria y Tollbit para capturar ingresos de los motores de IA que usted no controla.
Usted. El incidente del pódcast de IA del Washington Post de diciembre de 2025 (citas ficticias, insertar comentarios como la posición editorial del periódico) es el caso aleccionador que convirtió esto de una hipótesis en una cuestión de nivel de consejo para los editores. No hay un escudo de la Sección 230 para el contenido que su propio sistema genera a partir de su propio archivo; la salida de la IA se trata como su producto de trabajo editorial. Las mitigaciones son arquitectónicas, no contractuales. Aplicamos tres capas: un prompt de sistema de anclaje estricto que prohíbe usar cualquier conocimiento fuera de los fragmentos recuperados, verificación de citas a posteriori que descarta cualquier oración cuya fuente citada no contenga la afirmación, y un umbral de confianza que encamina las respuestas de baja confianza hacia una cola de revisión editorial antes de que lleguen al usuario. También instrumentamos el registro de respuestas para que su mesa de estándares pueda auditar cualquier sesión en menos de una hora de que ocurra. Nada de esto existe en un envoltorio de chatbot SaaS.
El RAG vectorial recupera fragmentos que son semánticamente similares a la consulta. Eso funciona para la búsqueda de hechos. Falla en las consultas que hacen valioso un archivo de noticias: Cómo evolucionó la postura del alcalde sobre la vivienda a lo largo de 12 años. Quién conecta a la Persona X con el Escándalo Z a través de qué organizaciones intermedias. Cuáles fueron las fuentes recurrentes citadas en la cobertura de la controversia del consejo escolar. Estas son consultas de múltiples saltos, longitudinales e impulsadas por entidades. GraphRAG preprocesa el archivo en un grafo de entidades (personas, organizaciones, lugares, eventos) con relaciones tipadas, y luego recorre el grafo en el momento de la consulta. La parte difícil no es la base de datos de grafos (Neo4j o Amazon Neptune se encargan de ella). La parte difícil es la resolución de entidades: colapsar «Sr. Musk», «Elon Musk», «director ejecutivo de Tesla» y «dueño de X» en un solo nodo, y desambiguar «John Smith el concejal de la ciudad» de «John Smith el director del instituto» a lo largo de 25 años de firmas y erratas de corresponsales. Usamos una combinación de extracción basada en LLM, reglas deterministas de resolución de entidades afinadas a su temática, y revisión humana para las 200 entidades principales por número de artículos. Esa es la parte que nadie más hará por usted.
El motor conversacional es un servicio aparte que consume un feed de su CMS y expone una API de chat de vuelta a su sitio. El patrón de integración difiere según el stack. Arc XP expone una API de Contenido y webhooks pero ningún gancho de embedding, así que ejecutamos un trabajo de sincronización que extrae las historias nuevas y actualizadas cada cinco minutos y las vuelve a embeber. WordPress VIP admite endpoints REST personalizados y normalmente lo desplegamos como un microservicio aparte más un bloque de Gutenberg para el widget de chat. Brightspot es el más flexible por su modelo de tipos de contenido, que hace mucho más limpia la extracción de metadatos estructurados. Los editores de Atypon (mayormente académicos) conviven con la búsqueda de Literatum en lugar de reemplazarla. En todos los casos el widget de chat es un embed de JS que sus editores pueden colocar en cualquier página, y el back end funciona en su cuenta de nube, no en la nuestra. No le atamos a un servicio alojado.
Ambos, y resuelven problemas distintos. El acuerdo NMA + ProRata anunciado en marzo de 2026 es una bolsa de licenciamiento colectivo: 2.200 editores pueden adherirse para monetizar la demanda empresarial impulsada por RAG a cambio de un reparto de ingresos 50/50, con atribución rastreada. Bria es el acuerdo paralelo dirigido al uso empresarial de IA interna. Estos son captura de fugas, le pagan cuando un motor de IA que usted no posee usa su contenido. Su propio motor conversacional es la jugada de retención: profundiza la interacción con su audiencia existente y crea un nivel premium. ProRata le paga una fracción de una fracción por consulta. Su propio nivel de inteligencia (Ask FT cobra más de 1K USD al año por usuario profesional) es de alto margen y se compone con el valor de su archivo. Ejecute ambos. El coste de participar en ProRata es casi nulo (la NMA gestiona el papeleo), y los ingresos son incrementales sobre la inversión en ingeniería que ya está haciendo.
Para un archivo limpio de Arc XP o Brightspot con 100K-500K artículos, un widget de chat anclado en citas con búsqueda híbrida y filtrado temporal básico se entrega en 14-18 semanas. GraphRAG con resolución de entidades añade otras 10-14 semanas. Un nivel de asistente de investigación agéntico añade 8-12 semanas por encima. La partida individual más larga es siempre la ingesta del archivo, especialmente si tiene contenido anterior a 2005 con HTML roto, fotos faltantes o PDF escaneados de un proyecto de digitalización de microfilmes. Empezamos con una auditoría de archivo de 2 semanas antes de cotizar un plazo fijo, porque la variación entre «exportar del CMS» y «hacer OCR a un millón de páginas escaneadas» es de 8 a 1 en esfuerzo. La auditoría le da una cifra defendible para llevar a su director financiero.
El whitepaper interactivo que respalda esta página de solución.
Tratamiento arquitectónico completo: GraphRAG, RAG temporal, RAG agéntico, el modelo de negocio de Inteligencia como Servicio, y estudios de caso detallados de Ask FT y Bloomberg Terminal AI.
Empiece con la auditoría de archivo de 2 semanas. Precio fijo, sin compromiso con el desarrollo completo.
Tomamos una muestra del 1% de su contenido, medimos la dificultad de ingesta, redactamos sus 200 entidades principales, y le damos a su director financiero una cifra defendible para el desarrollo completo. Si la auditoría dice que no construya, se lo decimos.