Costruiamo motori di IA conversazionale sopra gli archivi degli editori. Risposte con citazioni obbligatorie, ragionamento temporale, risoluzione delle entità con GraphRAG e una strategia di licensing parallela che cattura ricavi dai motori di IA che non controllate. Per gli editori di fascia media che non possono permettersi un team di ML da sei ingegneri ma nemmeno possono permettersi di aspettare.
48%
delle query di Google mostra ora gli AI Overviews
theStacc / Search Engine Land, mar 2026
-33%
traffico di ricerca degli editori su base annua, anno fino a nov 2025
Reuters Institute, 2026
-43%
ulteriore calo che i dirigenti del settore news prevedono entro il 2029
Indagine Reuters Institute Trends 2026
Uno scenario specifico, non un problema astratto.
Un quotidiano regionale con 4 milioni di utenti unici mensili e un archivio di 32 anni analizza i numeri nel dossier per il consiglio di amministrazione del febbraio 2026. I referral da ricerca organica sono in calo del 41% anno su anno. I CPM programmatici sono scesi di un altro 18%. I loro ricavi di affiliazione, che hanno tenuto a galla il modello di business nel 2023, sono crollati a un terzo del loro picco. La stessa traiettoria che Penske Media ha citato nel suo ricorso antitrust del settembre 2025 contro Google. Il CFO pone la domanda ovvia: che cosa esattamente ci deve Google, e come facciamo a fargliela pagare?
La risposta è scomoda. Google non deve loro nulla per contratto. Il patto non scritto (voi ci fate il crawling, voi ci mandate traffico) è stato riscritto unilateralmente quando gli AI Overviews hanno iniziato a comparire sul 48% delle query. Quando un AI Overview compare sopra un link organico, il Daily Mail ha misurato un calo dell'89% del click-through da desktop. Il panel del marzo 2025 di Pew ha rilevato che gli utenti che incontrano un AI Overview hanno cliccato su un link tradizionale in appena l'8% di tutte le visite. I contenuti dell'editore vengono ancora letti. L'editore non viene più pagato.
Nel frattempo, la risposta ovvia, «costruiamo la nostra IA», ha le sue cicatrici. Il Washington Post ha lanciato Ask The Post AI nel novembre 2024. A dicembre 2025 sono trapelati messaggi Slack interni dello standards editor: il loro podcast generato dall'IA inventava citazioni, attribuiva erroneamente le fonti e inseriva commenti come se fossero la posizione editoriale del giornale. «È davvero sconcertante che a tutto questo sia stato permesso di andare avanti», ha scritto un redattore, «mai avrei immaginato che il Washington Post avrebbe deliberatamente distorto il proprio giornalismo per poi diffondere questi errori al nostro pubblico su larga scala.» Il fallimento tecnico era un passaggio di verifica delle citazioni mancante. Il danno reputazionale è stato globale.
Questa è la vera forma del problema. Gli editori di fascia media non possono permettersi di non fare nulla. Il motore di ricerca che ha costruito la loro distribuzione è ora il loro maggiore concorrente. E non possono nemmeno permettersi di pubblicare un chatbot che allucina sotto la propria testata. E non possono replicare i team di ML interni che il FT, Bloomberg e il New York Times hanno costruito prima del precipizio. Hanno bisogno di un partner di sviluppo che abbia fatto il lavoro poco affascinante: ingestione dell'archivio, risoluzione delle entità, applicazione delle citazioni, code di revisione editoriale e una strategia di licensing parallela che catturi ricavi dai motori di IA che non possederanno mai.
Tiratelo fuori alla vostra prossima riunione di strategia. Abbiamo cercato di essere onesti su ciò che ogni opzione fa e non fa.
| Opzione | Cosa fa davvero | Dove fallisce |
|---|---|---|
| Vendor di chatbot SaaS (Tars, semplici wrapper di ricerca on-site) | Mette un widget di chat sul vostro sito. Embedding vettoriali dei vostri articoli. Quotato a 60.000-120.000 $, distribuito in poche settimane. | Nessuna risoluzione delle entità. Nessun ragionamento temporale. Nessuna verifica delle citazioni. Allucina sulle query che contano (multi-hop, longitudinali). Il vostro archivio è nel loro cloud. |
| Sviluppo interno dei Big Five (FT, NYT, Bloomberg, WaPo, Guardian) | RAG personalizzato sull'archivio proprietario. Ask FT gira su Anthropic Claude con citazioni obbligatorie. Bloomberg ha BloombergGPT e la traduzione BQL. | Costruito da team di ML da 6-20 ingegneri in 12-24 mesi. Il costo arriva a sette cifre. Gli editori di fascia media non possono replicare l'organico, punto. |
| Big 4 / grandi SI (Accenture, Deloitte, IBM iX) | Lo costruiranno. Hanno svolto lavori di IA generativa per settori adiacenti. | Gli incarichi vanno da 1,5 a oltre 5 milioni $ con una fase di discovery che dura più a lungo della vostra autonomia finanziaria. Ricorrono allo stesso stack Microsoft GraphRAG e Neo4j che usiamo noi, ma fanno pagare in più la consulenza di livello partner. Non hanno costruito cinque archivi di editori uno dopo l'altro. |
| Cloudflare Pay Per Crawl (gen 2026) | Blocca per impostazione predefinita i crawler di IA su circa il 20% del traffico web globale. Vi permette di impostare Allow / Charge / Block per ciascun crawler a un prezzo per richiesta valido per l'intero dominio. | Non impedisce agli AI Overviews di riassumere i vostri contenuti (li recuperano al momento della query). Non genera retention. Pura cattura della dispersione, e la scoperta del prezzo è ancora immatura. |
| News/Media Alliance + ProRata (mar 2026) | Pool di licensing collettivo per 2.200 piccoli/medi editori. Ripartizione 50/50 dei ricavi sulle risposte IA tracciate per attribuzione tramite Gist.ai. La NMA gestisce la burocrazia. | I ricavi dipendono dall'adozione di Gist.ai contro ChatGPT, Perplexity e Gemini. Siamo agli inizi. L'accordo parallelo NMA+Bria riguarda solo il RAG enterprise. |
| Tollbit / pedaggi diretti sui bot | Fa pagare per richiesta di crawl, con un meccanismo simile a Cloudflare ma configurabile bot per bot. Boston Globe, Vox, Future lo hanno sperimentato. | Stesso limite strutturale di Cloudflare: cattura i ricavi dai crawler, non i ricavi dalle query. Gli editori onesti dovrebbero usare sia Tollbit sia una strategia lato query. |
| Veriprajna (noi) | Sviluppo personalizzato del motore conversazionale sul vostro stack, con applicazione delle citazioni, risoluzione delle entità GraphRAG, ragionamento temporale e governance editoriale. In più l'integrazione di ProRata, Bria, Tollbit e Cloudflare in un'unica strategia di ricavi. | Siamo una società di consulenza, non un SaaS. Non risolviamo l'asimmetria di potere della piattaforma. Solo il vostro governo può farlo. Non fingeremo che i dollari del licensing da ProRata o Bria sostituiranno il 100% dei ricavi di ricerca persi. Non lo faranno, nel 2026. |
Ogni incarico è su misura. Queste sono le quattro aree di capacità che ci viene chiesto continuamente di combinare.
Il poco affascinante 60% di ogni progetto. OCR consapevole del layout per microfilm scansionati e PDF antecedenti al 2005 (Tesseract per i documenti puliti, Azure Document Intelligence o Google Document AI per le pagine di giornale ricche di colonne). Chunking semantico che rispetta titoli, occhielli e firme invece di tagliare ogni 500 parole. Arricchimento dei metadati con data di pubblicazione, autore, sezione e Named Entity Recognition per Persone, Organizzazioni, Luoghi, Disegni di Legge e Cause.
Poi la fase di risoluzione delle entità: collassare «Mr. Musk», «Elon Musk», «CEO di Tesla» in un unico nodo, e disambiguare «John Smith il consigliere» da «John Smith il preside» attraverso 25 anni di firme. Combiniamo l'estrazione basata su LLM con regole deterministiche tarate sul vostro ambito, poi la revisione umana per le prime 200 entità per numero di articoli. Senzing o Neo4j Graph Data Science gestiscono il lato algoritmico. Le decisioni di giudizio sono nostre e vostre, congiuntamente.
La sola ricerca vettoriale non può rispondere a «Come è cambiata la posizione del sindaco sull'edilizia abitativa tra il 2010 e il 2024» perché la risposta non si trova in alcun singolo chunk. Elaboriamo l'archivio in un knowledge graph Neo4j o Amazon Neptune con archi tipizzati (HAS_STANCE, ENDORSED_BY, VOTED_ON), poi versioniamo ogni arco con timestamp valid_start e valid_end derivati dalle date di pubblicazione.
Al momento della query, un pianificatore agentico scompone la domanda in sotto-query temporali, attraversa il grafo e assembla una narrazione cronologica con citazioni inline. Usiamo Microsoft GraphRAG come ossatura open-source e personalizziamo i prompt di estrazione delle entità sui vostri ambiti specifici. Per archivi più lunghi sovrapponiamo T-GRAG (arXiv 2510.13590) per il recupero sensibile al tempo. Questa è la differenza tra un chatbot che trova articoli e uno che sintetizza la storia attraverso di essi.
L'incidente del podcast del Washington Post è il caso ammonitore. Tre livelli, nessuna scorciatoia. Primo, un system prompt a grounding rigoroso vieta qualsiasi affermazione non presente nel contesto recuperato. Secondo, un verificatore post-hoc (una chiamata LLM separata) controlla ogni frase generata rispetto alla sua fonte citata e scarta qualsiasi frase la cui citazione non contenga effettivamente l'affermazione. Terzo, una soglia di confidenza instrada le risposte a bassa confidenza in una coda di revisione editoriale prima che raggiungano l'utente, con livelli di gravità configurabili.
Strumentiamo il log delle risposte affinché la vostra redazione possa controllare qualsiasi sessione entro un'ora. Costruiamo inoltre un «kill switch», un singolo comando dashboard che disabilita il widget pubblico mantenendo attivo il back end per l'ingegneria. Noioso, essenziale, mai presente in un chatbot SaaS.
La maggior parte delle società di consulenza vi vende una sola strategia. La risposta onesta è che ne servono entrambe. La strategia di retention è il vostro motore conversazionale, confezionato come livello di abbonamento premium «Intelligence» (il modello Ask FT: oltre 1.000 $/anno per utente professionale con query agentiche illimitate). La strategia di cattura della dispersione consiste nell'aderire a ProRata (ripartizione 50/50 dei ricavi tramite Gist.ai), Bria (uso enterprise di IA interna) e Tollbit (pedaggi diretti sui bot), più un assetto Cloudflare Pay Per Crawl che blocca GPTBot, ClaudeBot, CCBot e Google-Extended mentre fa pagare Perplexity e Mistral.
Integriamo le dashboard di licensing con le vostre analitiche dei ricavi esistenti affinché il vostro CFO veda un'unica vista, non cinque. Non prometteremo che i dollari del licensing sostituiranno i ricavi di ricerca persi nel 2026. Vi prometteremo che non li state lasciando sul tavolo.
Nessun deck di discovery che richiede un trimestre. Nessun documento di strategia da 80 pagine. Mettiamo un widget di chat funzionante davanti al vostro team editoriale nella settimana 8 e iteriamo da lì.
Campioniamo l'1% del vostro archivio, misuriamo la difficoltà di ingestione (export Arc XP pulito vs. microfilm scansionato vs. HTML del 2003 corrotto), redigiamo un inventario delle entità delle vostre prime 200 Persone/Organizzazioni/Luoghi e quotiamo l'intero sviluppo con un intervallo di confidenza difendibile. La varianza tra il caso migliore e quello peggiore per la sola ingestione è di circa 8 a 1 in termini di sforzo. Diamo al vostro CFO un numero, non un intervallo.
Costruiamo la pipeline di ingestione (OCR, chunking semantico, arricchimento dei metadati). Allestiamo il livello di recupero ibrido: ricerca sparsa BM25 per i match esatti delle entità più embedding vettoriali densi per la somiglianza semantica, con un reranker Cohere o BGE sopra. Distribuiamo il widget di chat in un ambiente di staging che i vostri redattori possono mettere alla prova in privato.
Eseguiamo l'estrazione e la risoluzione delle entità sull'intero archivio. Allestiamo Neo4j con archi versionati. Aggiungiamo il decompositore di query temporali. Entro la fine della Fase 2 il widget di chat può rispondere a «come si è evoluto X nel corso di Y anni» con una risposta ordinata cronologicamente e supportata da citazioni.
Distribuiamo il verificatore di citazioni post-hoc, la coda di revisione a soglia di confidenza e gli strumenti di audit della redazione. Apriamo il widget a una piccola percentuale di abbonati autenticati dietro un feature flag. Mettiamo a punto la policy sulla lunghezza delle risposte e i template di rifiuto rispetto a log di query reali, non a benchmark sintetici.
Colleghiamo l'attribuzione di ProRata e Bria alla vostra dashboard dei ricavi. Configuriamo le regole Cloudflare Pay Per Crawl per ciascun crawler. Aiutiamo il prodotto e il pricing a progettare il livello Intelligence e il suo flusso di prova. Trasferiamo la titolarità operativa al vostro team con un percorso di supporto affiancato di 90 giorni.
Avvertenza onesta: le tempistiche presuppongono un archivio di 100K-500K articoli su Arc XP, Brightspot o WordPress VIP. Un archivio accademico da 5 milioni di articoli su Atypon, o una pila di microfilm scansionati degli anni '90, può aggiungere 8-16 settimane alla sola Fase 1. L'audit della Fase 0 esiste per intercettarlo prima che firmiate un numero.
Otto domande. Vi dice quale fase dominerà il costo del vostro sviluppo e cosa correggere prima di chiedere un preventivo a qualsiasi vendor.
Per un archivio di 10-25 anni di 100K-500K articoli, un motore conversazionale di livello produttivo costa all'incirca 180.000-450.000 $ per lo sviluppo iniziale, più 4.000-15.000 $ al mese per inferenza, archiviazione vettoriale e chiamate al reranker a volumi di query tipici di un editore di fascia media. La pipeline di ingestione è la voce di costo più grande, di solito il 50-60% del costo dello sviluppo. La varianza dipende da tre fattori: quanto è già pulito l'archivio (export Arc XP moderni vs. microfilm scansionato degli anni '90), se serve un livello di knowledge graph per le query multi-hop e la profondità degli strumenti di revisione editoriale. Un wrapper di chatbot SaaS venduto da un vendor di piattaforma vi quoterà 60.000 $ ma allucinerà sulle query che contano, perché non ha mai costruito una vista a entità risolte del vostro archivio specifico.
I primi dati da FT Professional e Bloomberg Terminal indicano il contrario. Ask FT ha aumentato ciò che il FT chiama internamente engagement dell'Actual Core Reader, facendo emergere contenuti d'archivio sempreverdi che gli abbonati altrimenti non troverebbero mai. Il timore di cannibalizzazione presuppone un bacino statico di intenzioni. In realtà, le query conversazionali attirano gli utenti in sessioni più approfondite su argomenti che avrebbero abbandonato dopo una rapida scorsa ai risultati di ricerca. Il rischio è reale per i contenuti di cronaca generale leggeri, dove il chatbot può riassumere un singolo articolo in un paragrafo. È molto più basso per i contenuti analitici, longitudinali e investigativi, dove l'esperienza di chat è un assistente di ricerca, non un TL;DR. Dimensioniamo il livello di pricing e la policy sulla lunghezza delle risposte in base alla profondità dei vostri contenuti, non copiando un template da un editore diverso.
Cloudflare Pay Per Crawl, lanciato a gennaio 2026 su circa il 20 percento del traffico web globale, vi permette di impostare Allow, Charge o Block per ciascun crawler a un prezzo valido per l'intero dominio. La risposta tecnicamente corretta è che potete bloccare GPTBot, ClaudeBot, CCBot e PerplexityBot continuando a consentire Googlebot e Bingbot, perché Google separa pubblicamente il crawling di Googlebot da Google-Extended (il fetcher di addestramento di Gemini). Bloccare Google-Extended non incide sul ranking di ricerca. La preoccupazione politica è che gli AI Overviews di Google fanno comunque emergere contenuti dalle pagine indicizzate anche quando Google-Extended è bloccato, perché li recuperano al momento della query. Quindi il blocco non impedisce che i vostri contenuti vengano riassunti negli AIO, impedisce solo che vengano usati per addestrare le future versioni di Gemini. Un assetto difendibile per la maggior parte degli editori di fascia media nel 2026 è: bloccare GPTBot, ClaudeBot, CCBot e Google-Extended. Far pagare PerplexityBot e Mistral. Consentire Googlebot e Bingbot. Poi instradare i dollari del licensing tramite ProRata, Bria e Tollbit per catturare ricavi dai motori di IA che non controllate.
Voi. L'incidente del podcast IA del Washington Post del dicembre 2025 (citazioni inventate, inserimento di commenti come posizione editoriale del giornale) è il caso ammonitore che ha trasformato questo da ipotesi a questione da consiglio di amministrazione per gli editori. Non esiste uno scudo della Section 230 per i contenuti che il vostro stesso sistema genera dal vostro stesso archivio; l'output dell'IA è trattato come il vostro prodotto di lavoro editoriale. Le mitigazioni sono architetturali, non contrattuali. Applichiamo tre livelli: un system prompt a grounding rigoroso che vieta di usare qualsiasi conoscenza al di fuori dei chunk recuperati, una verifica delle citazioni post-hoc che scarta qualsiasi frase la cui fonte citata non contenga l'affermazione, e una soglia di confidenza che instrada le risposte a bassa confidenza in una coda di revisione editoriale prima che raggiungano l'utente. Strumentiamo inoltre il log delle risposte affinché la vostra redazione possa controllare qualsiasi sessione entro un'ora dall'accaduto. Nulla di tutto ciò esiste in un wrapper di chatbot SaaS.
Il RAG vettoriale recupera chunk semanticamente simili alla query. Funziona per la ricerca di fatti. Fallisce sulle query che rendono prezioso un archivio giornalistico: come si è evoluta la posizione del sindaco sull'edilizia abitativa nell'arco di 12 anni. Chi collega la Persona X allo Scandalo Z attraverso quali organizzazioni intermedie. Quali erano le fonti ricorrenti citate nella copertura della controversia sul consiglio scolastico. Queste sono query multi-hop, longitudinali e basate sulle entità. GraphRAG pre-elabora l'archivio in un grafo di entità (persone, organizzazioni, luoghi, eventi) con relazioni tipizzate, poi attraversa il grafo al momento della query. La parte difficile non è il database a grafo (Neo4j o Amazon Neptune lo gestiscono). La parte difficile è la risoluzione delle entità: collassare «Mr. Musk», «Elon Musk», «CEO di Tesla» e «proprietario di X» in un unico nodo, e disambiguare «John Smith il consigliere comunale» da «John Smith il preside del liceo» attraverso 25 anni di firme e refusi degli stringer. Usiamo una combinazione di estrazione basata su LLM, regole deterministiche di risoluzione delle entità tarate sul vostro ambito e revisione umana per le prime 200 entità per numero di articoli. Questa è la parte che nessun altro farà per voi.
Il motore conversazionale è un servizio separato che consuma un feed dal vostro CMS ed espone un'API di chat verso il vostro sito. Il pattern di integrazione differisce a seconda dello stack. Arc XP espone una Content API e webhook ma nessun hook di embedding, quindi eseguiamo un job di sincronizzazione che recupera le storie nuove e aggiornate ogni cinque minuti e le ri-embedda. WordPress VIP supporta endpoint REST personalizzati e tipicamente distribuiamo un microservizio separato più un blocco Gutenberg per il widget di chat. Brightspot è il più flessibile grazie al suo modello a tipi di contenuto, che rende molto più pulita l'estrazione dei metadati strutturati. Gli editori Atypon (per lo più accademici) si affiancano alla ricerca Literatum invece di sostituirla. In ogni caso il widget di chat è un embed JS che i vostri redattori possono inserire in qualsiasi pagina, e il back end gira nel vostro account cloud, non nel nostro. Non vi vincoliamo a un servizio in hosting.
Entrambe le cose, e risolvono problemi diversi. L'accordo NMA + ProRata annunciato a marzo 2026 è un pool di licensing collettivo: 2.200 editori possono aderire per monetizzare la domanda enterprise guidata dal RAG con una ripartizione 50/50 dei ricavi, tracciata per attribuzione. Bria è l'accordo parallelo rivolto all'uso enterprise di IA interna. Queste sono cattura della dispersione, vi pagano quando un motore di IA che non possedete usa i vostri contenuti. Il vostro motore conversazionale è la strategia di retention: approfondisce l'engagement con il vostro pubblico esistente e crea un livello premium. ProRata vi paga una frazione di una frazione per query. Il vostro livello intelligence (Ask FT fa pagare oltre 1.000 $/anno per utente professionale) ha margini elevati e si compone con il valore del vostro archivio. Usate entrambe le cose. Il costo della partecipazione a ProRata è prossimo allo zero (la NMA gestisce la burocrazia), e i ricavi sono incrementali rispetto all'investimento ingegneristico che state già facendo.
Per un archivio Arc XP o Brightspot pulito di 100K-500K articoli, un widget di chat ancorato alle citazioni con ricerca ibrida e filtraggio temporale di base viene rilasciato in 14-18 settimane. GraphRAG con risoluzione delle entità aggiunge altre 10-14 settimane. Un livello di assistente di ricerca agentico aggiunge altre 8-12 settimane. La voce singola più lunga è sempre l'ingestione dell'archivio, specialmente se avete contenuti antecedenti al 2005 con HTML corrotto, foto mancanti o PDF scansionati da un progetto di digitalizzazione di microfilm. Iniziamo con un audit dell'archivio di 2 settimane prima di quotare una tempistica fissa, perché la varianza tra «export dal CMS» e «OCR di un milione di pagine scansionate» è di 8 a 1 in termini di sforzo. L'audit vi dà un numero difendibile da portare al vostro CFO.
Il whitepaper interattivo che sta alla base di questa pagina di soluzione.
Trattazione architetturale completa: GraphRAG, Temporal RAG, Agentic RAG, il modello di business Intelligence-as-a-Service e casi di studio dettagliati di Ask FT e Bloomberg Terminal AI.
Iniziate con l'audit dell'archivio di 2 settimane. Prezzo fisso, nessun impegno per l'intero sviluppo.
Campioniamo l'1% dei vostri contenuti, misuriamo la difficoltà di ingestione, redigiamo le vostre prime 200 entità e diamo al vostro CFO un numero difendibile per l'intero sviluppo. Se l'audit dice di non costruire, ve lo diciamo.