Immagine suggestiva di un archivio di giornali che si trasforma in un grafo di conoscenza luminoso e strutturato, a rappresentare la tesi centrale dell'articolo: convertire il giornalismo statico in intelligenza conversazionale.

Artificial IntelligenceMediaTechnology

L'articolo di giornale è una frusta per calessi e il vostro archivio è una miniera d'oro

Ashutosh Singhal 8 febbraio 202613 min

Ero seduto di fronte al direttore digitale di un quotidiano storico — uno che avete sicuramente letto — quando ha aperto un grafico sul suo laptop e l'ha girato verso di me. Traffico organico, mese dopo mese, negli ultimi diciotto mesi. Sembrava che qualcuno avesse spinto un masso giù da una scogliera.

"Stiamo facendo tutto per bene", ha detto. "Più articoli, SEO migliore, caricamento delle pagine più rapido. E stiamo perdendo."

Non aveva torto sull'esecuzione. Aveva torto sul gioco. Il gioco era cambiato sotto i suoi piedi mentre lui ottimizzava per quello vecchio. E quella conversazione — avvenuta davanti a un caffè tiepido in una sala riunioni con vista su un parcheggio multipiano — è il motivo per cui ho trascorso i mesi successivi a costruire qualcosa che credo ridefinirà il modo in cui le aziende dei media sopravvivono.

L'idea di fondo è semplice, quasi dolorosamente semplice: le aziende dei media devono smettere di vendere articoli e iniziare a vendere risposte. Il feed di notizie è morto. L'archivio è vivo. E la tecnologia per colmare quel divario — per trasformare cinquant'anni di giornalismo in un motore di intelligenza conversazionale — esiste già. Dobbiamo solo costruirla nel modo giusto.

Ho scritto un approfondimento interattivo su tutta questa tesi se volete il quadro completo. Ma lasciate che vi racconti la storia di come siamo arrivati qui, perché i numeri da soli non catturano la vertigine di vedere le fondamenta di un intero settore incrinarsi.

Perché nessuno clicca più?

Un'infografica che mostra le statistiche chiave del crollo del traffico citate nell'articolo — i tassi di ricerca senza clic, i cali di traffico degli editori e l'impatto delle AI Overview — così i lettori possono cogliere la portata della crisi a colpo d'occhio.

Ecco il dato che tiene svegli i dirigenti dei media: il 60% delle ricerche su Google ora si conclude senza un solo clic verso alcun sito web. Su mobile, è il 77%. Google è diventato la destinazione, non la porta d'ingresso. Il motore di ricerca che ha costruito l'economia dell'editoria digitale è silenziosamente diventato il suo più grande concorrente.

E la portata del danno è impressionante. Nella prima metà del 2025, l'editore mediano ha registrato un calo di traffico del 10% su base annua. Ma "mediano" nasconde la carneficina. La CNN è calata tra il 27% e il 38%. Forbes e Business Insider sono scesi di quasi il 50%. HubSpot — un'azienda che ha essenzialmente inventato il content marketing moderno — ha perso il 70-80% del suo traffico organico.

Il colpevole sono le AI Overview. Quando il riepilogo generato dall'IA di Google appare in cima ai risultati di ricerca — cosa che ora accade per circa il 13% delle query — i tassi di clic verso i link organici crollano di circa il 47%. L'IA legge gli articoli così l'utente non deve farlo.

Ricordo io e il mio team a fissare questi numeri durante una sessione di lavoro a tarda sera. Qualcuno ha detto: "Quindi gli editori creano i contenuti, l'IA di Google li divora e l'utente non visita mai il sito?" È esattamente così. E peggiora.

Il motore di ricerca non è più una fonte di rimando di traffico. È un concorrente per l'attenzione.

Il traffico verso le piattaforme di IA generativa — ChatGPT, Perplexity, Claude — sta crescendo 165 volte più velocemente del traffico verso la ricerca tradizionale. Gli utenti pongono domande più lunghe e complesse. Le ricerche con cinque o più parole crescono 1,5 volte più velocemente delle query con parole chiave brevi. Le persone non vogliono dieci link blu. Vogliono una sola buona risposta.

L'articolo è un reperto del passato (e lo dico con affetto)

Devo stare attento qui perché amo genuinamente il giornalismo long-form. Lo leggo di continuo. Ma devo anche essere onesto su cosa sia davvero il formato articolo: un contenitore progettato per la distribuzione a stampa.

Pensateci. Stampavate un articolo da 800 parole su un giornale perché non potevate stampare 800 singole risposte. La distribuzione fisica era costosa e sporadica, quindi impacchettavate le informazioni in narrazioni. Aveva perfettamente senso nel 1975. Aveva un senso discreto nel 2005, quando l'articolo è migrato online ma il comportamento di lettura è rimasto pressoché lo stesso.

Non ha quasi alcun senso nel 2025.

Un utente che cerca "Qual è la posizione del sindaco sull'edilizia abitativa?" non vuole un approfondimento di 1.000 parole sulla storia della zonizzazione urbana. Vuole la posizione del sindaco sull'edilizia abitativa. Il modello tradizionale lo costringe a superare una serie di ostacoli: Cerca → Clicca → Scorri → Scansiona → Leggi → Estrai. Ogni passaggio è attrito. Ogni passaggio è un'occasione per perderlo.

Ho avuto questa discussione con un'amica giornalista che ha ribattuto con forza. "Stai riducendo il giornalismo a fatti", ha detto. "Le storie contano. Il contesto conta. La narrazione conta." Ha assolutamente ragione — per gli editoriali, le inchieste, i ritratti, i reportage. Quelle sono forme d'arte. Ma la stragrande maggioranza di ciò che riempie un feed di notizie non è arte. È informazione intrappolata in un formato inefficiente. E gli utenti votano con il loro comportamento: preferiscono chiedere a un'IA piuttosto che districarsi tra i contenuti.

E se l'archivio non fosse un cimitero?

È qui che la conversazione con quel direttore digitale è passata da deprimente a elettrizzante.

Gli ho chiesto quanti articoli ci fossero nel loro archivio. Ha esitato. "Probabilmente... qualche milione? Che risale agli anni Settanta?" L'ha detto come se fosse una passività — un costo del server, un grattacapo di manutenzione.

Gli ho detto che era il bene più prezioso che la sua azienda possedesse. Più prezioso del marchio. Più prezioso della lista degli abbonati. Perché quei milioni di articoli, che coprono cinque decenni di politica locale, affari, cronaca nera, cultura — è un insieme di dati che nessuna azienda di IA sulla terra può replicare senza il suo permesso.

Il problema non sono i dati. Il problema è che sono bloccati dentro blocchi di testo non strutturato e scollegati l'uno dall'altro. L'articolo A menziona che la Persona X lavora per l'Azienda Y. L'articolo B, pubblicato tre anni dopo, menziona che l'Azienda Y è coinvolta nello Scandalo Z. Nessun singolo articolo collega la Persona X allo Scandalo Z. Ma il collegamento esiste — sepolto nell'archivio, invisibile a qualsiasi barra di ricerca, in attesa che qualcuno lo ricomponga.

Gli editori che considerano il loro prodotto esclusivamente come "articoli" stanno fabbricando fruste per calessi nell'era dell'automobile.

Quella ricomposizione è ciò che costruiamo in Veriprajna. Non chatbot. Non wrapper di GPT. Motori di intelligenza.

La domanda sul sindaco che ha cambiato tutto

Rendiamolo concreto. Immaginate un utente — un ricercatore di politiche locali, un cittadino preoccupato, un giornalista di una testata concorrente — che vuole capire come la posizione del sindaco sull'edilizia abitativa si sia evoluta dal 2010.

Nel vecchio modello, cerca sul sito del giornale "posizione sindaco edilizia". Ottiene cinquanta risultati. Apre l'articolo del 2010: "Il sindaco si oppone allo sviluppo di grattacieli." Apre l'articolo del 2015: "Il sindaco ammorbidisce la posizione tra la crisi dell'accessibilità abitativa." Apre l'articolo del 2022: "Il sindaco sostiene il disegno di legge Build Now." Sintetizza mentalmente l'evoluzione. Ci vogliono quarantacinque minuti se è veloce.

Nel modello che stiamo costruendo, digita la domanda. Il sistema la scompone in sotto-query temporali. Attraversa un grafo di conoscenza — non limitandosi a cercare parole chiave, ma seguendo le relazioni tra l'entità Sindaco e l'entità Sviluppo Edilizio attraverso archi con marcatura temporale. Individua lo spostamento della posizione da negativa (2010) a neutrale (2015) a positiva (2022). Genera una narrazione con citazioni che rimandano agli articoli originali. Rende una visualizzazione a linea temporale.

Dieci secondi.

Quello non è un chatbot. È un prodotto di intelligenza. Ed è il tipo di cosa per cui i professionisti — lobbisti, analisti, avvocati, strateghi aziendali — pagherebbero somme importanti.

Perché non si può semplicemente applicare GPT a un archivio?

Vorrei si potesse. Renderebbe il mio lavoro molto più facile.

Abbiamo provato l'approccio ingenuo all'inizio. Prendere gli articoli, spezzarli in blocchi da 500 parole, incorporarli come vettori, fare una ricerca per similarità, alimentare i risultati a un LLM. È ciò che fa la maggior parte delle implementazioni di "chatbot IA". E per ricerche semplici di un singolo fatto in documentazione statica, funziona bene.

Per gli archivi di notizie, fallisce in modi sottili e pericolosi.

Perde il filo. La suddivisione in blocchi spezza gli archi narrativi. Un blocco che discute un verdetto viene separato dal blocco che descrive il crimine. Il sistema letteralmente non riesce a seguire una storia che si sviluppa attraverso più articoli nel corso di più anni.

È cieco al tempo. La similarità vettoriale non sa che anno è. Un articolo del 2010 che dice "il mercato immobiliare sta crollando" è semanticamente identico a uno del 2024 che dice la stessa cosa. Il sistema confonde la vecchia realtà con quella attuale. Non riesce a distinguere ciò che era vero da ciò che è vero.

Non riesce a collegare i punti. Se la Persona X e lo Scandalo Z non compaiono mai nello stesso articolo, il recupero ingenuo non troverà mai il collegamento — anche se l'Azienda Y li unisce. Al sistema manca ciò che i ricercatori chiamano "ragionamento multi-hop".

Allucina per colmare le lacune. Quando il recupero manca il contesto rilevante, l'LLM non dice "non lo so". Inventa. Fabbrica citazioni. Crea eventi mai accaduti. Nel giornalismo, questo non è una segnalazione di bug. È una causa legale.

Abbiamo imparato tutto questo nel modo più difficile. C'è stato un test specifico — non nominerò la testata — in cui il sistema ingenuo ha attribuito con sicurezza una citazione a un politico che non aveva mai detto nulla di lontanamente simile. La citazione sembrava plausibile. Era grammaticalmente coerente con il modo in cui il politico parlava. Era completamente inventata. Quello è stato il momento in cui ho capito che ci serviva un'architettura fondamentalmente diversa.

Come si costruisce un motore di intelligenza che funzioni davvero?

Un diagramma di architettura a tre livelli che mostra i livelli GraphRAG, Temporal RAG e Agentic Workflow con le loro funzioni specifiche e come si connettono, rendendo il sistema tecnico comprensibile a colpo d'occhio.

L'architettura che abbiamo sviluppato in Veriprajna ha tre livelli, ciascuno dei quali risolve una specifica modalità di fallimento. Li abbozzerò brevemente qui — per la scomposizione tecnica completa, vedi il nostro documento di ricerca.

Livello uno: GraphRAG. Invece di trattare l'archivio come un sacco di blocchi di testo scollegati, estraiamo un grafo di conoscenza — entità (persone, organizzazioni, luoghi, eventi) e le relazioni tra di esse. "Elon Musk" → ha acquisito → "Twitter." Queste vengono archiviate in un database a grafo dove ogni articolo è interconnesso. Quando un utente pone una domanda complessa, il sistema non si limita a cercare parole chiave. Attraversa il grafo, saltando da nodo a nodo, trovando connessioni che coprono decenni e migliaia di articoli.

I risultati sono spettacolari. Nei compiti di ragionamento multi-hop, GraphRAG ha mostrato miglioramenti nella completezza del 72-83% rispetto agli approcci basati solo su vettori. Può rispondere a "Quali sono i temi principali di cinque anni di copertura sul clima?" — una domanda che la RAG ingenua non può nemmeno tentare.

Livello due: Temporal RAG. Ogni blocco e ogni arco del grafo viene etichettato con metadati di tempo di validità. Le relazioni sono versionate — l'arco "CEO di Apple" per Steve Jobs ha limiti temporali diversi da quello per Tim Cook. Quando un utente pone una domanda evolutiva, il sistema la scompone in sotto-query temporali e assembla i risultati in ordine cronologico. L'archivio diventa una macchina del tempo.

Livello tre: workflow agentici. L'LLM non si limita a recuperare e rispondere. Pianifica. Un agente Pianificatore scompone una richiesta complessa ("Scrivi un rapporto di due diligence sull'Azienda X") in sotto-compiti. Un agente Ricercatore esegue query mirate. Un agente Critico rivede i risultati alla ricerca di lacune e contraddizioni prima che l'utente veda qualsiasi cosa. Un agente Scrittore sintetizza l'output finale con le citazioni.

Non facciamo wrapper di API. Ricostruiamo le fondamenta dell'infrastruttura di conoscenza.

Quell'agente Critico è cruciale. È essenzialmente un fact-checker integrato — una seconda chiamata all'LLM che confronta ogni affermazione generata con i documenti di origine ed elimina tutto ciò che non è supportato. Combinato con rigorose istruzioni di ancoraggio e l'applicazione delle citazioni, è così che manteniamo quella che considero una politica di tolleranza zero verso la fabbricazione.

Cosa sa il Financial Times che tutti gli altri non sanno?

Il FT ha lanciato "Ask FT" — un'interfaccia conversazionale che consente agli abbonati professionali di interrogare il proprio archivio. Ogni risposta è ancorata esclusivamente al giornalismo del FT. Ogni affermazione ha una citazione cliccabile. È progettato per specifici flussi di lavoro professionali: preparazione di riunioni, due diligence rapida, analisi delle tendenze.

Bloomberg è andata ancora oltre con BloombergGPT, un LLM specifico per dominio che traduce il linguaggio naturale in Bloomberg Query Language. Un analista può chiedere "Mostrami la crescita dei ricavi delle aziende tecnologiche nel Q3 2024" e ottenere una tabella formattata. Può interrogare le trascrizioni delle earnings call — chiedendo del tono di un CEO su uno specifico fattore di rischio — invece di leggere centinaia di pagine in modo lineare.

Questi non sono esperimenti. Sono modelli di business. E indicano dove sono davvero i soldi.

Da dove arrivano i soldi?

Un diagramma del modello di ricavi a tre livelli che mostra i livelli di monetizzazione Intelligence Tier, API Licensing e Data Moat con i dettagli chiave, aiutando i lettori a cogliere rapidamente la struttura del modello di business.

Le persone mi chiedono sempre se questo modello di "intelligenza come servizio" possa davvero sostituire i ricavi pubblicitari. La mia risposta onesta: non ha bisogno di sostituire tutti i ricavi. Deve sostituire la parte che sta scomparendo.

L'economia si articola in tre livelli.

Primo, un abbonamento Intelligence Tier — non 10 dollari al mese per "leggere le notizie", ma oltre 1.000 dollari all'anno per professionisti che necessitano di accesso approfondito all'archivio, workflow agentici e ricerca supportata da citazioni. Professionisti della finanza, team di intelligence aziendale, studi legali che svolgono ricerca normativa. Questi utenti esistono. Attualmente pagano analisti per fare manualmente ciò che un sistema ben costruito fa in pochi secondi.

Secondo, licenze API. Invece di combattere i crawler di IA con robots.txt, formalizzate lo scambio di dati. Vendete l'accesso all'archivio pulito, vettorializzato e strutturato a grafo a piattaforme di ricerca aziendale, terminali finanziari e sviluppatori di terze parti. Fatturate per query o per token. L'intelligenza dell'editore vive dentro il flusso di lavoro del cliente.

Terzo, e questa è la parte che la maggior parte delle persone trascura: il fossato di dati stesso. In un mondo in cui chiunque può accedere a GPT-4, il modello non è il vantaggio competitivo. Lo sono i dati. Un archivio di notizie locali lungo cinquant'anni è un insieme di dati che OpenAI non può replicare. Il grafo di conoscenza derivato da quell'archivio — la rete dei protagonisti del potere locale, la cronologia dei cambiamenti di politica, la rete delle relazioni aziendali — è proprietà intellettuale proprietaria che si accresce di valore nel tempo.

In un mondo di modelli di IA commoditizzati, il fossato non è l'algoritmo. È l'archivio.

E i giornalisti?

Ricevo questa domanda di continuo, e credo meriti una risposta diretta piuttosto che un'evasione. Questa svolta non elimina il giornalismo. Elimina l'inefficienza del modo in cui il giornalismo raggiunge le persone. Il reporter che passa tre mesi a indagare su uno scandalo di corruzione sta svolgendo un lavoro che nessuna IA può replicare. Il sistema che costruiamo rende quel lavoro più scopribile, più interrogabile, più prezioso nel tempo. Trasforma una storia che viene letta per una settimana e poi sepolta a pagina 47 dei risultati di ricerca in un nodo permanente e recuperabile in un grafo di conoscenza che riemerge ogni volta che qualcuno pone una domanda correlata per i prossimi cinquant'anni.

La minaccia al giornalismo non è l'IA conversazionale. La minaccia è il crollo dell'economia dei referral che finanzia il giornalismo. Se il traffico è sparito — e lo è — allora aggrapparsi al modello del feed supportato dalla pubblicità non è lealtà al mestiere. È negazione.

Cosa succede se le aziende dei media non cambiano rotta?

Qualcosa di peggiore del declino: l'irrilevanza. I loro archivi vengono raschiati dalle aziende di IA, sintetizzati in dati di addestramento e restituiti agli utenti senza attribuzione, senza pagamento e senza lo strato di fiducia che gli standard editoriali forniscono. L'editore diventa un fornitore di contenuti non retribuito per il prodotto di intelligenza di qualcun altro.

Alcuni editori stanno già firmando accordi di licenza con OpenAI e altri. È un inizio, ma è una transazione una tantum a basso margine. State vendendo materie prime quando potreste vendere intelligenza raffinata. È la differenza tra esportare petrolio greggio e costruire una raffineria.

Il futuro del consumo di notizie non è il feed. È la conversazione. Ci stiamo muovendo verso ciò che io considero la Generative UI — interfacce che si adattano alla risposta. Chiedi una linea temporale, ottieni una linea temporale. Chiedi un confronto, ottieni una tabella. Chiedi un briefing, ottieni un PDF. Il sito web statico si dissolve in una tela fluida e adattiva per l'intelligenza.

Le aziende dei media che padroneggeranno le strutture dati sottostanti — i vettori, i grafi, la logica temporale — definiranno questo futuro. Non si limiteranno a sopravvivere alla morte del feed di notizie. Costruiranno qualcosa di migliore di quanto il feed sia mai stato.

L'archivio non è un centro di costo. È l'intera attività. L'unica domanda è se sarete voi a sbloccarlo, o se guarderete qualcun altro farlo con i vostri dati.

Smettete di vendere parole. Iniziate a vendere risposte.

Related Research

IA conversazionale per gli editori: RAG sugli archivi giornalistici | VeriprajnaSolution Page

The Death of the Feed: Media's Pivot to Conversational Intelligence | VeriprajnaInteractive Whitepaper

The Death of the Feed: Conversational Intelligence for MediaTechnical Deep-Dive

Also Published On

LinkedIn · Company LinkedIn · Founder YouTube Medium Instagram Facebook X