
Het nieuwsartikel is een koetszweep en je archief is een goudmijn
Ik zat tegenover de digitaal directeur van een gerenommeerde krant — een die je zeker weleens hebt gelezen — toen hij een grafiek op zijn laptop opende en die naar mij toe draaide. Organisch verkeer, maand na maand, over de afgelopen achttien maanden. Het zag eruit alsof iemand een rotsblok van een klif had geduwd.
"We doen alles goed," zei hij. "Meer verhalen, betere SEO, snellere laadtijden. En toch verliezen we."
Hij had geen ongelijk over de uitvoering. Hij had ongelijk over het spel. Het spel was onder hem veranderd terwijl hij aan het optimaliseren was voor het oude. En dat gesprek — dat plaatsvond bij lauwe koffie in een vergaderzaal met uitzicht op een parkeergarage — is de reden dat ik de daaropvolgende maanden besteedde aan het bouwen van iets waarvan ik geloof dat het opnieuw zal bepalen hoe mediabedrijven overleven.
Het kernidee is simpel, bijna pijnlijk simpel: mediabedrijven moeten stoppen met het verkopen van artikelen en beginnen met het verkopen van antwoorden. De nieuwsfeed is dood. Het archief leeft. En de technologie om die kloof te overbruggen — om vijftig jaar journalistiek om te vormen tot een conversationele intelligentie-engine — bestaat al. We hoeven het alleen maar goed te bouwen.
Ik heb een interactieve diepteanalyse van deze hele these geschreven als je het volledige plaatje wilt. Maar laat me je het verhaal vertellen van hoe we hier zijn gekomen, want de cijfers alleen vatten niet de duizeligheid van het toekijken hoe de fundering van een hele industrie barst.
Waarom klikt niemand meer?

Dit is het feit dat media-executives 's nachts wakker houdt: 60% van de Google-zoekopdrachten eindigt nu zonder ook maar één klik naar enige website. Op mobiel is dat 77%. Google is de bestemming geworden, niet de deur. De zoekmachine die de digitale uitgeverseconomie heeft opgebouwd, is stilletjes haar grootste concurrent geworden.
En de omvang van de schade is verbluffend. In de eerste helft van 2025 zag de mediane uitgever een verkeersdaling van 10% op jaarbasis. Maar "mediaan" verbergt de slachting. CNN daalde tussen de 27% en 38%. Forbes en Business Insider vielen bijna 50%. HubSpot — een bedrijf dat in wezen moderne contentmarketing uitvond — verloor 70-80% van zijn organische verkeer.
De boosdoener is AI Overviews. Wanneer Google's AI-samenvatting bovenaan de zoekresultaten verschijnt — wat nu voor ongeveer 13% van de zoekopdrachten gebeurt — storten de doorklikpercentages naar organische links met ongeveer 47% in. De AI leest de artikelen zodat de gebruiker dat niet hoeft te doen.
Ik herinner me dat mijn team en ik tijdens een late avondsessie naar deze cijfers zaten te staren. Iemand zei: "Dus de uitgevers maken de content, Google's AI eet die op, en de gebruiker bezoekt de site nooit?" Dat klopt precies. En het wordt nog erger.
De zoekmachine is niet langer een doorverwijzer van verkeer. Het is een concurrent om aandacht.
Verkeer naar generatieve AI-platforms — ChatGPT, Perplexity, Claude — groeit 165 keer sneller dan verkeer naar traditionele zoekopdrachten. Gebruikers stellen langere, complexere vragen. Zoekopdrachten met vijf of meer woorden groeien 1,5 keer sneller dan korte trefwoordzoekopdrachten. Mensen willen geen tien blauwe links. Ze willen één goed antwoord.
Het artikel is een relikwie (en dat zeg ik met liefde)
Ik moet hier voorzichtig zijn, want ik houd oprecht van langvorm-journalistiek. Ik lees het voortdurend. Maar ik moet ook eerlijk zijn over wat het artikelformaat eigenlijk is: een verpakking ontworpen voor gedrukte distributie.
Denk er eens over na. Je drukte een verhaal van 800 woorden af in een krant omdat je geen 800 individuele antwoorden kon afdrukken. Fysieke distributie was duur en sporadisch, dus bundelde je informatie tot verhalen. Dat was volkomen logisch in 1975. Het was redelijk logisch in 2005, toen het artikel online migreerde maar het leesgedrag ruwweg hetzelfde bleef.
Het slaat vrijwel nergens op in 2025.
Een gebruiker die zoekt op "Wat is het standpunt van de burgemeester over huisvesting?" wil geen reportage van 1.000 woorden over de geschiedenis van stedelijke bestemmingsplannen. Ze willen het standpunt van de burgemeester over huisvesting. Het traditionele model dwingt hen door een hindernisbaan: Zoeken → Klikken → Scrollen → Scannen → Lezen → Extraheren. Elke stap is wrijving. Elke stap is een kans om hen te verliezen.
Ik had deze discussie met een journalistvriendin die zich hard verzette. "Je reduceert journalistiek tot feiten," zei ze. "Verhalen doen ertoe. Context doet ertoe. Vertelling doet ertoe." Ze heeft volkomen gelijk — voor opiniestukken, onderzoeken, portretten, reportages. Dat zijn kunstvormen. Maar het overgrote deel van wat een nieuwsfeed vult, is geen kunst. Het is informatie gevangen in een inefficiënt formaat. En gebruikers stemmen met hun gedrag: ze vragen liever een AI dan zich erdoorheen te worstelen.
Wat als het archief geen kerkhof is?
Dit is waar het gesprek met die digitaal directeur van deprimerend naar elektriserend verschoof.
Ik vroeg hem hoeveel artikelen er in hun archief zaten. Hij aarzelde. "Waarschijnlijk... een paar miljoen? Teruggaand tot de jaren zeventig?" Hij zei het alsof het een last was — een serverkost, een onderhoudsprobleem.
Ik vertelde hem dat het het waardevolste bezit was dat zijn bedrijf had. Waardevoller dan het merk. Waardevoller dan de abonneelijst. Want die miljoenen artikelen, die vijf decennia van lokale politiek, economie, criminaliteit en cultuur beslaan — dat is een dataset die geen enkel AI-bedrijf op aarde kan repliceren zonder zijn toestemming.
Het probleem is niet de data. Het probleem is dat die is opgesloten in ongestructureerde tekstblokken die niet met elkaar verbonden zijn. Artikel A vermeldt dat Persoon X bij Bedrijf Y werkt. Artikel B, drie jaar later gepubliceerd, vermeldt dat Bedrijf Y verwikkeld is in Schandaal Z. Geen enkel artikel verbindt Persoon X met Schandaal Z. Maar de verbinding bestaat wel — begraven door het archief heen, onzichtbaar voor elke zoekbalk, wachtend tot iemand het aan elkaar rijgt.
Uitgevers die hun product uitsluitend als "artikelen" zien, produceren zweepjes voor koetsen in het tijdperk van de auto.
Dat aan elkaar rijgen is wat we bij VeriPrajna bouwen. Geen chatbots. Geen GPT-wrappers. Intelligentie-engines.
De burgemeestervraag die alles veranderde
Laat me dit concreet maken. Stel je een gebruiker voor — een lokale beleidsonderzoeker, een bezorgde burger, een journalist bij een concurrerend medium — die wil begrijpen hoe het standpunt van de burgemeester over huisvesting sinds 2010 is geëvolueerd.
In het oude model zoeken ze op de site van de krant naar "standpunt burgemeester huisvesting." Ze krijgen vijftig resultaten. Ze openen het artikel uit 2010: "Burgemeester tegen hoogbouwontwikkeling." Ze openen het artikel uit 2015: "Burgemeester matigt standpunt te midden van betaalbaarheidscrisis." Ze openen het artikel uit 2022: "Burgemeester steunt Build Now-wetsvoorstel." Ze synthetiseren de evolutie in hun hoofd. Het kost vijfenveertig minuten als ze snel zijn.
In het model dat wij bouwen typen ze de vraag. Het systeem ontleedt die in temporele subvragen. Het doorloopt een kennisgraaf — niet zomaar zoekend naar trefwoorden, maar de relaties volgend tussen de entiteit Burgemeester en de entiteit Huisvestingsontwikkeling over tijdgemarkeerde verbindingen. Het vindt de standpuntverschuiving van negatief (2010) naar neutraal (2015) naar positief (2022). Het genereert een verhaal met bronvermeldingen die naar de oorspronkelijke artikelen linken. Het rendert een tijdlijnvisualisatie.
Tien seconden.
Dat is geen chatbot. Dat is een intelligentieproduct. En het is het soort ding waar professionals — lobbyisten, analisten, advocaten, bedrijfsstrategen — serieus geld voor zouden betalen.
Waarom kun je niet gewoon GPT loslaten op een archief?
Ik wou dat het kon. Het zou mijn werk een stuk makkelijker maken.
We probeerden de naïeve aanpak al vroeg. Neem artikelen, hak ze in stukken van 500 woorden, embed ze als vectoren, doe similariteitszoekopdrachten, voer de resultaten aan een LLM. Dit is wat de meeste "AI-chatbot"-implementaties doen. En voor eenvoudige opzoekingen van een enkel feit in statische documentatie werkt het prima.
Voor nieuwsarchieven faalt het op manieren die subtiel en gevaarlijk zijn.
Het verliest de rode draad. Chunking breekt narratieve bogen. Een chunk die een vonnis bespreekt, raakt gescheiden van de chunk die de misdaad beschrijft. Het systeem kan letterlijk geen verhaal volgen dat zich over meerdere artikelen over meerdere jaren ontvouwt.
Het is blind voor tijd. Vectorsimilariteit weet niet welk jaar het is. Een artikel uit 2010 dat zegt "de huizenmarkt stort in" is semantisch identiek aan een uit 2024 dat hetzelfde zegt. Het systeem vermengt oude realiteit met huidige realiteit. Het kan niet onderscheiden wat waar was van wat waar is.
Het kan geen verbanden leggen. Als Persoon X en Schandaal Z nooit in hetzelfde artikel voorkomen, zal naïeve retrieval de verbinding nooit vinden — zelfs als Bedrijf Y ze verbindt. Het systeem mist wat onderzoekers "multi-hop-redenering" noemen.
Het hallucineert om gaten te vullen. Wanneer retrieval relevante context mist, zegt de LLM niet "ik weet het niet." Het verzint. Het fabriceert citaten. Het creëert gebeurtenissen die nooit hebben plaatsgevonden. In de journalistiek is dit geen bugrapport. Het is een rechtszaak.
We hebben dit allemaal op de harde manier geleerd. Er was een specifieke test — ik zal de publicatie niet noemen — waarbij het naïeve systeem vol vertrouwen een citaat toeschreef aan een politicus die nooit ook maar iets in de buurt had gezegd. Het citaat klonk plausibel. Het was grammaticaal consistent met hoe de politicus sprak. Het was volledig verzonnen. Dat was het moment waarop ik wist dat we een fundamenteel andere architectuur nodig hadden.
Hoe bouw je een intelligentie-engine die daadwerkelijk werkt?

De architectuur die we bij VeriPrajna hebben ontwikkeld, heeft drie lagen, elk oplossend voor een specifieke faalmodus. Ik schets ze hier kort — voor de volledige technische uiteenzetting, zie ons onderzoekspaper.
Laag één: GraphRAG. In plaats van het archief te behandelen als een zak losse tekstchunks, extraheren we een kennisgraaf — entiteiten (mensen, organisaties, locaties, gebeurtenissen) en de relaties daartussen. "Elon Musk" → verwierf → "Twitter." Deze worden opgeslagen in een graafdatabase waarin elk artikel onderling verbonden is. Wanneer een gebruiker een complexe vraag stelt, zoekt het systeem niet zomaar naar trefwoorden. Het doorloopt de graaf, hoppend van knooppunt naar knooppunt, en vindt verbindingen die decennia en duizenden artikelen overspannen.
De resultaten zijn dramatisch. Op multi-hop-redeneertaken heeft GraphRAG verbeteringen in volledigheid van 72-83% laten zien vergeleken met vector-only-benaderingen. Het kan "Wat zijn de belangrijkste thema's in vijf jaar klimaatverslaggeving?" beantwoorden — een vraag die naïeve RAG niet eens kan proberen.
Laag twee: Temporal RAG. Elke chunk en elke graafverbinding wordt getagd met valid-time-metadata. Relaties worden geversioneerd — de verbinding "CEO van Apple" voor Steve Jobs heeft andere tijdgrenzen dan die voor Tim Cook. Wanneer een gebruiker een evolutionaire vraag stelt, ontleedt het systeem die in temporele subvragen en stelt het de resultaten chronologisch samen. Het archief wordt een tijdmachine.
Laag drie: Agentic workflows. De LLM haalt niet zomaar op en antwoordt. Het plant. Een Planner-agent breekt een complexe aanvraag op ("Schrijf een due-diligence-rapport over Bedrijf X") in deeltaken. Een Researcher-agent voert gerichte zoekopdrachten uit. Een Critic-agent controleert de resultaten op hiaten en tegenstrijdigheden voordat de gebruiker iets ziet. Een Writer-agent synthetiseert de uiteindelijke output met bronvermeldingen.
We wrappen geen API's. We herbouwen de fundamenten van kennisinfrastructuur.
Die Critic-agent is cruciaal. Het is in wezen een ingebouwde factchecker — een tweede LLM-aanroep die elke gegenereerde bewering vergelijkt met de brondocumenten en alles wat niet onderbouwd is eruit haalt. Gecombineerd met strikte groundinginstructies en het afdwingen van bronvermeldingen is dit hoe we handhaven wat ik beschouw als een zerotolerancebeleid voor fabricatie.
Wat weet de Financial Times dat alle anderen niet weten?
De FT lanceerde "Ask FT" — een conversationele interface waarmee professionele abonnees hun archief kunnen bevragen. Elk antwoord is uitsluitend gegrond in FT-journalistiek. Elke bewering heeft een aanklikbare bronvermelding. Het is ontworpen voor specifieke professionele workflows: vergadervoorbereiding, snelle due diligence, trendanalyse.
Bloomberg ging nog verder met BloombergGPT, een domeinspecifieke LLM die natuurlijke taal vertaalt naar Bloomberg Query Language. Een analist kan vragen "Toon me de omzetgroei voor techbedrijven in Q3 2024" en een opgemaakte tabel krijgen. Ze kunnen transcripties van earnings calls bevragen — vragen naar de toon van een CEO over een specifieke risicofactor — in plaats van honderden pagina's lineair te lezen.
Dit zijn geen experimenten. Het zijn businessmodellen. En ze wijzen naar waar het geld daadwerkelijk zit.
Waar komt het geld vandaan?

Mensen vragen me altijd of dit "intelligence-as-a-service"-model advertentie-inkomsten daadwerkelijk kan vervangen. Mijn eerlijke antwoord: het hoeft niet alles ervan te vervangen. Het hoeft alleen het deel te vervangen dat verdwijnt.
De economie valt uiteen in drie niveaus.
Ten eerste, een abonnement op de Intelligence Tier — geen $10/maand voor "lees het nieuws," maar $1.000+/jaar voor professionals die diepe archieftoegang, agentic workflows en door bronvermeldingen onderbouwd onderzoek nodig hebben. Financiële professionals, corporate-intelligence-teams, advocatenkantoren die regelgevingsonderzoek doen. Deze gebruikers bestaan. Ze betalen momenteel analisten om handmatig te doen wat een goed gebouwd systeem in seconden doet.
Ten tweede, API-licensing. In plaats van AI-crawlers te bestrijden met robots.txt, formaliseer de data-uitwisseling. Verkoop schone, gevectoriseerde, graaf-gestructureerde archieftoegang aan enterprise-zoekplatforms, financiële terminals en externe ontwikkelaars. Reken per query of per token. De intelligentie van de uitgever leeft binnen de workflow van de klant.
Ten derde, en dit is het deel dat de meeste mensen missen: de datagracht zelf. In een wereld waarin iedereen toegang heeft tot GPT-4, is het model niet het concurrentievoordeel. De data wel. Een archief van vijftig jaar lokaal nieuws is een dataset die OpenAI niet kan repliceren. De kennisgraaf die uit dat archief is afgeleid — het web van lokale machthebbers, de tijdlijn van beleidsverschuivingen, het netwerk van bedrijfsrelaties — is bedrijfseigen intellectueel eigendom dat in de loop van de tijd in waarde toeneemt.
In een wereld van gecommoditiseerde AI-modellen is de gracht niet het algoritme. Het is het archief.
En de journalisten dan?
Ik krijg deze vraag voortdurend, en ik vind dat die een direct antwoord verdient in plaats van een ontwijking. Deze omwenteling elimineert de journalistiek niet. Het elimineert de inefficiëntie van hoe journalistiek mensen bereikt. De verslaggever die drie maanden besteedt aan het onderzoeken van een corruptieschandaal doet werk dat geen enkele AI kan repliceren. Het systeem dat wij bouwen maakt dat werk beter vindbaar, beter bevraagbaar, waardevoller in de loop van de tijd. Het verandert een verhaal dat een week lang gelezen wordt en dan begraven wordt op pagina 47 van de zoekresultaten in een permanent, opvraagbaar knooppunt in een kennisgraaf dat opduikt telkens als iemand de komende vijftig jaar een gerelateerde vraag stelt.
De bedreiging voor de journalistiek is niet conversationele AI. De bedreiging is de instortende doorverwijzingseconomie die de journalistiek financiert. Als het verkeer weg is — en dat is het — dan is vasthouden aan het advertentie-ondersteunde feedmodel geen loyaliteit aan het vak. Het is ontkenning.
Wat gebeurt er als mediabedrijven niet omwentelen?
Iets ergers dan achteruitgang: irrelevantie. Hun archieven worden gescrapet door AI-bedrijven, gesynthetiseerd tot trainingsdata en teruggeserveerd aan gebruikers zonder bronvermelding, zonder betaling en zonder de vertrouwenslaag die redactionele standaarden bieden. De uitgever wordt een onbetaalde contentleverancier voor het intelligentieproduct van iemand anders.
Sommige uitgevers tekenen al licentiedeals met OpenAI en anderen. Dat is een begin, maar het is een eenmalige transactie met lage marge. Je verkoopt grondstoffen terwijl je verfijnde intelligentie zou kunnen verkopen. Het is het verschil tussen het exporteren van ruwe olie en het bouwen van een raffinaderij.
De toekomst van nieuwsconsumptie is niet de feed. Het is het gesprek. We bewegen naar wat ik beschouw als Generative UI — interfaces die zich aanpassen aan het antwoord. Vraag om een tijdlijn, krijg een tijdlijn. Vraag om een vergelijking, krijg een tabel. Vraag om een briefing, krijg een PDF. De statische website lost op in een vloeiend, adaptief canvas voor intelligentie.
Mediabedrijven die de onderliggende datastructuren beheersen — de vectoren, de grafen, de temporele logica — zullen deze toekomst bepalen. Ze zullen niet alleen de dood van de nieuwsfeed overleven. Ze zullen iets bouwen dat beter is dan de feed ooit was.
Het archief is geen kostenpost. Het is het hele bedrijf. De enige vraag is of jij degene zult zijn die het ontsluit, of dat je zult toekijken hoe iemand anders het doet met jouw data.
Stop met het verkopen van woorden. Begin met het verkopen van antwoorden.