Uw archief is het kapitaal. Laat Google het niet langer gratis huren.

Wij bouwen conversationele AI-engines bovenop uitgeversarchieven. Antwoorden met afgedwongen bronvermelding, temporeel redeneren, GraphRAG-entiteitsresolutie en een parallelle licentiestrategie die inkomsten vangt uit de AI-engines die u niet in handen hebt. Voor middelgrote uitgevers die zich geen ML-team van zes engineers kunnen veroorloven, maar zich evenmin kunnen veroorloven om te wachten.

Voor uitgevers die zoekverkeer verliezen aan AI Overviews

48%

van de Google-zoekopdrachten tonen nu AI Overviews

theStacc / Search Engine Land, maart 2026

-33%

zoekverkeer van uitgevers op jaarbasis, tot november 2025

Reuters Institute, 2026

-43%

verdere daling die nieuwsbestuurders verwachten tegen 2029

Reuters Institute Trends 2026-enquête

De verwijzingseconomie is voorbij. De licentie-economie is nog niet opgebouwd.

Een concreet scenario, geen abstract probleem.

Een regionaal dagblad met 4 miljoen unieke bezoekers per maand en een archief van 32 jaar maakt de berekeningen in zijn bestuursdossier van februari 2026. Organische zoekverwijzingen zijn met 41% gedaald op jaarbasis. Programmatic-CPM's zijn met nog eens 18% gedaald. Hun affiliate-inkomsten, die het bedrijfsmodel in 2023 overeind hielden, zijn ingestort tot een derde van hun piek. Dezelfde trajectorie die Penske Media aanhaalde in zijn antitrustklacht van september 2025 tegen Google. De CFO stelt de voor de hand liggende vraag: wat is Google ons precies verschuldigd, en hoe zorgen we dat het betaalt?

Het antwoord is ongemakkelijk. Google is hun contractueel niets verschuldigd. De ongeschreven afspraak (u crawlt ons, u stuurt ons verkeer) werd eenzijdig herschreven toen AI Overviews begonnen te verschijnen bij 48% van de zoekopdrachten. Wanneer een AI Overview boven een organische link verschijnt, mat de Daily Mail een daling van 89% in desktop-doorklikken. Het panel van Pew uit maart 2025 stelde vast dat gebruikers die een AI Overview tegenkwamen, slechts in 8% van alle bezoeken doorklikten naar een traditionele link. De content van de uitgever wordt nog steeds gelezen. De uitgever wordt niet langer betaald.

Ondertussen kent de voor de hand liggende reactie, "bouw onze eigen AI", zijn eigen littekenweefsel. The Washington Post lanceerde Ask The Post AI in november 2024. Tegen december 2025 lekten interne Slack-berichten van de standards editor uit: hun door AI gegenereerde podcast verzon citaten, schreef bronnen verkeerd toe en voegde commentaar in alsof het de redactionele standpunt van de krant was. "Het is werkelijk verbijsterend dat dit überhaupt is toegestaan," schreef een redacteur, "nooit had ik me kunnen voorstellen dat The Washington Post zijn eigen journalistiek opzettelijk zou verdraaien en deze fouten vervolgens op grote schaal naar ons publiek zou uitsturen." Het technische falen was een ontbrekende stap voor bronverificatie. De reputatieschade was wereldwijd.

Dit is de werkelijke vorm van het probleem. Middelgrote uitgevers kunnen het zich niet veroorloven om niets te doen. De zoekmachine die hun distributie opbouwde is nu hun grootste concurrent. Ze kunnen het zich ook niet veroorloven om een hallucinerende chatbot onder hun eigen vlag uit te brengen. En ze kunnen de interne ML-teams die de FT, Bloomberg en The New York Times vóór de afgrond opbouwden niet repliceren. Ze hebben een bouwpartner nodig die het onsexy werk heeft gedaan: archiefopname, entiteitsresolutie, afdwingen van bronvermelding, redactionele beoordelingswachtrijen en een parallelle licentiestrategie die inkomsten vangt uit de AI-engines die ze nooit zullen bezitten.

Het uitgevers-AI-landschap, van begin tot eind

Haal dit erbij in uw volgende strategievergadering. We hebben geprobeerd eerlijk te zijn over wat elke optie wel en niet doet.

Optie Wat het daadwerkelijk doet Waar het tekortschiet
SaaS-chatbotleverancier (Tars, eenvoudige on-site zoekwrappers) Plaatst een chatwidget op uw site. Vector-embeddings van uw artikelen. Geoffreerd op $60K-$120K, in weken uitgerold. Geen entiteitsresolutie. Geen temporeel redeneren. Geen bronverificatie. Hallucineert op de zoekopdrachten die ertoe doen (multi-hop, longitudinaal). Uw archief staat in hún cloud.
Interne build van de Big Five (FT, NYT, Bloomberg, WaPo, Guardian) Maatwerk-RAG over een eigen archief. Ask FT draait op Anthropic Claude met verplichte bronvermeldingen. Bloomberg heeft BloombergGPT en BQL-vertaling. Gebouwd door ML-teams van 6-20 engineers over 12-24 maanden. De kosten lopen op tot zeven cijfers. Middelgrote uitgevers kunnen de personeelsbezetting domweg niet repliceren.
Big 4 / grote SI (Accenture, Deloitte, IBM iX) Zullen het bouwen. Hebben generatieve-AI-werk gedaan voor aanverwante sectoren. Opdrachten lopen van $1,5M tot $5M+ met een discovery-fase die langer duurt dan uw financiële horizon. Ze grijpen naar dezelfde Microsoft GraphRAG- en Neo4j-stack als wij, maar rekenen daarbovenop partner-tier-consultancy. Ze hebben geen vijf uitgeversarchieven achter elkaar gebouwd.
Cloudflare Pay Per Crawl (jan 2026) Blokkeert standaard AI-crawlers over ~20% van het wereldwijde webverkeer. Laat u per crawler Allow / Charge / Block instellen tegen een domeinbrede prijs per verzoek. Voorkomt niet dat AI Overviews uw content samenvatten (ze halen op tijdens de zoekopdracht). Genereert geen retentie. Puur het vangen van lekkage, en de prijsontdekking is nog onvolwassen.
News/Media Alliance + ProRata (mrt 2026) Collectieve licentiepool voor 2.200 kleine/middelgrote uitgevers. 50/50 inkomstenverdeling op via Gist.ai attributie-getraceerde AI-antwoorden. NMA verzorgt de papierwinkel. Inkomsten zijn afhankelijk van Gist.ai dat terrein wint tegen ChatGPT, Perplexity en Gemini. Nog vroeg dag. De parallelle deal NMA+Bria is uitsluitend enterprise-RAG.
Tollbit / directe bot-tol Rekent per crawlverzoek, een vergelijkbaar mechanisme als Cloudflare maar bot-per-bot configureerbaar. Boston Globe, Vox en Future hebben dit getest. Dezelfde structurele beperking als Cloudflare: het vangt crawler-inkomsten, geen query-inkomsten. Eerlijke uitgevers zouden zowel Tollbit als een query-zijde-aanpak moeten draaien.
Veriprajna (wij) Maatwerkbuild van de conversationele engine op uw stack, met afdwingen van bronvermelding, GraphRAG-entiteitsresolutie, temporeel redeneren en redactionele governance. Plus integratie van ProRata, Bria, Tollbit en Cloudflare in één enkele inkomstenstrategie. Wij zijn een consultancy, geen SaaS. We lossen de machtsasymmetrie van het platform niet op. Alleen uw overheid kan dat. We zullen niet doen alsof de licentie-dollars van ProRata of Bria 100% van de verloren zoekinkomsten zullen vervangen. Dat zullen ze in 2026 niet doen.

Wat wij voor uitgevers bouwen

Elke opdracht is maatwerk. Dit zijn de vier capaciteitsgebieden die we steeds opnieuw gevraagd worden te combineren.

1. Archiefopname en entiteitsresolutie

De onsexy 60% van elk project. Layout-bewuste OCR voor gescande microfilm en pdf's van vóór 2005 (Tesseract voor schone documenten, Azure Document Intelligence of Google Document AI voor kolomrijke krantenpagina's). Semantische chunking die koppen, leads en bylines respecteert in plaats van elke 500 woorden te snijden. Metadata-verrijking met publicatiedatum, auteur, sectie en Named Entity Recognition voor Personen, Organisaties, Locaties, Wetsvoorstellen en Zaken.

Daarna de entiteitsresolutie-stap: het samenvoegen van "Mr. Musk", "Elon Musk", "Tesla CEO" tot één knooppunt, en het onderscheiden van "John Smith de raadslid" van "John Smith de schooldirecteur" over 25 jaar aan bylines. We combineren LLM-gebaseerde extractie met deterministische regels afgestemd op uw vakgebied, gevolgd door menselijke beoordeling voor de top 200 entiteiten naar artikelaantal. Senzing of Neo4j Graph Data Science neemt de algoritmische kant voor zijn rekening. De afwegingen zijn van ons en van u, gezamenlijk.

2. GraphRAG met temporeel redeneren

Vectorzoeken alleen kan "Hoe veranderde het woningstandpunt van de burgemeester tussen 2010 en 2024" niet beantwoorden, omdat het antwoord in geen enkele losse chunk staat. We verwerken het archief tot een Neo4j- of Amazon Neptune-kennisgraaf met getypeerde edges (HAS_STANCE, ENDORSED_BY, VOTED_ON), en versioneren vervolgens elke edge met valid_start- en valid_end-tijdstempels afgeleid van publicatiedata.

Tijdens de query ontleedt een agentic planner de vraag in temporele subqueries, doorloopt de graaf en stelt een chronologische narratief samen met inline bronvermeldingen. We gebruiken Microsoft GraphRAG als open-source ruggengraat en passen de prompts voor entiteitsextractie aan op uw specifieke vakgebieden. Voor langere archieven leggen we T-GRAG (arXiv 2510.13590) toe voor tijdgevoelig ophalen. Dit is het verschil tussen een chatbot die artikelen vindt en een die het verhaal er dwars doorheen synthetiseert.

3. Afdwingen van bronvermelding en redactionele beoordeling

Het podcast-incident van The Washington Post is de waarschuwende casus. Drie lagen, geen shortcuts. Ten eerste verbiedt een strict-grounding systeemprompt elke bewering die niet in de opgehaalde context staat. Ten tweede controleert een post-hoc verifier (een aparte LLM-aanroep) elke gegenereerde zin tegen de geciteerde bron en verwijdert elke zin waarvan de bronvermelding de bewering niet daadwerkelijk bevat. Ten derde routeert een betrouwbaarheidsdrempel antwoorden met lage betrouwbaarheid naar een redactionele beoordelingswachtrij voordat ze de gebruiker bereiken, met configureerbare ernstniveaus.

We instrumenteren het antwoordlogboek zodat uw standards-desk elke sessie binnen een uur kan auditen. We bouwen ook een "kill switch", één enkele dashboardknop die de publieke widget uitschakelt terwijl de back-end voor engineering blijft draaien. Saai, essentieel, en nooit aanwezig in een SaaS-chatbot.

4. Dubbele inkomstenstrategie: retentie-engine + lekkage vangen

De meeste consultancy's verkopen u één aanpak. Het eerlijke antwoord is dat u beide nodig hebt. De retentie-aanpak is uw eigen conversationele engine, verpakt als een premium "Intelligence"-abonnementsniveau (het Ask FT-model: $1.000+/jaar per professionele gebruiker met onbeperkte agentic queries). De lekkage-vangaanpak is meedoen met ProRata (50/50 inkomstenverdeling via Gist.ai), Bria (intern enterprise-AI-gebruik) en Tollbit (directe bot-tol), plus een Cloudflare Pay Per Crawl-houding die GPTBot, ClaudeBot, CCBot en Google-Extended blokkeert terwijl ze Perplexity en Mistral laten betalen.

We integreren de licentie-dashboards met uw bestaande inkomstenanalyse zodat uw CFO één overzicht ziet, niet vijf. We zullen niet beloven dat de licentie-dollars de verloren zoekinkomsten in 2026 zullen vervangen. We zullen u beloven dat u ze niet op tafel laat liggen.

Hoe wij werken

Geen discovery-deck dat een kwartaal in beslag neemt. Geen strategiedocument van 80 pagina's. We leveren een werkende chatwidget aan uw redactieteam in week 8 en itereren van daaruit.

Fase 0: Archiefaudit (2 weken, vaste prijs)

We nemen een steekproef van 1% van uw archief, meten de opnamemoeilijkheid (schone Arc XP-export vs. gescande microfilm vs. kapotte 2003-HTML), stellen een entiteitsinventaris op van uw top 200 Personen/Organisaties/Plaatsen, en prijzen de volledige build met een verdedigbaar betrouwbaarheidsinterval. De variatie tussen het beste en het slechtste scenario voor alleen al de opname is ongeveer 8 op 1 in inspanning. We geven uw CFO een getal, geen marge.

Fase 1: Opname en hybride index (weken 3-8)

Bouw de opnamepijplijn (OCR, semantische chunking, metadata-verrijking). Zet de hybride ophaallaag op: BM25 sparse search voor exacte entiteitsmatches plus dense vector-embeddings voor semantische gelijkenis, met een Cohere- of BGE-reranker erbovenop. Implementeer de chatwidget in een staging-omgeving waarin uw redacteuren privé dingen kapot mogen maken.

Fase 2: Entiteitsgraaf en temporele laag (weken 9-18)

Voer entiteitsextractie en -resolutie uit over het volledige archief. Zet Neo4j op met geversioneerde edges. Voeg de temporele query-decomposer toe. Tegen het einde van Fase 2 kan de chatwidget "hoe evolueerde X over Y jaar" beantwoorden met een chronologisch geordend, met bronvermelding onderbouwd antwoord.

Fase 3: Afdwingen van bronvermelding, redactionele beoordeling, soft launch (weken 19-24)

Implementeer de post-hoc bronvermelding-verifier, de beoordelingswachtrij met betrouwbaarheidsdrempel en de audittooling van de standards-desk. Open de widget voor een klein percentage geauthenticeerde abonnees achter een feature flag. Stem het beleid voor antwoordlengte en de weigering-templates af tegen echte querylogboeken, niet tegen synthetische benchmarks.

Fase 4: Licentie-integratie en Intelligence-niveau (weken 25+)

Koppel de ProRata- en Bria-attributie aan uw inkomstendashboard. Configureer Cloudflare Pay Per Crawl-regels per crawler. Help product en pricing met het ontwerpen van het Intelligence-niveau en het bijbehorende proefflow. Draag het operationele eigenaarschap over aan uw team met een ondersteuningstraject van 90 dagen in koppels.

Eerlijk voorbehoud: tijdlijnen gaan uit van een archief van 100K-500K artikelen op Arc XP, Brightspot of WordPress VIP. Een wetenschappelijk archief van 5 miljoen artikelen op Atypon, of een stapel gescande microfilm uit de jaren 90, kan alleen al aan Fase 1 8-16 weken toevoegen. De Fase 0-audit bestaat om dit op te vangen voordat u een getal ondertekent.

Beoordeling van archiefgereedheid

Acht vragen. Vertelt u welke fase uw bouwkosten zal domineren en wat u moet oplossen voordat u welke leverancier dan ook offerte vraagt.

Vragen die uitgevers ons echt stellen

Hoeveel kost het om een RAG-chatbot voor uitgevers over ons archief te bouwen?

Voor een archief van 10-25 jaar met 100K-500K artikelen kost een conversationele engine van productiekwaliteit ongeveer $180K-$450K voor de initiële build, plus $4K-$15K per maand voor inference, vectoropslag en reranker-aanroepen bij typische queryvolumes van middelgrote uitgevers. De opnamepijplijn is de grootste kostenpost, doorgaans 50-60% van de bouwkosten. De variatie hangt af van drie zaken: hoe schoon het archief al is (moderne Arc XP-exports vs. gescande microfilm uit de jaren 90), of u een kennisgraaflaag nodig hebt voor multi-hop queries, en de diepgang van de redactionele beoordelingstooling. Een SaaS-chatbotwrapper verkocht door een platformleverancier offreert u $60K, maar hij zal hallucineren op de zoekopdrachten die ertoe doen, omdat hij nooit een entiteit-geresolveerde weergave van uw specifieke archief heeft gebouwd.

Als we onze eigen conversationele AI bouwen, zal die dan onze abonnement-paginaweergaven kannibaliseren?

De vroege data van FT Professional en Bloomberg Terminal wijzen de andere kant op. Ask FT verhoogde wat de FT intern Actual Core Reader engagement noemt door evergreen archiefcontent naar boven te halen die abonnees anders nooit zouden vinden. De kannibalisatie-angst gaat uit van een statische intentiepool. In werkelijkheid trekken conversationele queries gebruikers in diepere sessies over onderwerpen die ze na één vluchtige blik op een zoekresultaat zouden hebben opgegeven. Het risico is reëel voor dunne algemene-nieuwscontent waar de chatbot een enkel artikel tot één alinea kan samenvatten. Het is veel lager voor analytische, longitudinale en onderzoeksjournalistieke content waar de chatervaring een onderzoeksassistent is, geen TL;DR. We dimensioneren het prijsniveau en het beleid voor antwoordlengte op de diepgang van uw content, niet op het kopiëren van een sjabloon van een andere uitgever.

Moeten we AI-crawlers blokkeren met Cloudflare Pay Per Crawl, en zal Google ons de-indexeren als we dat doen?

Cloudflare Pay Per Crawl, gelanceerd in januari 2026 over ongeveer 20 procent van het wereldwijde webverkeer, laat u per crawler Allow, Charge of Block instellen tegen een domeinbrede prijs. Het technisch correcte antwoord is dat u GPTBot, ClaudeBot, CCBot en PerplexityBot kunt blokkeren terwijl u Googlebot en Bingbot nog steeds toelaat, omdat Google publiekelijk het crawlen door Googlebot scheidt van Google-Extended (de Gemini-trainingsfetcher). Het blokkeren van Google-Extended heeft geen invloed op de zoekrangschikking. De politieke zorg is dat Google AI Overviews nog steeds content uit geïndexeerde pagina's naar boven halen, zelfs wanneer Google-Extended is geblokkeerd, omdat ze ophalen tijdens de query. Blokkeren voorkomt dus niet dat uw content in AIO wordt samengevat, het voorkomt alleen dat het gebruikt wordt om toekomstige Gemini-versies te trainen. Een verdedigbare houding voor de meeste middelgrote uitgevers in 2026 is: Blokkeer GPTBot, ClaudeBot, CCBot en Google-Extended. Laat PerplexityBot en Mistral betalen. Laat Googlebot en Bingbot toe. Stuur vervolgens licentie-dollars via ProRata, Bria en Tollbit om inkomsten te vangen uit de AI-engines die u niet in handen hebt.

Wie is aansprakelijk wanneer onze AI-assistent een citaat verzint of een verhaal verkeerd toeschrijft?

U. Het AI-podcast-incident van The Washington Post uit december 2025 (fictieve citaten, het invoegen van commentaar als de redactionele standpunt van de krant) is de waarschuwende casus die dit veranderde van een hypothetische in een bestuursvraag voor uitgevers. Er is geen Section 230-bescherming voor content die uw eigen systeem genereert uit uw eigen archief; de AI-output wordt behandeld als uw redactionele werkproduct. De mitigaties zijn architectonisch, niet contractueel. We dwingen drie lagen af: een strict-grounding systeemprompt die verbiedt om kennis buiten de opgehaalde chunks te gebruiken, post-hoc bronvermelding-verificatie die elke zin verwijdert waarvan de geciteerde bron de bewering niet bevat, en een betrouwbaarheidsdrempel die antwoorden met lage betrouwbaarheid naar een redactionele beoordelingswachtrij routeert voordat ze de gebruiker bereiken. We instrumenteren ook het antwoordlogboek zodat uw standards-desk elke sessie binnen een uur na het gebeuren kan auditen. Niets van dit alles bestaat in een SaaS-chatbotwrapper.

Hoe helpt GraphRAG eigenlijk bij een nieuwsarchief vs. een gewone vector-RAG?

Vector-RAG haalt chunks op die semantisch lijken op de query. Dat werkt voor het opzoeken van feiten. Het faalt bij de zoekopdrachten die een nieuwsarchief waardevol maken: Hoe evolueerde het woningstandpunt van de burgemeester over 12 jaar. Wie verbindt Persoon X met Schandaal Z via welke tussenliggende organisaties. Wat waren de terugkerende bronnen die werden geciteerd in de berichtgeving over de schoolbestuur-controverse. Dit zijn multi-hop, longitudinale en entiteit-gedreven queries. GraphRAG verwerkt het archief voor tot een entiteitsgraaf (personen, organisaties, plaatsen, gebeurtenissen) met getypeerde relaties, en doorloopt vervolgens de graaf tijdens de query. Het moeilijke deel is niet de graafdatabase (Neo4j of Amazon Neptune handelen dat af). Het moeilijke deel is entiteitsresolutie: het samenvoegen van 'Mr. Musk', 'Elon Musk', 'Tesla CEO' en 'X-eigenaar' tot één knooppunt, en het onderscheiden van 'John Smith het gemeenteraadslid' van 'John Smith de middelbareschooldirecteur' over 25 jaar aan bylines en tikfouten van freelancers. We gebruiken een combinatie van LLM-gebaseerde extractie, deterministische entiteitsresolutie-regels afgestemd op uw vakgebied, en menselijke beoordeling voor de top 200 entiteiten naar artikelaantal. Dat is het deel dat niemand anders voor u zal doen.

Wij gebruiken Arc XP / WordPress VIP / Brightspot. Hoe integreert dit met ons CMS?

De conversationele engine is een aparte service die een feed uit uw CMS consumeert en een chat-API terug naar uw site blootstelt. Het integratiepatroon verschilt per stack. Arc XP stelt een Content API en webhooks bloot maar geen embedding-hooks, dus draaien we een synchronisatietaak die elke vijf minuten nieuwe en bijgewerkte verhalen ophaalt en opnieuw embedt. WordPress VIP ondersteunt aangepaste REST-endpoints en we implementeren doorgaans als een aparte microservice plus een Gutenberg-blok voor de chatwidget. Brightspot is het meest flexibel vanwege zijn content-type-model, dat het extraheren van gestructureerde metadata veel schoner maakt. Atypon-uitgevers (overwegend wetenschappelijk) functioneren naast Literatum-zoeken in plaats van het te vervangen. In elk geval is de chatwidget een JS-embed die uw redacteuren op elke pagina kunnen plaatsen, en draait de back-end in uw cloud-account, niet in het onze. We sluiten u niet op in een gehoste service.

Moeten we ons aansluiten bij News/Media Alliance ProRata of Bria, of onze eigen engine bouwen, of beide?

Beide, en ze lossen verschillende problemen op. De in maart 2026 aangekondigde NMA + ProRata-deal is een collectieve licentiepool: 2.200 uitgevers kunnen meedoen om RAG-gedreven enterprise-vraag te monetiseren voor een 50/50 inkomstenverdeling, attributie-getraceerd. Bria is de parallelle deal gericht op intern enterprise-AI-gebruik. Dit is het vangen van lekkage, ze betalen u wanneer een AI-engine die u niet bezit uw content gebruikt. Uw eigen conversationele engine is de retentie-aanpak: hij verdiept de betrokkenheid bij uw bestaande publiek en creëert een premium niveau. ProRata betaalt u een fractie van een fractie per query. Uw eigen intelligence-niveau (Ask FT rekent $1K+/jaar per professionele gebruiker) heeft een hoge marge en versterkt zich met de waarde van uw archief. Draai beide. De kosten van deelname aan ProRata liggen vrijwel op nul (NMA verzorgt de papierwinkel), en de inkomsten zijn aanvullend op de engineering-investering die u toch al doet.

Hoe lang duurt de build van kick-off tot een chatwidget op onze site?

Voor een schoon Arc XP- of Brightspot-archief van 100K-500K artikelen wordt een met bronvermelding onderbouwde chatwidget met hybride zoeken en basale temporele filtering in 14-18 weken geleverd. GraphRAG met entiteitsresolutie voegt nog eens 10-14 weken toe. Een agentic onderzoeksassistent-niveau voegt daarbovenop 8-12 weken toe. De langste enkele kostenpost is altijd archiefopname, vooral als u content van vóór 2005 hebt met kapotte HTML, ontbrekende foto's of gescande pdf's van een microfilm-digitaliseringsproject. We beginnen met een archiefaudit van 2 weken voordat we een vaste tijdlijn offreren, omdat de variatie tussen 'exporteren uit CMS' en 'een miljoen gescande pagina's OCR'en' 8 op 1 is in inspanning. De audit geeft u een verdedigbaar getal om mee naar uw CFO te gaan.

Technisch onderzoek

De interactieve whitepaper die deze oplossingspagina onderbouwt.

Uw archief is meer waard dan uw advertentievoorraad. Laten we het bewijzen.

Begin met de archiefaudit van 2 weken. Vaste prijs, geen verplichting tot de volledige build.

We nemen een steekproef van 1% van uw content, meten de opnamemoeilijkheid, stellen uw top 200 entiteiten op, en geven uw CFO een verdedigbaar getal voor de volledige build. Als de audit zegt niet te bouwen, vertellen we u dat.

Fase 0: Archiefaudit

  • ✓ Opnametest met 1%-steekproef (echte OCR, echte chunking)
  • ✓ Inventaris van top-200 entiteiten en disambiguatie-stap
  • ✓ CMS-integratie-spike (Arc XP, WordPress VIP, Brightspot, Atypon)
  • ✓ Vaste-prijsofferte voor de volledige Fase 1-4-build

Volledige bouwopdracht

  • ✓ GraphRAG + temporeel redeneren + afdwingen van bronvermelding
  • ✓ Redactionele beoordelingswachtrij en audittooling van de standards-desk
  • ✓ Integratie van ProRata, Bria, Tollbit, Cloudflare Pay Per Crawl
  • ✓ Ondersteuning bij prijsstelling en productontwerp van het Intelligence-niveau