我们在出版商档案之上构建对话式 AI 引擎。强制引用的答案、时序推理、GraphRAG 实体消解,以及一套从你无法掌控的 AI 引擎中获取收入的并行授权策略。专为那些既无力组建六人机器学习团队、也等不起的中型出版商打造。
48%
的谷歌查询如今会显示 AI 概览
theStacc / Search Engine Land,2026 年 3 月
-33%
出版商搜索流量同比变化,截至 2025 年 11 月
路透研究院,2026 年
-43%
新闻高管预计到 2029 年还将进一步下降的幅度
路透研究院 2026 趋势调查
一个具体的场景,而非抽象的问题。
一家地区性日报拥有 400 万月度独立访客和长达 32 年的档案,在其 2026 年 2 月的董事会材料中核算了这些数字。自然搜索引流同比下降 41%。程序化广告 CPM 又下降了 18%。曾在 2023 年支撑其商业模式的联盟营销收入,已经萎缩到峰值的三分之一。这与 Penske Media 在其 2025 年 9 月针对谷歌的反垄断诉状中所引用的轨迹如出一辙。CFO 提出了那个显而易见的问题: 谷歌究竟欠我们什么,我们又该如何让它付费?
答案令人不安。在合同层面,谷歌对他们没有任何亏欠。那笔不成文的交易(你抓取我们、你给我们带来流量)在 AI 概览开始出现在 48% 的查询中时,被单方面改写了。当 AI 概览出现在自然链接上方时,《每日邮报》测得桌面端点击率下降了 89%。皮尤研究中心 2025 年 3 月的调查样本发现,遇到 AI 概览的用户在所有访问中仅有 8% 会点击进入传统链接。出版商的内容仍然在被阅读,出版商却不再获得报酬。
与此同时,那个显而易见的应对方式——“自己造 AI”——也留下了自己的伤疤。《华盛顿邮报》于 2024 年 11 月推出了 Ask The Post AI。到 2025 年 12 月,来自标准编辑的内部 Slack 消息遭到泄露:他们的 AI 生成播客在编造引语、误标来源,并把评论当作报纸的社论立场来插入。 “竟然允许这种事情推进,实在令人震惊,” 一位编辑写道, “我从未想象过《华盛顿邮报》会蓄意扭曲自家的新闻报道,然后把这些错误大规模推送给我们的受众。” 这次技术上的失败源于缺少了一道引用验证步骤。而对声誉的损害是全球性的。
这才是问题的真正形态。中型出版商无力坐以待毙。曾经构建起他们分发渠道的搜索引擎,如今成了他们最大的竞争对手。他们也无力在自己的报头之下上线一个会产生幻觉的聊天机器人。而且他们无法复制 FT、Bloomberg 和《纽约时报》在悬崖到来之前就建起的内部机器学习团队。他们需要一个做过那些不光鲜苦活的搭建合作伙伴:档案摄入、实体消解、引用强制、编辑审核队列,以及一套从他们永远不会拥有的 AI 引擎中获取收入的并行授权策略。
在你下一次战略会议上把这份资料调出来。对于每个选项能做什么、不能做什么,我们都力求诚实。
| 选项 | 它实际能做什么 | 它的短板在哪里 |
|---|---|---|
| SaaS 聊天机器人厂商(Tars、基础的站内搜索封装) | 在你的网站上放一个聊天小部件。对你的文章做向量嵌入。报价 $60K-$120K,几周内部署完成。 | 没有实体消解。没有时序推理。没有引用验证。在真正重要的查询(多跳、纵向)上会产生幻觉。你的档案存在他们的云里。 |
| 五大巨头的内部自建(FT、NYT、Bloomberg、WaPo、Guardian) | 在专有档案之上定制 RAG。Ask FT 运行在 Anthropic Claude 上,强制引用。Bloomberg 拥有 BloombergGPT 和 BQL 翻译。 | 由 6-20 人的机器学习团队历时 12-24 个月构建。成本高达七位数。中型出版商无法复制这样的人员规模,毫无悬念。 |
| 四大 / 大型系统集成商(Accenture、Deloitte、IBM iX) | 他们会做。也曾为相邻行业做过生成式 AI 项目。 | 项目报价在 $1.5M-$5M+,其调研阶段持续的时间比你的资金跑道还长。他们用的是和我们一样的 Microsoft GraphRAG 与 Neo4j 技术栈,但还要额外收取合伙人级别的咨询费。他们没有连续构建过五个出版商档案。 |
| Cloudflare Pay Per Crawl(2026 年 1 月) | 默认在约占全球网络流量 20% 的范围内拦截 AI 爬虫。让你按爬虫设置“允许/收费/拦截”,并设定一个全域统一的单次请求价格。 | 无法阻止 AI 概览对你的内容进行摘要(它们在查询时即时检索)。无法产生留存。纯粹的泄漏拦截,而且其价格发现机制仍不成熟。 |
| News/Media Alliance + ProRata(2026 年 3 月) | 面向 2,200 家中小型出版商的集体授权池。通过 Gist.ai,对可追溯归因的 AI 答案实行 50/50 的收入分成。NMA 负责处理文书工作。 | 收入取决于 Gist.ai 能否在与 ChatGPT、Perplexity 和 Gemini 的竞争中获得采用。尚处早期。NMA+Bria 的并行交易仅限于企业级 RAG。 |
| Tollbit / 直接的机器人通行费 | 按每次抓取请求收费,机制与 Cloudflare 类似,但可逐个机器人进行配置。Boston Globe、Vox、Future 已进行试点。 | 与 Cloudflare 有相同的结构性局限:它捕获的是爬虫收入,而非查询收入。诚实的出版商应当同时运行 Tollbit 和一套查询侧的打法。 |
| Veriprajna(我们) | 在你的技术栈上定制构建对话式引擎,具备引用强制、GraphRAG 实体消解、时序推理和编辑治理。外加将 ProRata、Bria、Tollbit 和 Cloudflare 整合进一套统一的收入策略。 | 我们是一家咨询公司,而非 SaaS。我们无法解决平台权力的不对称。只有你所在的政府才能做到。我们不会假装来自 ProRata 或 Bria 的授权收入能够 100% 替代损失掉的搜索收入。在 2026 年,它们做不到。 |
每个项目都是定制的。以下是我们不断被要求组合在一起的四个能力领域。
每个项目中那不光鲜的 60%。针对扫描的微缩胶卷和 2005 年前 PDF 的版面感知 OCR(对干净文档用 Tesseract,对栏目密集的报纸版面用 Azure Document Intelligence 或 Google Document AI)。尊重标题、导语和署名的语义分块,而不是每 500 字切一刀。用出版日期、作者、版块进行元数据富化,并对人物、组织、地点、法案和案件进行命名实体识别。
然后是实体消解环节:把“马斯克先生”“Elon Musk”“特斯拉 CEO”归并为同一个节点,并在跨越 25 年的署名中区分“市议员约翰·史密斯”与“校长约翰·史密斯”。我们将基于 LLM 的抽取与针对你所属领域调校过的确定性规则相结合,再对按文章数排名前 200 的实体进行人工审核。算法层面由 Senzing 或 Neo4j Graph Data Science 处理。那些需要判断的决定,则由我们和你共同来做。
单凭向量搜索无法回答“市长在 2010 年至 2024 年间对住房的立场是如何变化的”,因为答案并不存在于任何单一的文本块里。我们将档案处理成 Neo4j 或 Amazon Neptune 知识图谱,带有类型化的边(HAS_STANCE、ENDORSED_BY、VOTED_ON),然后为每条边附上由出版日期推导出的 valid_start 和 valid_end 时间戳,进行版本化。
在查询时,一个智能体式的规划器将问题分解为时序子查询,遍历图谱,并组装出一段带内联引用的时间线叙述。我们以 Microsoft GraphRAG 作为开源主干,并将实体抽取提示词定制到你具体的报道领域。对于更长的档案,我们叠加 T-GRAG(arXiv 2510.13590)以实现对时间敏感的检索。这就是“一个只会找到文章的聊天机器人”与“一个能跨文章综合出整个故事的聊天机器人”之间的区别。
《华盛顿邮报》的播客事件就是那个警示案例。三道防线,没有捷径。第一,一条严格扎根的系统提示词禁止任何未出现在检索上下文中的论断。第二,一个事后验证器(一次独立的 LLM 调用)会将每一条生成的句子与其所引来源进行核对,并丢弃任何其引用实际并不包含该论断的句子。第三,一个置信度阈值会在答案触达用户之前,把低置信度的答案路由进编辑审核队列,并配有可配置的严重性分级。
我们对答案日志做了埋点,让你的标准编辑部能在一小时内审计任何一次会话。我们还会构建一个“紧急停止开关”——一个单一的仪表盘控制项,可在保持后端为工程团队继续运行的同时停用面向公众的小部件。乏味,却必不可少,而且在 SaaS 聊天机器人里从来没有。
大多数咨询公司只卖给你一种打法。诚实的答案是两者你都需要。留存这一打法是你自己的对话式引擎,包装成一个高端的“情报”订阅档次(即 Ask FT 模式:每位专业用户每年 $1,000+,可无限次进行智能体式查询)。泄漏拦截这一打法是选择加入 ProRata(通过 Gist.ai 进行 50/50 收入分成)、Bria(企业内部 AI 使用)和 Tollbit(直接的机器人通行费),再加上一套 Cloudflare Pay Per Crawl 的策略——拦截 GPTBot、ClaudeBot、CCBot 和 Google-Extended,同时对 Perplexity 和 Mistral 收费。
我们将授权仪表盘与你现有的收入分析整合在一起,让你的 CFO 看到的是一个视图,而不是五个。我们不会承诺这些授权收入能在 2026 年替代损失掉的搜索收入。但我们会承诺:你不会把它们白白丢在桌上。
没有耗时一个季度的调研演示文稿。没有 80 页的战略文档。我们会在第 8 周就把一个能用的聊天小部件摆到你的编辑团队面前,并在此基础上迭代。
我们抽取你档案的 1%,衡量摄入难度(干净的 Arc XP 导出 vs. 扫描的微缩胶卷 vs. 损坏的 2003 年 HTML),起草一份你排名前 200 的人物/组织/地点实体清单,并以一个站得住脚的置信区间为整个构建定价。仅就摄入而言,最好情形与最坏情形之间的工作量差异大约为 8 比 1。我们会给你的 CFO 一个数字,而不是一个区间。
构建摄入流水线(OCR、语义分块、元数据富化)。搭建混合检索层:用于精确实体匹配的 BM25 稀疏搜索,加上用于语义相似度的稠密向量嵌入,并在其上叠加 Cohere 或 BGE 重排器。把聊天小部件部署到一个你的编辑可以私下尽情破坏的预发布环境中。
在整个档案上运行实体抽取与消解。搭建带版本化边的 Neo4j。加入时序查询分解器。到第 2 阶段结束时,聊天小部件就能用按时间顺序排列、有引用支撑的答案来回答“X 在 Y 年间是如何演变的”。
部署事后引用验证器、置信度阈值审核队列,以及标准编辑部审计工具。在功能开关之后,向一小部分经过认证的订阅用户开放该小部件。依据真实的查询日志(而非合成基准)来调校答案长度策略和拒答模板。
将 ProRata 和 Bria 的归因接入你的收入仪表盘。按爬虫配置 Cloudflare Pay Per Crawl 规则。协助产品与定价团队设计情报档次及其试用流程。通过为期 90 天的结对支持过渡期,把运营所有权移交给你的团队。
诚实的提醒:上述时间线假设的是一个 10 万-50 万篇文章、托管在 Arc XP、Brightspot 或 WordPress VIP 上的档案。一个托管在 Atypon 上、有 500 万篇文章的学术档案,或者一堆 1990 年代扫描的微缩胶卷,仅第 1 阶段就可能增加 8-16 周。第 0 阶段的审计正是为了在你签下一个数字之前抓住这种情况而存在的。
八个问题。告诉你哪个阶段将主导你的构建成本,以及在向任何厂商询价之前该修复什么。
对于一个 10-25 年、10 万-50 万篇文章的档案,一个生产级的对话式引擎在初始构建上大约需要 $180K-$450K,外加每月 $4K-$15K 用于推理、向量存储和在典型中型出版商查询量下的重排器调用。摄入流水线是最大的开支项,通常占构建成本的 50-60%。差异取决于三件事:档案本身已经有多干净(现代的 Arc XP 导出 vs. 1990 年代扫描的微缩胶卷)、你是否需要一个用于多跳查询的知识图谱层,以及编辑审核工具的深度。平台厂商出售的 SaaS 聊天机器人封装会向你报价 $60K,但它会在真正重要的查询上产生幻觉,因为它从未为你具体的档案构建过一个完成实体消解的视图。
来自 FT Professional 和 Bloomberg Terminal 的早期数据指向相反的方向。Ask FT 通过呈现订阅用户原本永远不会发现的常青档案内容,提升了 FT 内部所称的“实际核心读者”参与度。蚕食的担忧假设了一个静态的意图池。而在现实中,对话式查询会把用户拉入更深的会话,去探讨那些他们原本浏览一眼搜索结果后就会放弃的话题。对于单薄的一般性新闻内容,这种风险是真实存在的——在那里聊天机器人可以把一篇文章摘要成一段话。但对于分析性、纵向性和调查性的内容,这种风险要低得多——在那里聊天体验是一位研究助理,而不是一份太长不看的摘要。我们会按你的内容深度来设定定价档次和答案长度策略,而不是照搬另一家出版商的模板。
Cloudflare Pay Per Crawl 于 2026 年 1 月在大约占全球网络流量 20% 的范围内推出,让你能按爬虫以一个全域统一的价格设置“允许、收费或拦截”。技术上正确的答案是:你可以拦截 GPTBot、ClaudeBot、CCBot 和 PerplexityBot,同时仍然允许 Googlebot 和 Bingbot,因为谷歌公开地将 Googlebot 的抓取与 Google-Extended(Gemini 训练抓取器)分开。拦截 Google-Extended 不会影响搜索排名。在政治层面令人担忧的是,即便 Google-Extended 被拦截,谷歌 AI 概览仍会呈现来自已索引页面的内容,因为它们在查询时即时检索。所以拦截并不能阻止你的内容在 AIO 中被摘要,它只能阻止你的内容被用来训练未来版本的 Gemini。对于 2026 年的大多数中型出版商而言,一个站得住脚的策略是:拦截 GPTBot、ClaudeBot、CCBot 和 Google-Extended。对 PerplexityBot 和 Mistral 收费。允许 Googlebot 和 Bingbot。然后通过 ProRata、Bria 和 Tollbit 引导授权收入,从你无法掌控的 AI 引擎中获取收入。
是你。2025 年 12 月《华盛顿邮报》的 AI 播客事件(虚构引语、把评论当作报纸的社论立场来插入)就是那个警示案例,它把这件事从一个假设变成了出版商董事会层面的问题。对于你自己的系统从你自己的档案中生成的内容,没有第 230 条的保护盾;该 AI 输出会被视为你的编辑工作成果。缓解措施是架构性的,而非合同性的。我们强制执行三道防线:一条严格扎根的系统提示词,禁止使用检索到的文本块之外的任何知识;事后引用验证,丢弃任何其所引来源并不包含该论断的句子;以及一个置信度阈值,在答案触达用户之前把低置信度的答案路由进编辑审核队列。我们还对答案日志做了埋点,让你的标准编辑部能在事情发生后的一小时内审计任何一次会话。这一切在 SaaS 聊天机器人封装里都不存在。
向量 RAG 检索的是与查询在语义上相似的文本块。这对事实查找有效。但它在那些让新闻档案变得有价值的查询上会失败:市长对住房的立场在 12 年间是如何演变的。是谁通过哪些中间组织把人物 X 与丑闻 Z 联系起来的。在校董会争议的报道中反复被引用的来源有哪些。这些都是多跳、纵向和实体驱动的查询。GraphRAG 把档案预处理成一个带类型化关系的实体图谱(人物、组织、地点、事件),然后在查询时遍历该图谱。难点不在于图数据库(Neo4j 或 Amazon Neptune 都能搞定)。难点在于实体消解:把“马斯克先生”“Elon Musk”“特斯拉 CEO”和“X 所有者”归并为同一个节点,并在跨越 25 年的署名和特约记者的拼写错误中区分“市议员约翰·史密斯”与“高中校长约翰·史密斯”。我们采用基于 LLM 的抽取、针对你所属领域调校过的确定性实体消解规则,以及对按文章数排名前 200 的实体的人工审核相结合的方式。这正是别人不会替你做的那一部分。
对话式引擎是一项独立的服务,它消费来自你 CMS 的内容源,并向你的站点反向暴露一个聊天 API。整合模式因技术栈而异。Arc XP 暴露了一个 Content API 和 webhook,但没有嵌入钩子,所以我们运行一个同步任务,每五分钟拉取新增和更新的报道并重新嵌入。WordPress VIP 支持自定义 REST 端点,我们通常将其部署为一个独立的微服务,外加一个用于聊天小部件的 Gutenberg 区块。Brightspot 是最灵活的,得益于其内容类型模型,这让结构化的元数据抽取干净得多。Atypon 出版商(多为学术类)与 Literatum 搜索并存,而非取而代之。在每种情况下,聊天小部件都是一个你的编辑可以放到任何页面上的 JS 嵌入,而后端运行在你的云账户里,而不是我们的。我们不会把你锁定在一个托管服务里。
两者都要,而且它们解决的是不同的问题。2026 年 3 月宣布的 NMA + ProRata 交易是一个集体授权池:2,200 家出版商可以选择加入,针对 RAG 驱动的企业需求进行变现,享受可追溯归因的 50/50 收入分成。Bria 是面向企业内部 AI 使用的并行交易。这些都是泄漏拦截——当一个你并不拥有的 AI 引擎使用你的内容时,它们会向你付费。你自己的对话式引擎则是留存这一打法:它深化与你现有受众的互动,并创造出一个高端档次。ProRata 每次查询付给你的是“极小比例中的极小一份”。而你自己的情报档次(Ask FT 向每位专业用户每年收取 $1K+)是高利润的,并且会随着你档案的价值而复利增长。两者都运行。加入 ProRata 的成本几乎为零(NMA 负责文书工作),而其收入是在你本已进行的工程投入之上的增量。
对于一个干净的、10 万-50 万篇文章、托管在 Arc XP 或 Brightspot 上的档案,一个带混合搜索和基础时序过滤、以引用为依据的聊天小部件可在 14-18 周内交付。带实体消解的 GraphRAG 会再增加 10-14 周。一个智能体式的研究助理档次则在此之上再增加 8-12 周。最长的单一开支项始终是档案摄入,尤其是当你有 2005 年前、带损坏 HTML、缺失图片或来自微缩胶卷数字化项目的扫描 PDF 的内容时。我们会先做一个 2 周的档案审计,然后再报出固定的时间线,因为“从 CMS 导出”与“对一百万张扫描页面做 OCR”之间的工作量差异是 8 比 1。这份审计会给你一个可以拿去给 CFO 的、站得住脚的数字。
支撑这个解决方案页面的交互式白皮书。
完整的架构论述:GraphRAG、Temporal RAG、Agentic RAG、情报即服务的商业模式,以及对 Ask FT 和 Bloomberg Terminal AI 的详细案例研究。
从 2 周的档案审计开始。固定价格,无需承诺整个构建。
我们抽取你内容的 1%,衡量摄入难度,起草你排名前 200 的实体,并给你的 CFO 一个针对整个构建的、站得住脚的数字。如果审计的结论是不要构建,我们会如实告诉你。