一张编辑意象图:一家老牌媒体机构因AI生成的虚假身份而崩塌——一本杂志封面正溶解为一个个杜撰的作者简介。
Artificial IntelligenceTechnologyMachine Learning

《体育画报》的问题不是AI,而是真相架构——LLM包装器为何注定崩塌

Ashutosh SinghalAshutosh Singhal2026年2月7日14 min

我清楚地记得那一刻——我停止阅读,开始来回踱步。

那是2023年11月下旬,Futurism刚刚发表了针对《体育画报》(Sports Illustrated)的调查。那些细节荒诞得几乎不像真的:一家拥有70年历史的媒体机构一直在发布由根本不存在的人撰写的产品测评。“Drew Ortiz”,一个被描述为热爱户外活动的人,其头像购自一个出售AI生成人脸的市场。“Sora Tanaka”,一位所谓的健身达人,则有一段关于她热爱美食美饮的杜撰身世。归到这些幽灵名下的内容包含诸如“排球是世界上最受欢迎的运动之一,这是有充分理由的”这样的“金句”——一句空洞到几乎能听见回声的话。

我踱步并不是因为我感到震惊。我踱步是因为几个月来我一直在向企业客户警告的,正是这种失败模式。不是那种抽象的、《终结者》式的“AI很危险”,而是一种非常具体、非常可预测的架构性崩塌。《体育画报》并不是因为使用AI而被抓个正着。它被抓,是因为它使用AI时底层没有一套真相系统。而这个区别,比大多数人意识到的要重要得多。

后果来得又快又狠。Arena Group的股价在一天之内暴跌27%。Authentic Brands Group吊销了SI的出版许可。SI工会报告称,可能全体员工都被裁掉了。一个曾报道过穆罕默德·阿里、“冰上奇迹”以及数十年美国体育历史的新闻编辑室被掏空了——不是因为AI取代了记者,而是因为管理层选择了成本最低的AI架构,还把它当成了一项战略。

那种架构有一个名字。我们称之为“LLM包装器”(LLM Wrapper)。在花了数年时间构建其替代方案之后,我坚信它是当今企业信任面临的最大单一威胁。

“LLM包装器”究竟是什么——它为什么会崩坏?

当我向非技术背景的高管解释这一点时,我会用一个类比。想象你聘请了世界上最能言善辩的演讲者——一个能就任何话题、以任何风格、面向任何听众侃侃而谈的人。很厉害,对吧?现在再想象,这位演讲者没有记忆,没有事实核查部门,而且有一种病态的、说不出“我不知道”的毛病。相反,每当他遇到自己知识的空白时,他就……直接编造。信心十足。流利顺畅。用完美的措辞。

这就是一个没有落地依据(grounding)的大语言模型。它是一个概率推理引擎——它根据训练数据中的模式来预测下一个最有可能出现的词。它并不“知道”Drew Ortiz并不存在。它知道产品测评这种模式通常包含一个作者姓名和简介,于是它就用统计上看似合理的细节填补这个模板。对模型而言,“Drew Ortiz”不是谎言。它是一次成功的模式补全。

所谓LLM包装器,就是当一家公司把这位口若悬河、爱编故事的演讲者请上台,却只给他一支麦克风和一份关键词清单时所得到的东西。没有讲稿。侧幕里没有编辑。没有人核查从他嘴里说出的东西是否属实。围绕模型的那层软件非常单薄——它传入一个提示词,取回一段文本,然后就发布出去。仅此而已。

AdVon Commerce,就是SI那些虚假内容背后的第三方供应商,运作方式正是如此。他们有一个内部工具叫“MEL”——本质上就是一个包装器,它摄入产品关键词,把它们喂进一个基础模型,然后吐出结构化的测评。那些“人类写手”拿着微薄的报酬,把输出复制粘贴到内容管理系统里。他们并没有做编辑。他们并没有做事实核查。他们是人肉中间件。

当AI是引擎、而人类只是润滑油时,质量崩塌就不是一种风险了——它是一张时间表。

我意识到“够用就好”的AI并不够用的那个夜晚

有那么一个夜晚——我想大概是2024年初,SI事件曝出的几周之后——我和我的团队正在为一位客户对一条内容生成流水线做压力测试。我们搭建了一套标准的检索增强生成(RAG)系统,也就是被认为是“负责任地”部署LLM的那种方式。你检索出相关文档,把它们注入模型的上下文窗口,然后告诉它只能使用这些来源。

我们跑了一批500条产品描述。结果看起来很干净。流畅。专业。我的首席工程师已经准备收工了。

我说:“再把幻觉检查跑一遍。”

他叹了口气。但他还是跑了。

这500条描述中,有18条包含了任何来源文档里都没有的说法。这是3.6%的错误率——正落在研究显示的最先进模型的区间内,这些模型的幻觉率视领域不同在1.5%到6.4%之间。在法律等专业领域,情况还要更糟。

18条听起来不算多。但把它按规模放大。如果你是一家一年要推出10000篇文章的出版方——而内容农场绝对是按这个体量运作的——4%的幻觉率意味着有400篇文章包含捏造的说法。四百起潜在的诉讼、声誉危机,或者摧毁信任的时刻。我们已经见过律师因引用ChatGPT凭空捏造的、根本不存在的法庭案例而受到处分。数学不站在你这边。

那天晚上,我告诉团队:“我们不会交付任何仅仅依靠概率运作的东西。我们需要一套系统,它对待未经验证的说法,要像数据库对待空值(null)一样——把它视为知识的缺失,而不是即兴发挥的邀请。”

为什么不能靠更好的提示词来解决幻觉问题?

人们总是这样问我。“你就不能告诉模型更谨慎些吗?加一段系统提示词,说‘不要编造东西’?”

不行。而这个问题恰恰暴露了对这项技术的一个根本性误解,原因如下。

幻觉不是一个你可以用指令打补丁修复的缺陷。它是这些模型工作方式的一种结构性属性。LLM存储的是从训练数据中提取出的、词元(token,即单词和子词)之间的统计关系。它没有内部的事实数据库。它没有“真”与“假”的概念。它有的是“可能”与“不可能”的概念。当一个模式的可能补全需要一个模型并不具备的事实时,它就生成一个契合这个模式的事实。告诉它“不要产生幻觉”,就像告诉水“不要湿”一样。

还有上下文窗口的问题。即便是拥有超大上下文窗口的现代模型,当你试图把整个企业知识库喂给它们时,也会撞上一堵墙。你没法把公司完整的编辑规范、产品数据库、作者名录和品牌政策粘贴进每一条提示词里。于是模型内部的知识——静态的、过时的、不可控的——就来填补这些空白。

此外还有一个安全维度,那些“直接用GPT”的人群里几乎无人谈及。提示词注入攻击可以操纵输入以绕过安全过滤器。数据投毒可以污染RAG系统所检索的网络来源。一种叫做“slopsquatting”的新威胁利用了LLM会幻想出软件包名称这一事实——攻击者注册那些虚假的包名,向那些复制粘贴代码建议的开发者投递恶意软件。一个单薄包装器的攻击面是巨大的。

我曾在我们研究的交互式版本中深入探讨过这些架构性失败模式,但核心观点很简单:你无法靠提示词工程走到真相。你需要的是一套完全不同的架构。

那场改变了我们构建方式的争论

关于这一点,我们在Veriprajna内部有过一场真正的争吵。不是彬彬有礼的分歧——而是一场货真价实的争论,那种人们会提高嗓门、最后总有人说出“我们能不能先退一步冷静一下?”的争论。

我团队里的一派——都是聪明人、经验丰富的工程师——主张我们应该把重心放在把RAG做得更好上。更精妙的检索。更好的分块策略。经过微调的嵌入模型。走渐进路线。“RAG在96%的情况下已经够用了,”他们说。“我们把最后那4%优化掉就行。”

另一派——我坚定地站在这一派——则主张“够用”对企业信任而言就是一纸死刑判决。那4%并不是随机分布在无害的错别字上。它恰恰聚集在最要紧的那些说法周围:姓名、数字、日期、因果关系。这些东西一旦错了,就会摧毁公信力。

转折点出现在团队里有人把SI的时间线画到白板上的时候。2023年11月:Futurism发表调查。Arena Group股价暴跌27%。虚假的个人资料被悄悄删除——一个被新闻伦理学教授称为“一种撒谎形式”的举动。当AdVon的前员工证实是“MEL”生成了那些内容时,“第三方免责”的说辞随之崩塌。Authentic Brands Group吊销了许可。员工被裁。一家70年历史的机构被掏空。

“那,”我指着白板说,“就是4%在规模化之后的样子。”

那一天,我们不再争论对RAG做渐进式改进的事了。我们开始构建某种根本上不同的东西。

一套无法撒谎的系统,实际上是什么样子的?

一张并排的架构对比图,展示了单薄的“LLM包装器”架构(提示词进→文本出,没有验证)与神经符号架构(LLM+知识图谱+验证层)的对比,让结构上的差异一目了然。

答案就是AI研究界所称的神经符号AI(Neuro-Symbolic AI)——一种融合了两种截然不同智能的混合架构。

把它想象成两套协同工作的大脑系统。神经部分——即LLM——负责处理语言。它擅长解析杂乱的文本、理解细微差别、生成流畅的文句。它是你的直觉引擎。但它与真相没有任何关系。

符号部分——即知识图谱(Knowledge Graph)——负责处理事实。它把现实存储为结构化的关系:由谓词连接起来的实体。Wilson AVP → is_certified_by → FIVBJane Smith → is_author_of → Article_4521。这些不是概率。它们是确定性的断言。当你查询一个知识图谱、而答案不在其中时,你得到的是null(空)。不是一次富有创意的即兴发挥。是沉默。

在SI这个案例里,一套神经符号系统本会用LLM来撰写测评——它确实很擅长这件事——但会依靠知识图谱来验证作者。如果图谱中不包含一个针对“Drew Ortiz”的、已验证的实体,系统就会拦下这个署名。就这么干脆。本体(ontology)——即支配图谱的结构性规则——将强制要求一篇产品测评必须与一位已验证的作者相连接。从而让那起虚假署名丑闻在架构上根本不可能发生。

知识图谱不会为了填补沉默而“发明”一位作者。它把知识的缺失就当作知识的缺失来对待。仅这一条属性,就是一道抵御幻觉的防火墙。

这种性能差异是可衡量的。研究表明,将知识图谱整合进生成流水线,与传统RAG相比,可将幻觉减少6%,并将词元用量削减80%。在医疗领域,神经符号系统在提取临床数据时达到了100%的精确率,而单独使用GPT-4的精确率为63%到95%。模型无需在充满噪声的文档里艰难跋涉——它消费的是精确、已验证的三元组。

构建人工新闻编辑室

一张流程图,展示了多智能体编辑流水线——研究员、写作者和评判者智能体各自不同的权限与数据流向,其中包括反思反馈回路。

有意思的地方就在这里——也正是在这里,《体育画报》的故事不再只是一则警世寓言,而成了一份设计规格说明。

SI所缺的并不是AI能力。它缺的是编辑架构。一个真正的新闻编辑室有搜集事实的研究员、编织叙事的写作者、核查说法的编辑,还有一位统筹整个工作流的执行主编。AdVon的“MEL”工具把所有这些角色统统坍缩进一条提示词里。一个模型包办一切。没有制衡。没有平衡。没有问责。

我们把整条编辑链重建为一套多智能体系统。不是一个AI包办一切,而是拥有不同角色、并且——这一点至关重要——拥有不同权限的专职智能体。

研究员智能体可以访问知识图谱和受信任的外部API。它唯一的工作就是搜集已验证的事实。它产出的是结构化数据,而不是文句。写作者智能体接过这些事实,起草叙事。关键在于,它无法访问外部工具或网络。它无法幻想出新的“事实”,因为它触及不到研究员所提供内容之外的任何东西。评判者智能体以对抗性的方式审阅草稿——对照知识图谱核查每一条说法,标记出没有依据的断言,评估语气和逻辑。

然后还有反思回路。大多数包装器架构会直接采用AI产出的第一稿。我们不这样。我们的评判者会向写作者发问:“重新审视你之前的答案。你引用来源了吗?是否存在逻辑漏洞?你有没有编造任何东西?”写作者会生成一段自我批评,然后利用这段批评来产出一份更好的草稿。研究证实,这种“自我精炼”(Self-Refine)方法能将复杂任务上的表现提升20%以上,并显著减少幻觉。

其结果是这样一套系统:最终输出中的每一句话,都能追溯回知识图谱中的某个节点,或某一份具体的来源文档。点一下某条说法,就能看到它的数据来源。这不是一个功能——这就是全部的意义所在。

关于这套架构的完整技术拆解,包括GraphRAG流水线以及评判者-执行者(Critic-Actor)验证模型,请参阅我们详尽的研究论文

“可这不就是在拖慢AI吗?”

我常从那些被“速度叙事”说服的投资人和企业领导者那里听到这条异议。AI本应该是快的。验证听起来像是一种摩擦。

我的回答是:在丑闻发酵的那一整年里,Arena Group的股价损失了80%的市值。员工被解雇。品牌许可被吊销。你再跟我说一遍,“快”是怎么帮他们省钱的。

没有验证的速度不是效率。它是一场被推迟的灾难。问题不在于你是否负担得起一套真相架构的额外开销。问题在于,你是否负担得起没有它所带来的责任风险。

信息经济学里有一个概念叫“柠檬市场”(次品市场)——当买家无法把优质品和劣质品区分开来时,他们就会假定一切都是劣质品,从而不再愿意为溢价买单。这正是当下数字内容正在遭遇的事。当一个像《体育画报》这样受信任的品牌被抓到捏造真人时,它就坐实了那种愤世嫉俗的假设:所有网络内容都可能是假的。整个生态系统随之贬值。高质量的新闻报道变得和内容农场的垃圾内容再也无从分辨。

如果你在LLM包装器之上构建,你就是在沙地上盖楼。你今天赢得的速度,就是你明天失去的信任。

那些能挺过这一劫的企业,不是生成内容最快的那些。而是其内容带有一条可验证的监管链的那些——从源数据到知识图谱,再到生成文本,直至人工审批。那条链,就是新的竞争护城河。

SI的崩塌实际上证明了什么

我常常想起SI的那些记者。正如他们的工会所说的,那些“并肩奋斗,只为维持这份传奇刊物之标准”的人。他们并不是被AI取代了。他们是被一个架构决策献祭了——管理层选择了对一项技术尽可能廉价的实现方式,而这项技术若部署得当,本可以放大他们的工作,而不是抹除他们的岗位。

这正是人们在把这件事框定为“AI对抗人类”时所错失的悲剧。这从来都不是AI对抗人类。它是懒惰的AI架构对抗机构信任。是AI失败了吗?不,AI没有失败。是架构失败了。是治理失败了。是那个把验证当作可选项来对待的决定失败了。

《体育画报》丑闻证明了一件我早有怀疑、却直到亲眼看着它上演才能干净利落地道出的事:在AI时代,一家企业的价值,与它验证自身系统所产出内容的能力直接成正比。不是产量。不是速度。而是可验证性。

每一位读到这篇文章的企业领导者,此刻都正在部署AI,或者正在计划部署。问题不在于是否要用它——那艘船早已启航。问题在于,你的架构是把真相当作一种结构性约束,还是当作一件事后才想起的补丁。在于你的系统能否解释它为什么生成了它所生成的东西。在于当有人问“这是谁写的,它是真的吗?”时,你手里有没有一个不是“呃,模型说是这样”的答案。

Drew Ortiz并不存在。但他造成的损害却非常真实。下一个Drew Ortiz此刻正在某个地方被生成着,由一个没有任何机制去阻止它的包装器架构生成着。唯一的问题是,它是不是正在你的平台上被生成。

Related Research

Also Published On