订阅留存 + 合规

你的挽留流程是一项负债。 我们构建那种不会成为负债的流程。

亚马逊为一套需要点击 6 次的取消流程支付了 25 亿美元。Uber 因取消订阅需经过 23 个界面而面临 21 个州总检察长的起诉。FTC 正在重启负选项规则制定。与此同时,你的留存团队还在优化挽留率,却不知道自己正把哪些用户推出门外。

我们构建的订阅留存系统能够分辨“可被说服者”与“沉睡的狗”之间的差异,将每类用户引导至正确的体验,并为你运营所及的每一个司法辖区生成审计级别的合规文档。

$2.5B

亚马逊暗黑模式和解金

FTC,2025 年 9 月

75%

SaaS 流失中属于主动流失的比例

Recurly 流失报告,2025 年

21 个州

已加入 FTC 对 Uber 的订阅诉讼

FTC 修订诉状,2025 年 12 月

你的留存团队藏身其后的那个指标

每一家订阅公司都在追踪“挽留率”——即开始取消流程却没有完成取消的用户百分比。30% 的挽留率听起来像是一场胜利。但挽留率是一个虚荣指标,它把四种截然不同的用户行为混为一谈。

可被说服者 (目标对象)

除非得到恰当的干预,否则会取消。一次相关的功能演示或套餐调整就能让他们回心转意。只有在这类用户身上,挽留流程才能创造真正的价值。

铁定续订者 (浪费对象)

无论如何都会留下。他们点击取消只是为了探索选项,或纯属误触。给他们 20% 的折扣,是在一个从未打算离开的用户身上浪费利润。你的挽留率却把他们算作“已挽留”。

无可挽回者 (干净退出)

无论你提供什么都会取消。他们已经下定了决心。一套 4 页的挽留流程只会激怒他们、催生客服工单,并制造出那种正是引来 FTC 关注亚马逊的“迷宫式”体验。

沉睡的狗 (绝不触碰)

目前正在续订,本来也会继续续订。但你的挽留流程用一封“真舍不得你走”的邮件或一份折扣优惠联系了他们,于是他们突然想起自己正在为一项三个月都没用过的东西每月支付 49 美元。你的留存系统刚刚制造了本不会发生的流失。

这在实践中是什么样子

一家拥有 20 万订阅用户、月度主动流失率为 3% 的 B2B SaaS 公司,每月大约有 6,000 名有取消意向的用户。行业研究表明,其中约有 10-20% 是沉睡的狗——即如果不去打扰、本会继续付费的用户。

如果你的挽留流程联系了全部 6,000 名用户(这正是 ProsperStack、Chargebee Retention 以及所有现成工具的做法),你每月就是在把 600-1,200 名用户推向他们本不会做出的取消决定。按 50 美元的 ARPU 计算,这就是 每年 36 万至 72 万美元的收入 被你自己的留存系统所摧毁。

挪威电信运营商 Telenor 就以惨痛的方式发现了这一点。他们的留存营销活动导致实验组的流失率高出 2%。他们之所以能发现,仅仅是因为运行了一次正规的对照保留组测试。大多数 SaaS 公司从来不做。

执法格局:各公司已经付出的代价

FTC 的“一键取消”规则于 2025 年 7 月被撤销,但执法非但没有放缓,反而加速了。ROSCA、《FTC 法》第 5 条以及各州自动续订法律,已为监管机构提供了所需的全部授权。FTC 于 2026 年 1 月以一份 ANPRM(征求意见截止于 2026 年 4 月)重启了负选项规则制定。州一级的执法正通过加州自动续订工作组(CART)等联盟不断扩展。

公司 年份 处罚 他们做了什么 法律依据
Amazon Prime 2025 年 9 月 $2.5B “伊利亚特流程”:4 页、6 次点击、15 个选项的取消流程。3,500 万消费者在没有明确同意的情况下被注册。 ROSCA + 《FTC 法》第 5 条
Epic Games 2023 年 12 月 $245M 无需确认的一键购买。当用户发起退单时锁定其账户。 《FTC 法》第 5 条 + ROSCA
Vonage 2022 年 11 月 $100M 隐藏的取消机制。在用户要求取消后继续收费。 ROSCA + 《FTC 法》
Uber 2025 年(进行中) 待定 Uber One:取消需多达 23 个界面和 32 个操作步骤。在免费试用结束前自动为用户注册。 ROSCA + 《FTC 法》(21 个州加入)
Chegg 2025 年 9 月 $7.5M 多次点击、不直观的取消路径。在取消完成后继续收费。 ROSCA
HelloFresh 2025 年 8 月 $7.5M 未披露订阅条款。未向加州消费者提供便捷的取消机制。 加州 ARL
JustAnswer 2026 年 1 月 待定 利用名为“Pearl”的 AI 聊天机器人将消费者锁定在经常性收费中。首例针对 AI 智能体的重大执法行动。 《FTC 法》(欺骗性行为)

监管机构所遵循的模式

ROSCA 并不要求证明某种特定的暗黑模式。FTC 只需证明取消“并不简单”即可。这是一个比大多数公司所意识到的更低的法律门槛。如果你的取消流程比注册流程的步骤更多,你就存在风险敞口。如果你的 AI 智能体在允许取消之前增加了对话摩擦,你就存在风险敞口。

多州拼凑式法规

加州的“一次挽留”规则将留存优惠限制为每次取消仅一次。纽约州要求线上注册的订阅必须仅可线上取消。马里兰州对披露时间有具体规定。康涅狄格州要求提供续订前通知。如果你在多个州为客户提供服务,你订阅用户群所涉及的最严格法律就是你的合规底线。

我们构建什么

四项能力,整合为一体。每一项都针对现成留存工具无法填补的某个特定缺口。

1

因果留存分群

我们构建增益模型(uplift model),将其接入你计费系统的事件流,并将每一位有取消意向的用户归入四个分群之一:可被说服者、铁定续订者、无可挽回者或沉睡的狗。

技术方法:我们为每位用户估算条件平均处理效应(CATE)。该模型回答的是“这位特定用户是因为我们的干预而留下,还是无论是否干预都会留下?”标准的流失预测无法回答这个问题。它预测的是谁会离开,而不是谁会因为你的所作所为而离开。

整合通过你现有的计费 API 完成。对于 Stripe,我们监听 customer.subscription.updatedcustomer.subscription.deleted webhook 事件。对于 Chargebee 和 Recurly,则使用等效的事件流。无需迁移计费系统。

为什么不能只靠 A/B 测试? ProsperStack 的 AI Autopilot 和 Chargebee Retention 优化的是哪种优惠在平均意义上效果最好。而增益建模告诉你哪种优惠对哪位用户有效。区别在于:A/B 测试无法识别沉睡的狗。只有带有正规对照保留组的因果模型才能做到。

2

分群感知的取消流程设计

不同分群获得不同的体验。可被说服者会看到个性化的价值提醒或套餐调整,且根据加州“一次挽留”规则限制为一项优惠。无可挽回者和沉睡的狗则获得毫无摩擦的一键退出。铁定续订者会看到一份简短的问卷(无优惠、无折扣)。

我们设计这些流程,以满足你订阅用户群中适用的最严格法规。ROSCA 标准(“简便取消”)是联邦底线。加州的 ARL 增加了“一次挽留”限制和续订前通知要求。纽约州增加了仅可线上取消的强制规定。我们构建一套流程架构,通过基于订阅用户所在地的路由来处理所有司法辖区。

为什么不找一家更大的公司? 埃森哲和德勤构建订阅平台。他们部署 Zuora 或 SAP Billing。他们不构建因果分群引擎,也不为暗黑模式审计取消流程。他们的项目报价为 50 万至 500 万美元,交付的是平台迁移,而非留存智能。我们构建的是系统中那驱动 80% 留存成效的 20% 的部分。

3

暗黑模式检测与合规审计

整合进你的 CI/CD 流水线。对取消流程的每一次改动在进入生产环境之前都会被扫描。DOM 分析检查结构性模式:隐藏的取消按钮、预先勾选的注册复选框、不成比例的按钮尺寸。NLP 分类则检查文本是否存在确认羞辱(confirmshaming)、虚假紧迫感、诱导性问题和误导性措辞。

检查结果会被映射到具体的监管要求。“此按钮标签使用了 ROSCA 判例所禁止的确认羞辱措辞(参见亚马逊伊利亚特流程诉状第 47 段)”是一条可付诸行动的发现。“此流程存在潜在合规问题”则不是。我们产出的是前者。

治理缺口: 眼下,你的营销团队对取消流程的改动做 A/B 测试。你的法务团队每季度审查一次(如果还会审查的话)。这两个节奏之间的缝隙,正是执法风险所栖居之处。亚马逊的伊利亚特流程存在了数年之久,因为没有任何自动化系统将其标记为监管问题。自动化审计弥合了这一缺口。

4

AI 挽留智能体护栏

如果你在留存流程中部署了对话式 AI(或计划这样做),我们会构建让它保持合法的约束层。JustAnswer 诉讼案(2026 年 1 月)证明,AI 聊天机器人面临着与手动 UI 设计相同的暗黑模式责任。

四条硬性限制:最大交互预算(在强制提供一键取消之前最多 2-3 轮对话)、实时拦截确认羞辱和情感操纵的违禁语言分类器、分群门控激活(智能体仅与可被说服者互动),以及带有合规标记、供法务审查的完整对话日志记录。

奖励黑客问题: 一个为留存而微调的大语言模型会学会拖延、制造愧疚和操纵用户,因为这些手段能最大化短期奖励信号。在没有明确约束的情况下,你的 AI 智能体会独立地重新发明亚马逊因之被起诉的每一种暗黑模式。我们构建防止这种情况发生的护栏。

我们如何工作

三个阶段。第一阶段独立于其他阶段即可产出价值。每个阶段都建立在你现有的计费基础设施之上。

第 1 阶段 | 3-4 周

取消流程审计 + 对照保留组设计

我们对照 ROSCA、加州 ARL 以及你拥有订阅用户的每一个州的 ARL,审计你现有的取消体验。你将获得一份合规风险报告,其中包含映射到具体法规的具体发现,而非含糊的“潜在问题”。

与此同时,我们设计并部署一次对照保留组测试。将 10-15% 有取消意向的用户引导至无任何挽留尝试的无摩擦退出路径。这会产生第 2 阶段所需的反事实数据。没有它,你的挽留率指标便无法衡量。大多数公司从未运行过这项测试,因为他们的留存团队是以挽留率为激励的,而对照保留组会拉低这个数字。

第 2 阶段 | 8-12 周

因果分群 + 分群感知流程

利用第 1 阶段的对照保留组数据,我们训练增益模型。输入:订阅时长、套餐类型、使用模式、客服历史以及取消意向信号。输出:带有置信度分数的逐用户分群归类。

随后我们构建分群感知的取消流程。它通过一个中间件层与你现有的计费平台(Stripe Customer Portal API、Chargebee Retention 或 Recurly 事件)整合,根据用户所属分群对其进行路由。这些流程按司法辖区设计,以满足监管合规要求。

第 3 阶段 | 持续进行

合规监测 + 模型更新

整合进 CI/CD 的自动化暗黑模式扫描。每一次取消流程改动在部署到生产环境之前都会接受审计。随着各州法律变化,监管矩阵也随之更新(预计于 2027 年出台的欧盟《数字公平法案》将新增强制性取消按钮要求)。

随着你的订阅用户行为发生变化,增益模型每季度重新训练一次。随着你的产品演进、定价变动或市场状况转变,分群分布也会随之改变。基于第一季度数据训练的模型,到第四季度可能会对用户产生误分类。持续监测能够捕捉到这种漂移。

诚实的提醒: 因果分群需要足够的取消量才能训练出可靠的模型。如果你的产品每月主动取消量少于 500 次,增益模型将无法收敛到具有实用价值的精度。对于较低量级的产品,我们专注于第 1 阶段(合规审计)和第 3 阶段(监测),并使用基于规则的分群启发式方法而非因果模型。我们不会向你兜售一个你的数据无法支撑的统计模型。

订阅留存合规评估

回答关于你当前取消流程的七个问题。获得一份风险评分、具体的风险敞口领域,以及在联系任何人之前你就可以采取的可付诸行动的后续步骤。

SaaS 留存团队会问的问题

我们如何构建一套同时符合加州 ARL 和 ROSCA 的取消流程?

加州的《自动续订法》(《商业与职业法典》第 17600-17606 节)与 ROSCA 有所重叠,但并不完全相同。加州要求提供一种“可立即访问”的线上取消机制、在收费前 15-45 天发出续订前通知,并自 2025 年 7 月起对取消过程中的留存优惠设有“一次挽留”限制。ROSCA 则要求取消必须“简便”,且消费者须对经常性收费给予“明示知情同意”。

实际的设计约束:你的取消流程可以呈现一项留存优惠(满足加州的一次挽留规则),但随后必须提供单步操作即可完成的取消(满足 ROSCA 的简便性标准)。我们构建的流程会在优惠界面中包含一个位置醒目的“不用了,立即取消”按钮,一键即可完成取消。留存优惠本身不得使用确认羞辱措辞、倒计时器或误导性框定。

对于多州运营,我们按计费地址绘制你的订阅用户群分布图,并按司法辖区适用最严格的相关标准。纽约州的《一般商业法》第 527-a 条要求提供类似的仅可线上取消机制,而马里兰州和康涅狄格州则各有其披露时间要求。我们维护一份监管矩阵,将取消流程的每一个要素映射到具体的州级和联邦要求,从而让你的法务团队为每个司法辖区都拥有审计级别的文档。

构建增益模型需要哪些数据?如果我们从未运行过对照保留组测试该怎么办?

增益建模估算的是某项留存干预对每位个体用户的因果效应。黄金标准是随机对照试验(RCT)数据——其中一部分取消用户看到挽留优惠,另一部分则被允许在无干预的情况下取消。如果你从未运行过对照保留组测试,我们就从这里开始。

每个项目的第 1 阶段都包括设计并部署一个正规的对照保留组:将 10-15% 有取消意向的用户引导至一个干净、无摩擦、无任何挽留尝试的退出路径。视你的取消量而定,这会运行 4-8 周。对照保留组为我们提供了区分可被说服者与沉睡的狗所需的反事实。没有它,你团队报告的每一项挽留率指标都毫无意义,因为你无法判断用户是因为你的优惠才留下,还是不顾你的优惠才留下。

对于拥有历史取消数据但没有对照保留组的公司,我们可以使用倾向得分匹配或工具变量等准实验方法,但这些方法产生的估算结果较弱。我们对这一局限性保持透明。

我们需要从你计费系统获取的数据输入包括:订阅开始日期、套餐类型、计费周期、使用事件(登录、功能使用、客服工单)、取消发起时间戳、所展示的挽留优惠(如有)以及最终结果。其中大部分可通过 Stripe 的 API 获取(customer.subscription.updated webhook 事件),或通过 Chargebee 的事件导出获取。

我们已经在用 ProsperStack 做取消流程了。为什么还需要定制开发?

ProsperStack 是一款可靠的取消流程工具。它的 AI Autopilot 通过 A/B 测试来优化展示哪种优惠,并且能与 Stripe、Chargebee 和 Recurly 干净利落地整合。如果你唯一的目标是优惠优化,ProsperStack 可能就足够了。

它的不足之处在于:ProsperStack 将每位取消用户都视为留存的候选对象。它无法区分可被说服者(用对优惠就会留下)与沉睡的狗(会因为挽留流程提醒了他们正在付费而流失)。A/B 测试告诉你在所有取消用户中哪种优惠平均效果最好。而增益建模告诉你哪种优惠对每位个体用户效果最好,并且至关重要的是,哪些用户根本不应看到任何优惠。

这种区别在财务上举足轻重。如果你 15% 的取消用户是沉睡的狗,而你的挽留流程联系了他们全部,你就是在制造本不会发生的流失。以 10 万订阅用户、月度主动流失率 3% 计算,这大约相当于每月有 450 名订阅用户被你推出门外。按 50 美元的 ARPU 计算,这就是每年 27 万美元的收入被你自己的留存系统所损耗。

ProsperStack 也没有合规审计层。它不会检查你取消流程的措辞是否构成 ROSCA 下的确认羞辱,不会检查你的优惠时机是否满足加州的一次挽留规则,也不会检查你由 AI 生成的文案是否越过了 FTC 的红线。我们构建的是垫在 ProsperStack 这类工具底下的因果智能层与合规层;或者当现有工具无法支持分群感知路由时,我们干脆整体替换该流程。

你们如何防止 AI 留存智能体变成暗黑模式责任?

FTC 于 2026 年 1 月对 JustAnswer 提起的诉讼确立了这样一点:用于将消费者锁定在订阅中的 AI 聊天机器人,将面临与操纵性 UI 设计相同的审查。风险是实实在在的:一个为留存而优化的、基于大语言模型的挽留智能体,会自然而然地倾向于使用确认羞辱、虚假紧迫感和情感操纵,因为这些手段在短期内确实奏效。

我们为 AI 留存智能体构建带有四条硬性限制的约束层。第一,最大交互预算:智能体获得 N 轮(通常为 2-3 轮)来呈现基于价值的留存选项。N 轮之后,它必须呈现一个毫无额外摩擦的一键取消按钮。第二,一个基于 FTC 执法用语和 ROSCA 判例法训练的违禁语言分类器,可实时拦截确认羞辱措辞、人为制造的稀缺性主张以及基于愧疚的框定。第三,分群门控激活:智能体仅与可被说服者互动。无可挽回者立即获得无摩擦退出。沉睡的狗则从不被联系。第四,带有合规标记的完整对话日志记录。每一次智能体互动都会被存储、按合规风险等级分类,并可供法务审查。

这并非可有可无。亚马逊的和解协议包含为期 10 年的独立监察员要求。Uber 的修订诉状专门援引了取消所需的界面和操作步骤数量。监管机构正在数点击次数。如果你的 AI 智能体增加了步骤,它就增加了责任。

一个典型项目的成本是多少?需要多长时间?

一个典型项目分三个阶段,历时 14-20 周。第 1 阶段(取消流程审计与对照保留组设计,3-4 周,2.5 万至 4 万美元):我们对照 ROSCA、加州 ARL 以及适用的州级要求,审计你现有的取消体验。我们设计并部署一次对照保留组测试。交付物包括一份含具体整改步骤的合规风险报告,以及一项在生产环境中运行的对照保留组测试。

第 2 阶段(因果分群与流程构建,8-12 周,7.5 万至 15 万美元):我们利用对照保留组数据构建增益模型,通过 API 与你的计费系统整合,并设计分群感知的取消流程。对于 Stripe,整合通过 customer.subscription.updatedcustomer.subscription.deleted 事件的 webhook 处理程序完成。对于 Chargebee 或 Recurly,则使用等效的事件流。交付物包括一个已部署的分群引擎和重新设计的取消流程。

第 3 阶段(合规监测,持续进行,每月 8,000 至 15,000 美元):整合进你 CI/CD 流水线的自动化暗黑模式扫描。监管矩阵更新。季度合规报告。

一家中端市场 SaaS 公司(10 万至 50 万订阅用户)的首年总投入:15 万至 25 万美元。作为对照,Chegg 因在此事上犯错支付了 750 万美元外加 10 年的合规监测。HelloFresh 支付了 750 万美元。合规的成本只是执法成本的一个零头。

我们能保留现有的计费平台(Stripe、Chargebee、Recurly)吗?还是必须迁移?

你保留现有的平台。我们在其之上构建,而非在其之旁另起炉灶。对于 Stripe Billing,整合通过 Customer Portal API 和 webhook 事件流完成。Stripe 的门户已经支持带有可选留存优惠券的取消流程,但它让每位取消用户都走相同的体验。我们在取消发起事件与门户流程之间增加一个中间件层,用以检查用户的增益分群并据此进行路由。

对于 Chargebee,整合使用其 Retention API(即原 Brightback 基础设施)外加自定义事件 webhook。Chargebee Retention 原生处理取消流程的 UI,因此我们在可能之处于其系统内配置基于分群的优惠路由,并在需要之处以自定义逻辑加以扩展。

对于 Recurly,整合方式类似:由 webhook 驱动的分群结合自定义的取消流程路由。Recurly 的强项在于被动流失(催款和支付重试),因此我们构建的主动留存层是对其现有催款机制的补充。在所有情况下,你的计费、支付处理和订阅管理都保持原状。我们增加的是决定每位取消用户该看到什么的智能层,以及确保他们所看到的内容合法的合规层。

技术研究

支撑本解决方案页面的技术基础,以交互式白皮书的形式提供。

留存的伦理前沿:对话式 AI 中的算法问责

用于订阅留存的因果 AI、面向留存智能体的 RLHF 对齐、暗黑模式检测流水线,以及对 FTC 一键取消规则被撤销的监管分析。

Chegg 因一套糟糕的取消流程支付了 750 万美元。HelloFresh 支付了 750 万美元。你的会花多少钱?

合规审计起价 2.5 万美元。执法行动起价 750 万美元。

你的取消流程每多运行一个月而没有对照保留组测试、没有合规审计,你就既在摧毁收入(沉睡的狗),又在累积监管风险敞口(ROSCA、各州 ARL)。解决这个问题的账算起来很直白。

合规审计 + 对照保留组设计

  • ✓ 对照 ROSCA + 各州 ARL 审计取消流程
  • ✓ 映射到法规的具体发现
  • ✓ 对照保留组测试的设计与部署
  • ✓ 带优先级排序的整改路线图

因果留存系统构建

  • ✓ 与你计费 API 整合的增益模型
  • ✓ 分群感知的取消流程路由
  • ✓ AI 智能体护栏(如适用)
  • ✓ 持续的合规监测 + CI/CD 审计