算法交易合规
监管机构已不再接受订单日志作为审计证据。在 2024 年 8 月闪崩抹去 1 万亿美元市值、花旗集团因单次算法故障被处以 9200 万美元罚款之后,问题已经从「你是否有控制措施?」转变为「你能否重建算法所做的每一个决策?」我们构建合规情报层,跨 SEC、MiFID II、欧盟人工智能法案和 DORA 回答这个问题——面向那些需要企业级能力、却不想被企业级供应商锁定的公司。
9200 万美元
花旗集团因一次算法控制失败在 3 个司法管辖区被处罚
BaFin + 英国监管机构,2024 年
70%
的银行报告其交易监控的误报率高于 25%
Eventus / Datos Insights 调查
2026 年 8 月 2 日
欧盟人工智能法案高风险金融 AI 合规截止日期
欧盟人工智能法案,第 6 条
一位 FINRA 审查员前来进行你的 Rule 15c3-5 市场准入审查。一位 FCA 监管人员要求查看你的 RTS 6 自我评估。以下是暴露大多数公司问题的过程。
FCA 在 2025 年 8 月对 10 家自营交易公司进行的多公司审查发现,大多数公司的文档不完整或已过时,没有清晰的清单说明谁拥有每个算法、它在哪些市场交易、以及哪些风险参数对其进行管控。一些公司在自我评估中遗漏了整个 RTS 6 要素。如果你无法出具一份现行、完整的生产环境中每个算法的清单——包括其获批市场、头寸限额、以及负责其开发的注册人员(依据 FINRA Rule 16-21)——审查就到此为止。
这正是花旗集团失败案例的教益所在。2022 年 5 月,一名交易员本打算卖出 5800 万美元的股票,却创建了一个 4440 亿美元的篮子。花旗的交易前控制拦截了 2550 亿美元,但有 1890 亿美元到达了交易算法,算法将其拆分为卖单,并在取消前将 14 亿美元推送至欧洲市场。当 BaFin 和英国监管机构展开调查时,问题不仅是「发生了什么」,而是「为什么你的控制措施放过了 1890 亿美元?」花旗能够展示这些订单。但他们无法充分重建执行这些订单的算法的决策链,也无法解释为什么他们的风险阈值被设定在那个水平。这一缺口在三个司法管辖区共耗费了 9200 万美元。
FCA 明确指出「合规部门技术知识参差不齐」是一项系统性弱点。大多数公司的合规团队能够阅读警报报告,却无法质询算法的逻辑、挑战其风险参数,或验证某次代码变更是否引入了新的监管风险敞口。行业的解决办法一直是雇用更多懂量化的合规人员,但这一交叉领域的人才(既懂 CFTC 市场准入规则又懂 GNN 模型架构的人)十分稀缺。另一种选择是:构建能将算法决策转化为审计就绪解释的系统,使合规人员无需阅读源代码即可审查、质询并向审查员陈述。
SEC 和 CFTC 合计创下纪录 253 亿美元 的执法行动金额(2024 年)。FINRA 的 2026 年监督优先事项明确包含算法交易和 AI。欧盟人工智能法案要求高风险金融 AI 系统在 2026 年 8 月前具备技术文档、风险管理系统和人工监督能力。自 2025 年 1 月起,DORA 要求所有欧盟金融实体进行 ICT 韧性测试和事件报告。SEBI 现要求每项策略在上线部署前都须具备唯一的 Algo-ID 并获得交易所批准。问题不在于你的算法是否会被审查,而在于它们能否经受住审查。
交易监控市场预计到 2033 年将达到 42 亿至 93 亿美元。排名前五的供应商占据 55-59% 的市场份额。以下是他们覆盖的内容以及仍存在的缺口。
| 方法 | 它覆盖什么 | 它止步于何处 | 典型成本 |
|---|---|---|---|
| NICE Actimize(X-Sight) | 跨资产监控、基于 ML 的模式检测(幌骗、分层、对敲)、交易前和交易后监测 | 企业级定价和实施复杂度。配置刚性限制了定制化。无算法决策可解释性或多监管合规映射。 | 每年 100 万至 500 万美元以上 |
| Nasdaq Surveillance AI | 生成式 AI 驱动的行为分析、跨场所操纵检测、交易所级吞吐量 | 以交易所为中心的设计。在卖方场景表现强劲,但可能不适合买方合规工作流。聚焦检测,而非聚焦合规工作流。 | 每年 100 万至 300 万美元以上 |
| Eventus(Validus) | 统计行为画像、可配置的检测规则,在高频交易公司场景表现强劲 | 聚焦检测而非整体合规工作流。自定义模型集成有限。生态系统小于一线供应商。 | 每年 50 万至 200 万美元 |
| 自建 | 对逻辑的完全控制、与专有系统的深度集成、无供应商锁定 | 需要与对冲基金薪酬竞争的量化工程人才。持续的维护负担。监管文档常被当作事后才考虑的事项。 | 200 万至 1000 万美元建设费 + 每年 100 万美元以上 |
| 四大 / 大型系统集成商 | 监管咨询、差距评估、方案设计、供应商选型支持 | 他们就该构建什么提供建议,却很少真正构建。项目交付的是 PowerPoint 演示文稿和框架文档,而非可运行的系统。当他们确实构建时,也会转而采用同样的一线供应商平台。50 万至 500 万美元以上的项目。 | 50 万至 500 万美元以上 |
| Veriprajna | 定制合规情报:可解释的算法审计、多司法管辖区映射、智能熔断器、基于 GNN 的传染检测、警报分诊 | 并非监控平台。不取代你现有的检测供应商。不提供市场数据源。要求你的公司拥有可通过 API 访问的基本订单管理和执行数据。 | 30 万至 120 万美元建设费 |
定价基于公开信息和市场研究估算。实际成本因公司规模、范围和供应商谈判而异。
六项能力,填补你的监控供应商与监管机构实际所要求之间的缺口。每一项都针对当前工具留下的一个特定失败模式。
当监管机构指向某笔特定交易并发问「为什么」时,大多数公司展示的是订单日志。我们构建能够重建完整决策链的系统:该时间戳的市场状态、模型特征归因(SHAP 值显示哪些信号驱动了决策以及驱动幅度)、确定性规则评估(检查了哪些阈值)、以及反事实分析(在不同条件下会发生什么)。
在特征归因方面,我们选择 SHAP 而非 LIME,因为 SHAP 提供有理论依据、一致的归因,能够经受住监管审查。当交易与审计之间市场条件发生变化时,LIME 的局部近似可能产生不稳定的解释。
当前的紧急止损开关是二元的:开或关。花旗集团的控制拦截了 2550 亿美元,却放过了 1890 亿美元,因为阈值是一道单一闸门,而非分级系统。我们构建具有四个响应级别的多层熔断器:节流(降低订单速率)、限制(限定到特定金融工具或交易场所)、闸门(每笔订单需人工批准)、以及暂停(完全停止)。
每一层基于行为异常评分触发,而不仅仅是规模阈值。取消率的突然变动与跨资产相关性变化相结合可能触发闸门,而正常参数范围内的单笔大额订单则可通过。
2024 年 8 月闪崩展示了日本央行加息如何通过日元套利交易、经由追加保证金传导至美国科技股。传统监控孤立地看待每个市场。我们使用 GNN 架构构建基于图的系统,对跨资产依赖网络建模,并在级联压力信号演变为系统性风险之前将其检测出来。
研究表明,GNN-LSTM 混合架构在银行间风险传染检测中实现了 0.891 的 AUC-ROC,而传统方法为 0.734,早期预警提前时间延长了 11.5 天(Springer Nature,2025 年)。我们将这些架构改造用于多资产交易环境。
单一算法交易控制必须同时满足 SEC Rule 15c3-5、MiFID II RTS 6、欧盟人工智能法案文档要求、DORA 韧性标准,以及可能的 SEBI Algo-ID 框架。大多数公司为每个司法管辖区维护独立的合规流程。我们构建统一的控制层,其中每个风险参数同时映射到每一项适用的法规。
当你修改交易前资本阈值时,系统会在变更生效前展示其对所有司法管辖区的合规影响。双格式审计追踪从同一底层数据为 FINRA 审查和 FCA/NCA 审查分别生成输出。
70% 的银行报告误报率高于 25%。问题是结构性的:监控系统应用静态阈值而不考虑上下文。做市商例行的下单并撤单模式会触发与实际分层相同的幌骗警报。我们构建跨三个维度的上下文感知评分:交易员行为基线、市场状态调整、以及交叉引用模式分析。
在 2024 年 8 月闪崩期间,运行静态阈值的公司产生了数百个虚假幌骗警报,因为在极端波动下正常算法行为看起来异常。状态感知阈值在保持对隐藏在市场噪音背后的真实操纵的敏感度的同时,防止了这种警报泛滥。
SEBI 现要求在上线部署前具备唯一的 Algo-ID 并获得交易所批准。FINRA 要求对开发算法策略的人员进行注册。FCA 要求完整的 RTS 6 自我评估。我们构建端到端的生命周期管理:从算法开发和测试,到监管批准、部署、监测、变更追踪和退役。
每次代码变更都会对照其合规影响进行版本管理。对交易策略动量信号的修改会触发自动重新评估:哪些监管批准需要更新、哪些风险参数发生变化、以及该修改是否需要根据 FINRA 重新注册或根据 SEBI 申请新的 Algo-ID。
了解当合规情报系统检测到类似于 2024 年 8 月 5 日发生的盘前 VIX 异常时会发生什么。
基于 GNN 的跨资产监测器检测到 VIX 中间报价价格在盘前上涨 180%,但已实现波动率(实际标普 500 价格波动)仅上涨 12%。在 2024 年 8 月 5 日,这种背离是由做市商扩大标普 500 期权的买卖价差所致,机械性地抬高了基于报价计算的 VIX。系统将其标记为 价差驱动的 VIX 异常,而非真正的波动率飙升。
你的波动率目标算法被编程为在隐含波动率上升时降低股票敞口。在正常条件下,180% 的 VIX 飙升会触发大量卖单。熔断器进行检查:这个 VIX 读数是由已实现波动率驱动,还是由价差机制驱动?价差驱动标记触发 节流 响应。算法可以继续交易,但以正常订单速率的 25% 进行,为信号的明朗化争取时间。
传染图追踪该异常的传导路径。USD/JPY 在变动吗?(是,日元走强 2.1%。)日经期货在下跌吗?(是,下跌 6%。)日元走强与科技股抛售之间的相关性是否超过历史分布的第 95 百分位?(是。)系统将警报升级为 检测到套利交易平仓 并加入传导链条:日本央行利率信号、日元升值、对杠杆头寸的追加保证金压力、跨资产类别的相关性抛售。
随着套利交易平仓得到确认,熔断器从节流升级为 闸门:所有相关金融工具(科技股、新兴市场头寸、任何以日元借款融资的标的)的卖单均需人工批准。买单以及不相关金融工具的订单继续以正常速率进行。风险台收到一份结构化警报,包含完整的传导链条、每个信号组成部分的 SHAP 归因、以及三种情景下的预估投资组合影响。
此过程中的每个决策都会连同时间戳、市场状态快照、模型输入、规则评估和响应动作一并记录。当审查员在六个月后到来时,系统会生成一份结构化报告,展示:检测到了什么、为何 VIX 读数被归类为价差驱动、为何响应从节流升级到闸门、以及若不干预算法本会做什么(反事实)。这正是花旗集团调查所缺失的审计追踪。
一个典型的项目从启动到投产历时 4 至 8 个月。三个阶段,每个阶段都有明确的交付物。
4-6 周
交付物:监管差距分析 + 建设路线图
8-16 周
交付物:暂存环境中的可运行系统
4-6 周
交付物:可投产系统 + 监管文档
回答关于你当前算法交易合规态势的八个问题。该评估对照 SEC、MiFID II、欧盟人工智能法案和 DORA 要求识别你的缺口,并产出无论是否与 Veriprajna 合作你都可以采取的可行后续步骤。
核心挑战在于 SEC Rule 15c3-5 与 MiFID II RTS 6 在意图上重叠,但在细节上存在分歧。Rule 15c3-5 要求交易前风险控制(资本阈值、信用额度、错误订单过滤器)并配以年度 CEO 认证。RTS 6 要求算法交易公司将算法决策记录保存五年、向主管当局提交策略说明,并证明合规人员能够在技术层面审查算法流程。
我们构建统一的控制层,其中每项风险控制同时映射到两套框架。例如,一次交易前资本阈值检查即可同时满足 Rule 15c3-5 的市场准入要求和 RTS 6 的风险控制文档要求。系统维护双重审计追踪:一份按 FINRA 审查格式编排,一份用于 FCA/国家主管当局审查。当你修改某个控制参数时,系统会在变更生效前展示其对两个司法管辖区的合规影响。
对于同时受 DORA 监管的公司,我们增加第三个映射层,覆盖 ICT 风险管理和事件报告义务。另一种选择——为每个司法管辖区维护独立的合规流程——是当今大多数公司的运营方式。它一直管用,直到一起跨境事件发生、三家监管机构就同一事件提出不同的问题。
当监管机构追问你的算法为何在波动率飙升期间于上午 9:47 卖出某只特定股票的 20 万股时,他们需要的不仅是显示交易已发生的订单日志。他们需要决策链。
我们的审计系统为任何被标记的交易重建四个层级。第一,市场状态快照:算法在该时间戳收到了哪些数据,包括订单簿深度、价差宽度、波动率读数和跨资产信号。第二,模型归因:哪些特征驱动了决策以及驱动幅度,使用 SHAP 值来显示,例如,卖出信号的 43% 来自 VIX 飙升、31% 来自订单簿失衡、26% 来自跨资产相关性变化。第三,规则评估日志:检查了哪些确定性约束(头寸限额、资本阈值、金融工具限制)以及是否有任何被触发。第四,反事实:在不同条件下算法本会做什么,例如若 VIX 读数低 10%、或若跨资产信号缺失。
这会产出一份合规官可以交给审查员的结构化报告。该重建运行于历史数据之上,因此你可以审计数周或数月前的交易,而不仅仅是实时事件。
70% 的银行报告的 25% 以上误报率源于一个根本性的设计问题:大多数监控系统对单笔交易或模式应用静态阈值而不考虑上下文。如果你只检查订单规模和取消率,大额整笔交易看起来与分层别无二致。
我们构建跨三个维度的上下文感知警报评分。第一,交易员行为基线:系统学习每个交易员的正常模式(金融工具、时点、规模分布、取消率),并标记其偏离自身基线(而非通用阈值)的情况。一个例行下达并取消大额订单的做市商,会产生与做同样事情的投资组合经理不同的警报。第二,市场状态调整:在 2024 年 8 月闪崩这样的高波动期,正常算法行为按静态标准看起来异常。系统根据当前状态(牛市、熊市、危机、低流动性)调整阈值,使波动率驱动的抛售不会产生数百个虚假幌骗警报。第三,交叉引用评分:在升级警报之前,系统会检查该模式是否出现在多个交易场所、交易员是否有可解释该活动的对手方关系、以及类似模式是否在全市场范围内发生(提示由市场状态驱动的行为而非操纵)。
每个警报都会获得一个综合置信度评分。合规团队优先审查高置信度警报,系统则根据哪些警报导向真正的调查而非被驳回,持续优化评分。
欧盟人工智能法案将某些 AI 应用归类为高风险,要求进行合格评定、技术文档、CE 标识,并在欧盟数据库中注册。金融信用评分被明确列为高风险。算法交易 AI 是否符合资格,原预计将在欧盟委员会 2026 年 2 月关于高风险分类的指南中得到澄清。
无论最终分类如何,在交易中使用 AI 的公司在 2026 年 8 月 2 日前都面临三项实际要求。第一,文档:你需要描述 AI 系统目的、架构、训练数据、性能指标和已知局限的技术文档。大多数算法交易公司有代码仓库,但没有该法案所要求的结构化文档。第二,风险管理:你需要一套有文档记录的风险管理系统,在整个 AI 生命周期中识别和缓解风险,包括在与训练数据不同的条件下进行测试——这对于可能在低波动期开发的交易算法极为重要。第三,人工监督:系统必须允许人工干预,包括覆盖或停止 AI 系统的能力。对于交易而言,这意味着有文档记录的紧急止损开关流程、升级路径,以及人工操作员确实能够解读系统正在做什么的证据。
EBA 于 2025 年 11 月发布了一份关于人工智能法案对银行业影响的报告,我们以此作为差距评估的基准。该法案具有全球影响力:如果你的 AI 系统与欧盟用户或市场交互,无论你的公司在何处注册成立,你都在适用范围之内。
一个典型项目从启动到投产历时 4 至 8 个月,取决于范围和你现有基础设施的状态。第一阶段(4 至 6 周)是合规架构评估。我们对照你运营所在的每个司法管辖区审计你当前的算法交易控制、梳理你现有的监控工具及其缺口、审查你的算法清单和文档状态,并识别哪些监管截止日期最为紧迫。此阶段产出一份差距报告和一份优先级排序的建设计划。
第二阶段(8 至 16 周)是系统建设。我们在你现有的基础设施内工作,不取代你的 OMS 或监控供应商,而是构建位于二者之间的合规情报层。这包括可解释性流水线(决策链重建、SHAP 归因)、多司法管辖区控制映射,以及警报分诊系统。与现有数据源(订单管理、市场数据、执行记录)的集成通常是耗时最长的单项任务。
第三阶段(4 至 6 周)是验证与监管对齐。我们针对历史数据运行系统、对照实际的监管审查格式验证审计输出、对照你的误报基线调校警报阈值,并将所有内容记录至欧盟人工智能法案和 RTS 6 标准。
一个注意事项:如果你的算法清单文档不完善(FCA 在其审查的大多数公司中都发现了这一点),请增加 3 至 4 周用于在任何合规系统得以在其上构建之前必须进行的发现和编目工作。
它与你现有的供应商并行工作。替换一个企业级监控平台是一个耗时数年、耗资数百万美元的项目,除非该平台从根本上已损坏,否则大多数公司不应着手进行。
我们构建的内容填补你当前供应商未覆盖的缺口。NICE Actimize、Eventus 和 Nasdaq Surveillance 擅长基于模式的检测:幌骗、分层、对敲、抢先交易。它们扫描订单流以寻找已知的操纵特征并生成警报。它们通常缺少的是三样东西。第一,算法决策可解释性:当监管机构追问你的算法为何做某事时,你的监控供应商能展示交易已发生以及它是否匹配某个操纵模式,但无法说明算法为何做出那个决策。我们构建的可解释性层从你算法自身的逻辑、模型特征和市场状态重建决策链。第二,跨监管合规映射:你的监控供应商检测市场滥用,但它不会将你的算法交易控制同时映射到 SEC Rule 15c3-5 要求、MiFID II RTS 6 自我评估标准、欧盟人工智能法案文档义务和 DORA 韧性标准。该映射正是我们所构建的。第三,智能熔断器:你的供应商在交易执行后生成警报。我们构建的熔断器系统在执行前或执行期间根据偏离的严重程度和模式以分级响应进行干预。
集成通常通过你供应商的 API 或警报源进行。我们将它们的警报作为更广泛合规图景的一项输入加以消费,在它们已检测到的内容之上增加上下文、交叉引用和可解释性。
支撑这个解决方案页面的技术基础。
对 2024 年 8 月闪崩机制、基于 GNN 的市场拓扑建模、以及用于算法交易环境中确定性控制的神经符号架构的分析。
花旗集团为一次算法控制失败支付了 9200 万美元。Two Sigma 为模型治理不充分支付了 9000 万美元。
你的算法正在运行。你的监管机构正在注视。问题在于:在审查员发问之前,你能否在你运营所在的每一个司法管辖区解释你系统所做的每一个决策。