电网智能与韧性

电网无法足够快地扩张。 它需要变得更聪明。

PJM 有史以来首次未达其可靠性目标,缺口达 6,625 MW。ERCOT 的并网排队规模触及 233 GW,而新增上线发电仅有 23 GW。伊比利亚大停电在 5 秒内损失 15 GW,原因是无人监测正确的电压层级。

这些并非孤立事件。它们是电网症结的征兆:这些电网原本为单向潮流而设计,如今却要用为上个世纪打造的工具来管理双向、间歇性、数据中心驱动的负荷模式。我们构建 AI 系统,弥合电网所需与其现有软件所能提供之间的鸿沟。

$163B

PJM 容量成本预测,2028-2033 年

NRDC/CUB 分析,2025 年

2,600 GW

美国并网排队积压

劳伦斯伯克利实验室,2025 年

5 秒内 15 GW

在 2025 年伊比利亚大停电中损失

ENTSO-E 最终报告,2026 年 3 月

2025 年 4 月 28 日究竟出了什么问题

伊比利亚大停电是十年来最具启发意义的电网故障。不是因为头条新闻所说的(可再生能源不稳定),而是因为 ENTSO-E 调查的真实发现:一条具体的、本可预防的故障链,而当前的监测架构无法检测到它。

级联失效,逐步剖析

09:00-12:00

西班牙电网出现 0.21 Hz 和 0.63 Hz 的次同步振荡。TSO 在阻尼过程中断开并联电抗器以管理暂态欠压。这耗尽了无功功率吸收能力。

12:00-12:31

TSO 投入并联的 400 kV 线路,并将 HVDC 链路切换为定功率模式。传输阻抗下降,电压上升。400 kV 监测显示 418 kV。仍在额定限值之内。

12:31-12:32

可观测性盲区。 尽管输电侧读数看似正常,但 220 kV 的汇集级变电站已达到 242 kV。变压器有载分接开关无法足够快地调整。无人察觉这一点,因为监测止于输电层级。

12:33:10

一座大型发电设施 本已过压的电网注入无功功率,而非按 P.O. 7.4 的要求加以吸收。正反馈回路形成。级联性保护跳闸开始。5 秒内 15 GW 脱网。6,000 万人断电。

教训不是可再生能源不可靠。ENTSO-E 报告明确否定了这种说法。教训在于:监测架构在汇集级存在盲区,而传统的 PI/PID 控制器无法应对低惯量电网在振荡应力下的非线性动态。

同样的模式适用于美国。PJM 的 6,625 MW 缺口由集中在特定输电区域的数据中心负荷驱动(在 5,250 MW 的预测增量中占 5,100 MW)。多米尼恩弗吉尼亚、AEP 俄亥俄和 ComEd 伊利诺伊的局部应力点,一旦某座关键变电站在用电高峰期跳闸,便会制造出同样的级联失效条件。问题不在于它是否会发生,而在于是否已部署监测,能在其级联之前将其捕获。

还有谁在做这件事

电网 AI 并非一片空白。在聘请咨询公司之前,先了解现有巨头、初创企业和国家实验室已经在做什么,以及哪些空白仍然存在。

供应商 他们提供什么 优势 空白在哪里
GE Vernova(GridOS) 全栈电网管理。ADMS、DERMS、数字孪生。面向配电的 GridOS 于 2026 年 2 月推出。 已部署于 80% 以上的美国公用事业公司。2025 年为 Alabama Power 避免了 1.12 亿客户分钟的供电中断。 传统架构。AI 能力是对现有 SCADA 的附加组件,而非物理原生。供应商锁定使定制开发代价高昂。
西门子(Gridscale X) 电网数字孪生、动态安全评估、DLR 模块。与 NVIDIA PhysicsNeMo 合作实现 10,000 倍仿真加速。 数十年的 PSS/E 电网建模。在欧盟有强势布局。的里雅斯特数字孪生部署。 单体平台。对中型公用事业公司而言成本高昂。DLR 模块比专门的分析工具更为狭窄。
LineVision DLR 传感器与分析。架空线路的非接触式监测。 占主导地位的 DLR 供应商。AES:345 kV 上容量提升 61%。National Grid 锡拉丘兹:提升 20-30%。成本仅为传统升级的 5-7%。 以硬件为核心。在走廊优先级排序和规划集成方面分析能力有限。未涉及排队或稳定性挑战。
Utilidata + NVIDIA Karman:嵌入智能电表的 AI 芯片。面向配电网的边缘计算。 6,030 万美元 C 轮融资。波特兰通用电气和 Duquesne Light 部署。德勤合作。处理能力是传统电表的 100 倍。 以配电为核心。未涉及输电层级的稳定性、并网排队或跨境韧性。
Argonne GridMind 面向控制室操作员的 Agentic AI 副驾驶。用于调度和停电仿真的多智能体 LLM 系统。 DOE 支持(Genesis Mission)。强大的研究公信力。可解释的推荐。 处于研究阶段。并非商业产品。无公用事业部署时间表。物理约束未嵌入 LLM 架构。
EPRI RADAR 面向电网防御、分析与韧性的全球框架。Duke Energy 和 RTE 为创始成员。 全行业倡议。具有标准制定影响力。面向公用事业人员的培训项目。 是框架,不是软件。不构建工具;发布指南。以委员会的速度推进。
四大 / 大型系统集成商 德勤、埃森哲、麦肯锡等。战略咨询、平台实施、供应商选择。 组织变革管理。采购关系。麦肯锡受聘负责 ERCOT 排队流程重新设计。 他们就流程提供建议;他们不构建物理信息模型。单次项目耗资 200 万至 2,000 万美元以上,交付的是战略幻灯片和供应商评估,而非可运行的 AI 系统。
无人能很好解决的诚实空白 单个公用事业公司的遗留数据质量(数十年不一致的 SCADA 档案)。规避风险的控制室对 AI 的组织准备度。漫长的 NERC CIP-013 供应商资格审查周期(6-12 个月,无论供应商是谁)。这些都是平等影响每一家供应商和咨询公司(包括我们)的约束条件。

我们为电网运营商构建什么

每次项目都是定制的。以下是我们有深厚积累的能力领域,而非产品目录。我们与您现有的 SCADA/EMS 供应商协同工作,而非对立。

1

并网排队智能

面向被排队规模淹没的 ISO/RTO。我们构建 NLP 筛查,提取申请参数并利用历史排队数据赋予完成概率评分。基于 GNN 的拓扑聚类按电气邻近度对项目分组,以服务于 FERC Order 2023 的集群研究,而非按到达时间。自动化潮流预筛查针对网络模型运行数千个注入场景。

从先到先得转向先准备好先服务,需要理解电网拓扑的工具,而不仅仅是电子表格。

2

电网韧性分析

物理信息仿真模型,运行 N-1/N-2 故障预想分析的速度比 PSS/E 快若干数量级。我们将摇摆方程和基尔霍夫定律嵌入模型训练,使结果遵循电网物理规律,而不仅仅是学习统计模式。10,000 个故障预想场景在数小时内完成,而非数月。

这些是规划阶段的咨询工具,而非实时控制器。PINN 尚未达到可用于自主电网控制的生产就绪状态,对此我们诚实以告。

3

DLR 优化分析

LineVision 提供传感器。GE Vernova 提供 SCADA。缺失的层是分析:告诉您在何处部署 DLR 才能最大限度释放容量、季节性天气模式如何影响额定窗口,以及如何将动态额定值集成到围绕静态额定值设计的规划工作流中。我们构建这一分析层。

FERC Order 1920 要求在传统建设之前先评估 GET。我们以走廊特定数据提供定量分析,以满足该要求。

4

汇集级可观测性

伊比利亚大停电之所以发生,是因为监测止于输电层级。我们构建边缘分析,对 220 kV 汇集级的次输电电压和无功功率进行监测:这正是 ENTSO-E 所识别出的盲区。异常检测与现有 SCADA 并行运行,而非取而代之。

第一阶段为只读集成。我们消费 SCADA 遥测和状态估计器输出,但不回写控制系统。对现有保护方案零干扰。

5

电网 AI 合规与治理

三条监管时间线正在汇聚:欧盟《AI 法案》高风险符合性评估(2026 年 8 月截止,1,500 万欧元罚款)、NERC CIP-003-9 安全管理(2026 年 4 月),以及 FERC Order 1920 的 GET 评估要求。我们构建满足全部三者的文档、测试协议和审计框架。

大多数运行 AI 进行需求预测或 DER 管理的电网运营商,尚未审计这些系统是否属于欧盟《AI 法案》下的高风险。我们从这里开始。

为什么不找一家更大的公司?

麦肯锡正在重新设计 ERCOT 的排队流程。他们交付流程建议。我们交付在您历史数据上训练的可运行排队筛查模型。德勤与 Utilidata 在电网边缘领域合作。他们的角色是系统集成和变革管理。我们的角色是构建系统集成所环绕的物理信息模型。四大与我们所做的是互补关系,而非竞争关系。他们处理组织准备度和供应商采购。我们构建组织所运行的 AI。

我们如何工作

电网运营商按监管周期进行规划。我们的项目阶段与 ISO 和公用事业公司实际编制预算、审批和部署技术的方式保持一致。

0-6 个月

第一阶段

评估与速赢

  • 数据审计: 梳理现有的 SCADA、IoT 和气象数据源。识别采集频率、档案质量和格式一致性方面的空白。大多数公用事业公司发现,其历史数据的完整度低于预期。
  • DLR 走廊优先级排序: 如果已部署 DLR 传感器,分析哪些走廊能最大限度释放容量。如果尚未部署,则识别 DLR 可推迟既定升级的前 5 条拥堵走廊。
  • 监管基线: 对照欧盟《AI 法案》高风险标准和 NERC CIP-003-9 要求审计现有 AI 系统。产出差距分析和合规路线图。
  • 排队诊断(ISO): 剖析并网排队。识别幽灵负荷模式、集群候选项和快速通道机会。

6-18 个月

第二阶段

构建与集成

  • 排队智能平台(ISO): 部署 NLP 筛查、拓扑聚类和自动化预筛查。对照历史排队结果进行校准。与现有规划工具集成。
  • 故障预想仿真: 构建基于 PINN 的咨询模型,用于 N-1/N-2 分析。对照 PSS/E 基线进行验证。作为规划加速器与现有工具并行部署,而非取代之。
  • 汇集级监测(停电后): 在次输电变电站部署异常检测。通过 IEC 61850 和 ICCP/TASE.2 实现只读 SCADA 集成。
  • NERC CIP-013 套件: 为公用事业安全团队评估准备供应商风险管理文档。计入 6-12 个月的资格审查周期。

18-36 个月

第三阶段

扩展与优化

  • 跨走廊 DLR 分析: 从试点走廊扩展到系统级动态额定值集成。解决相邻公用事业公司对共享走廊给出不同额定值的接缝问题。
  • 咨询性控制建议: 从监测进阶到面向无功功率管理和拥堵缓解的人机协同咨询信号。操作员保留完全的权限。
  • 持续合规: 针对欧盟《AI 法案》符合性的投放后监测。随着标准演进(CIP-015 内部网络安全监测即将到来)持续维护 NERC CIP 文档。

注意:第三阶段的时间线取决于我们无法控制的监管审批流程(FERC、NERC、各州 PUC)。我们按 2-3 年的监管周期规划,而非 6 个月的初创冲刺。

电网 AI 就绪度评估

回答关于您当前电网基础设施和数据成熟度的六个问题。本评估识别您的起点并推荐具体的后续步骤,无论您是否与我们合作。

第 1 题,共 6 题

您的组织类型是什么?

电网运营商常问的问题

AI 如何减少 ISO 和公用事业公司的并网排队积压?

美国并网排队已膨胀至 2,600 GW,达到商业运营的中位等待时间长达五年。瓶颈在于人工工程工时,而非政策。FERC Order 2023 强制要求集群研究,但 ISO 缺乏在 150 天时限内处理集群的人手。

AI 在三个环节加以应对。第一,基于 NLP 的申请筛查从并网申请中提取关键参数(兆瓦、位置、技术类型、开发商财务支持),并基于历史模式赋予完成概率评分。在 ERCOT,233 GW 排队中 77% 为数据中心负荷,此举将可信需求与投机性的幽灵申请区分开来。第二,基于 GNN 的拓扑聚类按电气邻近度和电网影响区域而非到达时间对项目分组,产出与电网实际行为相匹配的研究集群。第三,自动化潮流预筛查针对现有网络模型运行数千个注入场景,以识别哪些项目无需重大升级即可推进。

其结果是从先到先得转向先准备好先服务。作为参考,GridLab 发现,如果 PJM 中排队的可再生能源哪怕只有 10% 及时接入 2026/2027 年度拍卖,消费者在单次容量拍卖中就能节省 35 亿美元。

是什么导致了 2025 年伊比利亚大停电,AI 又如何预防类似的级联失效?

2025 年 4 月 28 日的伊比利亚大停电源于 ENTSO-E 2026 年 3 月最终报告所记录的一条具体故障链。当天上午可再生能源渗透率达 78%,出现了 0.21 Hz 和 0.63 Hz 的次同步振荡。TSO 的应对方式是将并联 400 kV 线路联网,从而抬高了输电电压。关键盲区在于:400 kV 读数看似额定,但 220 kV 的汇集级变电站正经历过压,因为变压器有载分接开关无法足够快地调整。一座大型发电设施在过压期间注入无功功率而非吸收它,形成了正反馈回路。5 秒内,15 GW 脱网,6,000 万人断电。

根本原因是可观测性盲区:TSO 监测的是输电,而非汇集级状况。基于 AI 的汇集级监测实时检测 220 kV 层级的电压偏移,将其与输电层级状态相关联,并在保护继电器级联之前标记出这种背离。这不是自主控制。它是集成到现有 SCADA 系统中的高速异常检测,为操作员提供从数秒到数分钟的预警,而当前的监测架构完全错失了这种预警。

动态线路额定的实施如何运作,现实中能实现多大的容量提升?

动态线路额定以采用实际导线温度、风速、太阳辐射和环境条件的实时热容量计算,取代保守的静态额定值(基于最坏情况的天气假设)。已证实的部署显示出一致的结果:锡拉丘兹的 National Grid 在四条 115 kV 线路上实现了 20-30% 的平均容量提升。印第安纳/俄亥俄的 AES 在 345 kV 线路上实现了 61% 的容量提升,在 69 kV 线路上实现了 25%。Duquesne Light 报告称提升高达 25%。

其经济性令人信服:DLR 的成本仅为传统输电升级的 5-7%,且部署周期以周计而非以年计。AES 案例研究显示,DLR 为 39 万美元,而重新导线为 163 万美元,成本降低 76%。FERC Order 1920 现已要求输电规划者在批准传统建设之前评估包括 DLR 在内的 GET。

挑战不在于传感器技术(LineVision、Ampacimon 等已拥有成熟硬件)。挑战在于分析层:识别哪些走廊能为排队中的发电释放最高容量、为规划研究预测季节性额定窗口、处理相邻公用事业公司对同一走廊给出不同额定值的接缝,以及将 DLR 数据集成到围绕静态额定值设计的现有输电规划工作流中。

物理信息神经网络真的能在电网稳定性分析中取代 PSS/E 吗?

对于生产级控制尚不能,任何声称可以的人都在夸大该技术。PINN 将物理定律(摇摆方程、基尔霍夫定律)嵌入神经网络训练,由此产生的模型遵循电网物理规律,而不仅仅是从数据中学习统计模式。学术基准显示,基于 PINN 的求解器在小型测试系统(IEEE 9 节点、39 节点)上的运行速度比传统数值方法快 80-90 倍。

问题在于扩展性。PJM 拥有 90,000 个以上的母线。损失函数平衡问题(数据保真度 vs. 物理残差 vs. 边界条件)截至 2026 年 4 月仍是一项活跃的研究难题,尚无商业解决方案。相关出版物从 2019 年的不足 10 篇增长到 2025 年的 820 篇,但商业部署为零。

PINN 当今创造价值的领域是规划阶段的咨询性仿真,而非实时控制。在数小时而非数月内运行 10,000 个 N-1/N-2 故障预想场景,能让规划工程师对故障空间获得大幅更好的覆盖。这些模型标记出哪些故障预想值得进行详细的 PSS/E 分析,而非完全取代 PSS/E。我们构建基于 PINN 的咨询工具,加速规划研究和故障预想筛查。我们不构建自主电网控制器,对任何声称自己在做此事的人,我们都持怀疑态度。

对于部署 AI 的电网运营商,欧盟《AI 法案》合规意味着什么?

欧盟《AI 法案》将用作关键基础设施管理(包括电力供应)安全组件的 AI 系统归类为高风险。合规截止日期为 2026 年 8 月 2 日。罚款高达 1,500 万欧元或全球年营业额的 3%。

对于电网运营商,这涵盖用于负荷预测和调度、自动故障检测与隔离、电网管理和实时优化的 AI,以及任何其故障可能对基础设施造成物理损害的系统。高风险归类触发特定要求:部署前的符合性评估、覆盖完整 AI 生命周期的风险管理系统、针对训练和验证数据集的数据治理要求、足以支撑第三方审计的技术文档、确保操作员能够干预的人工监督机制,以及针对性能退化的投放后监测。

在实践中,已经运行 AI 工具进行需求预测或 DER 管理的电网运营商,需要审计这些系统是否属于安全组件。其定义取决于故障或失灵是否可能导致物理损害。一项喂入调度决策的需求预测很可能符合条件。一个客户服务聊天机器人则不符合。大多数电网运营商尚未启动结构化的合规工作。挑战在于,电网 AI 系统往往由研究项目或供应商附加组件演变而来,不具备符合性评估所要求的文档严谨度。

您如何在不拆除现有 GE Vernova 或西门子 SCADA 系统的前提下将 AI 与之集成?

电网运营商在 GE Vernova GridOS、西门子 Spectrum Power 或 ABB SCADA/EMS 系统上有数十年的投资。替换它们不现实,也没有必要。我们构建与现有 SCADA/EMS 并存的 AI 分析层,通过标准协议消费相同的数据馈送(IEC 61850 用于变电站自动化,ICCP/TASE.2 用于控制中心间通信,CIM IEC 61970/61968 用于数据建模)。

第一阶段的集成架构为只读:我们的系统消费 SCADA 遥测和状态估计器输出,但不回写控制系统。这消除了发出控制指令的系统所需承担的认证负担。分析在独立的计算基础设施上运行(云端或本地部署,取决于公用事业公司的 NERC CIP 态势),并通过集成到现有控制室工作流的操作员仪表盘呈现结果。

NERC CIP-013 供应链风险管理流程使供应商资格审查增加 6-12 个月。我们在项目时间线中计入这一点,并提供公用事业安全团队评估所需的文档套件。

一次电网 AI 项目实际花费多少,需要多长时间?

成本取决于范围和公用事业公司的数据成熟度。针对已部署传感器的公用事业公司的 DLR 分析优化项目,通常在 3-6 个月内耗资 20 万至 50 万美元,涵盖走廊优先级排序、季节性额定分析以及与规划工作流的集成。面向 ISO/RTO 的并网排队智能构建规模更大:在 6-12 个月内耗资 50 万至 150 万美元,包括 NLP 筛查模型、拓扑聚类,以及对照 ISO 历史排队数据校准的自动化预筛查工具。

用于停电后韧性的汇集级可观测性系统,根据受监测变电站的数量以及与现有 SCADA 集成的复杂程度,介于 30 万至 80 万美元之间。针对现有 AI 部署的完整电网 AI 合规评估(欧盟《AI 法案》、NERC CIP),在 2-4 个月内耗资 15 万至 40 万美元。

这些是定制构建,而非许可费。每次项目都产出一套公用事业公司自行拥有和运营的系统。作为对比:单次 PJM 容量拍卖耗费纳税人 164 亿美元。推迟一项大型输电工程的 DLR 部署可节省 5,000 万至 5 亿美元。哪怕只将很小比例的可行项目加速推向市场的排队智能,也能在容量采购成本上节省数十亿美元。

技术研究

本解决方案页面背后的研究。这些交互式白皮书就物理信息电网 AI、并网排队分析和停电后韧性工程提供完整的技术深度。

并网瓶颈在单次拍卖中让 PJM 消费者损失 35 亿美元

排队智能、DLR 优化和韧性分析,在第一个规划周期内即可收回成本。

无论您是处理 200+ GW 排队的 ISO、为 FERC Order 1920 合规评估 DLR 的公用事业公司,还是构建停电后韧性的欧洲运营商,我们都能构建您的电网软件无法提供的 AI 系统。

电网 AI 评估

  • • 数据成熟度审计与 SCADA 集成分析
  • • DLR 走廊优先级排序与容量建模
  • • 欧盟《AI 法案》/ NERC CIP 合规差距评估
  • • 并网排队诊断与优化路线图

定制电网 AI 构建

  • • 排队筛查与拓扑聚类平台
  • • PINN 加速的故障预想仿真
  • • 汇集级可观测性与异常检测
  • • 与 GE/西门子/ABB SCADA 的供应商中立集成