电网智能与韧性
PJM 有史以来首次未达其可靠性目标,缺口达 6,625 MW。ERCOT 的并网排队规模触及 233 GW,而新增上线发电仅有 23 GW。伊比利亚大停电在 5 秒内损失 15 GW,原因是无人监测正确的电压层级。
这些并非孤立事件。它们是电网症结的征兆:这些电网原本为单向潮流而设计,如今却要用为上个世纪打造的工具来管理双向、间歇性、数据中心驱动的负荷模式。我们构建 AI 系统,弥合电网所需与其现有软件所能提供之间的鸿沟。
$163B
PJM 容量成本预测,2028-2033 年
NRDC/CUB 分析,2025 年
2,600 GW
美国并网排队积压
劳伦斯伯克利实验室,2025 年
5 秒内 15 GW
在 2025 年伊比利亚大停电中损失
ENTSO-E 最终报告,2026 年 3 月
伊比利亚大停电是十年来最具启发意义的电网故障。不是因为头条新闻所说的(可再生能源不稳定),而是因为 ENTSO-E 调查的真实发现:一条具体的、本可预防的故障链,而当前的监测架构无法检测到它。
西班牙电网出现 0.21 Hz 和 0.63 Hz 的次同步振荡。TSO 在阻尼过程中断开并联电抗器以管理暂态欠压。这耗尽了无功功率吸收能力。
TSO 投入并联的 400 kV 线路,并将 HVDC 链路切换为定功率模式。传输阻抗下降,电压上升。400 kV 监测显示 418 kV。仍在额定限值之内。
可观测性盲区。 尽管输电侧读数看似正常,但 220 kV 的汇集级变电站已达到 242 kV。变压器有载分接开关无法足够快地调整。无人察觉这一点,因为监测止于输电层级。
一座大型发电设施 向 本已过压的电网注入无功功率,而非按 P.O. 7.4 的要求加以吸收。正反馈回路形成。级联性保护跳闸开始。5 秒内 15 GW 脱网。6,000 万人断电。
教训不是可再生能源不可靠。ENTSO-E 报告明确否定了这种说法。教训在于:监测架构在汇集级存在盲区,而传统的 PI/PID 控制器无法应对低惯量电网在振荡应力下的非线性动态。
同样的模式适用于美国。PJM 的 6,625 MW 缺口由集中在特定输电区域的数据中心负荷驱动(在 5,250 MW 的预测增量中占 5,100 MW)。多米尼恩弗吉尼亚、AEP 俄亥俄和 ComEd 伊利诺伊的局部应力点,一旦某座关键变电站在用电高峰期跳闸,便会制造出同样的级联失效条件。问题不在于它是否会发生,而在于是否已部署监测,能在其级联之前将其捕获。
电网 AI 并非一片空白。在聘请咨询公司之前,先了解现有巨头、初创企业和国家实验室已经在做什么,以及哪些空白仍然存在。
| 供应商 | 他们提供什么 | 优势 | 空白在哪里 |
|---|---|---|---|
| GE Vernova(GridOS) | 全栈电网管理。ADMS、DERMS、数字孪生。面向配电的 GridOS 于 2026 年 2 月推出。 | 已部署于 80% 以上的美国公用事业公司。2025 年为 Alabama Power 避免了 1.12 亿客户分钟的供电中断。 | 传统架构。AI 能力是对现有 SCADA 的附加组件,而非物理原生。供应商锁定使定制开发代价高昂。 |
| 西门子(Gridscale X) | 电网数字孪生、动态安全评估、DLR 模块。与 NVIDIA PhysicsNeMo 合作实现 10,000 倍仿真加速。 | 数十年的 PSS/E 电网建模。在欧盟有强势布局。的里雅斯特数字孪生部署。 | 单体平台。对中型公用事业公司而言成本高昂。DLR 模块比专门的分析工具更为狭窄。 |
| LineVision | DLR 传感器与分析。架空线路的非接触式监测。 | 占主导地位的 DLR 供应商。AES:345 kV 上容量提升 61%。National Grid 锡拉丘兹:提升 20-30%。成本仅为传统升级的 5-7%。 | 以硬件为核心。在走廊优先级排序和规划集成方面分析能力有限。未涉及排队或稳定性挑战。 |
| Utilidata + NVIDIA | Karman:嵌入智能电表的 AI 芯片。面向配电网的边缘计算。 | 6,030 万美元 C 轮融资。波特兰通用电气和 Duquesne Light 部署。德勤合作。处理能力是传统电表的 100 倍。 | 以配电为核心。未涉及输电层级的稳定性、并网排队或跨境韧性。 |
| Argonne GridMind | 面向控制室操作员的 Agentic AI 副驾驶。用于调度和停电仿真的多智能体 LLM 系统。 | DOE 支持(Genesis Mission)。强大的研究公信力。可解释的推荐。 | 处于研究阶段。并非商业产品。无公用事业部署时间表。物理约束未嵌入 LLM 架构。 |
| EPRI RADAR | 面向电网防御、分析与韧性的全球框架。Duke Energy 和 RTE 为创始成员。 | 全行业倡议。具有标准制定影响力。面向公用事业人员的培训项目。 | 是框架,不是软件。不构建工具;发布指南。以委员会的速度推进。 |
| 四大 / 大型系统集成商 | 德勤、埃森哲、麦肯锡等。战略咨询、平台实施、供应商选择。 | 组织变革管理。采购关系。麦肯锡受聘负责 ERCOT 排队流程重新设计。 | 他们就流程提供建议;他们不构建物理信息模型。单次项目耗资 200 万至 2,000 万美元以上,交付的是战略幻灯片和供应商评估,而非可运行的 AI 系统。 |
| 无人能很好解决的诚实空白 | 单个公用事业公司的遗留数据质量(数十年不一致的 SCADA 档案)。规避风险的控制室对 AI 的组织准备度。漫长的 NERC CIP-013 供应商资格审查周期(6-12 个月,无论供应商是谁)。这些都是平等影响每一家供应商和咨询公司(包括我们)的约束条件。 | ||
每次项目都是定制的。以下是我们有深厚积累的能力领域,而非产品目录。我们与您现有的 SCADA/EMS 供应商协同工作,而非对立。
面向被排队规模淹没的 ISO/RTO。我们构建 NLP 筛查,提取申请参数并利用历史排队数据赋予完成概率评分。基于 GNN 的拓扑聚类按电气邻近度对项目分组,以服务于 FERC Order 2023 的集群研究,而非按到达时间。自动化潮流预筛查针对网络模型运行数千个注入场景。
从先到先得转向先准备好先服务,需要理解电网拓扑的工具,而不仅仅是电子表格。
物理信息仿真模型,运行 N-1/N-2 故障预想分析的速度比 PSS/E 快若干数量级。我们将摇摆方程和基尔霍夫定律嵌入模型训练,使结果遵循电网物理规律,而不仅仅是学习统计模式。10,000 个故障预想场景在数小时内完成,而非数月。
这些是规划阶段的咨询工具,而非实时控制器。PINN 尚未达到可用于自主电网控制的生产就绪状态,对此我们诚实以告。
LineVision 提供传感器。GE Vernova 提供 SCADA。缺失的层是分析:告诉您在何处部署 DLR 才能最大限度释放容量、季节性天气模式如何影响额定窗口,以及如何将动态额定值集成到围绕静态额定值设计的规划工作流中。我们构建这一分析层。
FERC Order 1920 要求在传统建设之前先评估 GET。我们以走廊特定数据提供定量分析,以满足该要求。
伊比利亚大停电之所以发生,是因为监测止于输电层级。我们构建边缘分析,对 220 kV 汇集级的次输电电压和无功功率进行监测:这正是 ENTSO-E 所识别出的盲区。异常检测与现有 SCADA 并行运行,而非取而代之。
第一阶段为只读集成。我们消费 SCADA 遥测和状态估计器输出,但不回写控制系统。对现有保护方案零干扰。
三条监管时间线正在汇聚:欧盟《AI 法案》高风险符合性评估(2026 年 8 月截止,1,500 万欧元罚款)、NERC CIP-003-9 安全管理(2026 年 4 月),以及 FERC Order 1920 的 GET 评估要求。我们构建满足全部三者的文档、测试协议和审计框架。
大多数运行 AI 进行需求预测或 DER 管理的电网运营商,尚未审计这些系统是否属于欧盟《AI 法案》下的高风险。我们从这里开始。
麦肯锡正在重新设计 ERCOT 的排队流程。他们交付流程建议。我们交付在您历史数据上训练的可运行排队筛查模型。德勤与 Utilidata 在电网边缘领域合作。他们的角色是系统集成和变革管理。我们的角色是构建系统集成所环绕的物理信息模型。四大与我们所做的是互补关系,而非竞争关系。他们处理组织准备度和供应商采购。我们构建组织所运行的 AI。
电网运营商按监管周期进行规划。我们的项目阶段与 ISO 和公用事业公司实际编制预算、审批和部署技术的方式保持一致。
0-6 个月
第一阶段
6-18 个月
第二阶段
18-36 个月
第三阶段
注意:第三阶段的时间线取决于我们无法控制的监管审批流程(FERC、NERC、各州 PUC)。我们按 2-3 年的监管周期规划,而非 6 个月的初创冲刺。
回答关于您当前电网基础设施和数据成熟度的六个问题。本评估识别您的起点并推荐具体的后续步骤,无论您是否与我们合作。
第 1 题,共 6 题
美国并网排队已膨胀至 2,600 GW,达到商业运营的中位等待时间长达五年。瓶颈在于人工工程工时,而非政策。FERC Order 2023 强制要求集群研究,但 ISO 缺乏在 150 天时限内处理集群的人手。
AI 在三个环节加以应对。第一,基于 NLP 的申请筛查从并网申请中提取关键参数(兆瓦、位置、技术类型、开发商财务支持),并基于历史模式赋予完成概率评分。在 ERCOT,233 GW 排队中 77% 为数据中心负荷,此举将可信需求与投机性的幽灵申请区分开来。第二,基于 GNN 的拓扑聚类按电气邻近度和电网影响区域而非到达时间对项目分组,产出与电网实际行为相匹配的研究集群。第三,自动化潮流预筛查针对现有网络模型运行数千个注入场景,以识别哪些项目无需重大升级即可推进。
其结果是从先到先得转向先准备好先服务。作为参考,GridLab 发现,如果 PJM 中排队的可再生能源哪怕只有 10% 及时接入 2026/2027 年度拍卖,消费者在单次容量拍卖中就能节省 35 亿美元。
2025 年 4 月 28 日的伊比利亚大停电源于 ENTSO-E 2026 年 3 月最终报告所记录的一条具体故障链。当天上午可再生能源渗透率达 78%,出现了 0.21 Hz 和 0.63 Hz 的次同步振荡。TSO 的应对方式是将并联 400 kV 线路联网,从而抬高了输电电压。关键盲区在于:400 kV 读数看似额定,但 220 kV 的汇集级变电站正经历过压,因为变压器有载分接开关无法足够快地调整。一座大型发电设施在过压期间注入无功功率而非吸收它,形成了正反馈回路。5 秒内,15 GW 脱网,6,000 万人断电。
根本原因是可观测性盲区:TSO 监测的是输电,而非汇集级状况。基于 AI 的汇集级监测实时检测 220 kV 层级的电压偏移,将其与输电层级状态相关联,并在保护继电器级联之前标记出这种背离。这不是自主控制。它是集成到现有 SCADA 系统中的高速异常检测,为操作员提供从数秒到数分钟的预警,而当前的监测架构完全错失了这种预警。
动态线路额定以采用实际导线温度、风速、太阳辐射和环境条件的实时热容量计算,取代保守的静态额定值(基于最坏情况的天气假设)。已证实的部署显示出一致的结果:锡拉丘兹的 National Grid 在四条 115 kV 线路上实现了 20-30% 的平均容量提升。印第安纳/俄亥俄的 AES 在 345 kV 线路上实现了 61% 的容量提升,在 69 kV 线路上实现了 25%。Duquesne Light 报告称提升高达 25%。
其经济性令人信服:DLR 的成本仅为传统输电升级的 5-7%,且部署周期以周计而非以年计。AES 案例研究显示,DLR 为 39 万美元,而重新导线为 163 万美元,成本降低 76%。FERC Order 1920 现已要求输电规划者在批准传统建设之前评估包括 DLR 在内的 GET。
挑战不在于传感器技术(LineVision、Ampacimon 等已拥有成熟硬件)。挑战在于分析层:识别哪些走廊能为排队中的发电释放最高容量、为规划研究预测季节性额定窗口、处理相邻公用事业公司对同一走廊给出不同额定值的接缝,以及将 DLR 数据集成到围绕静态额定值设计的现有输电规划工作流中。
对于生产级控制尚不能,任何声称可以的人都在夸大该技术。PINN 将物理定律(摇摆方程、基尔霍夫定律)嵌入神经网络训练,由此产生的模型遵循电网物理规律,而不仅仅是从数据中学习统计模式。学术基准显示,基于 PINN 的求解器在小型测试系统(IEEE 9 节点、39 节点)上的运行速度比传统数值方法快 80-90 倍。
问题在于扩展性。PJM 拥有 90,000 个以上的母线。损失函数平衡问题(数据保真度 vs. 物理残差 vs. 边界条件)截至 2026 年 4 月仍是一项活跃的研究难题,尚无商业解决方案。相关出版物从 2019 年的不足 10 篇增长到 2025 年的 820 篇,但商业部署为零。
PINN 当今创造价值的领域是规划阶段的咨询性仿真,而非实时控制。在数小时而非数月内运行 10,000 个 N-1/N-2 故障预想场景,能让规划工程师对故障空间获得大幅更好的覆盖。这些模型标记出哪些故障预想值得进行详细的 PSS/E 分析,而非完全取代 PSS/E。我们构建基于 PINN 的咨询工具,加速规划研究和故障预想筛查。我们不构建自主电网控制器,对任何声称自己在做此事的人,我们都持怀疑态度。
欧盟《AI 法案》将用作关键基础设施管理(包括电力供应)安全组件的 AI 系统归类为高风险。合规截止日期为 2026 年 8 月 2 日。罚款高达 1,500 万欧元或全球年营业额的 3%。
对于电网运营商,这涵盖用于负荷预测和调度、自动故障检测与隔离、电网管理和实时优化的 AI,以及任何其故障可能对基础设施造成物理损害的系统。高风险归类触发特定要求:部署前的符合性评估、覆盖完整 AI 生命周期的风险管理系统、针对训练和验证数据集的数据治理要求、足以支撑第三方审计的技术文档、确保操作员能够干预的人工监督机制,以及针对性能退化的投放后监测。
在实践中,已经运行 AI 工具进行需求预测或 DER 管理的电网运营商,需要审计这些系统是否属于安全组件。其定义取决于故障或失灵是否可能导致物理损害。一项喂入调度决策的需求预测很可能符合条件。一个客户服务聊天机器人则不符合。大多数电网运营商尚未启动结构化的合规工作。挑战在于,电网 AI 系统往往由研究项目或供应商附加组件演变而来,不具备符合性评估所要求的文档严谨度。
电网运营商在 GE Vernova GridOS、西门子 Spectrum Power 或 ABB SCADA/EMS 系统上有数十年的投资。替换它们不现实,也没有必要。我们构建与现有 SCADA/EMS 并存的 AI 分析层,通过标准协议消费相同的数据馈送(IEC 61850 用于变电站自动化,ICCP/TASE.2 用于控制中心间通信,CIM IEC 61970/61968 用于数据建模)。
第一阶段的集成架构为只读:我们的系统消费 SCADA 遥测和状态估计器输出,但不回写控制系统。这消除了发出控制指令的系统所需承担的认证负担。分析在独立的计算基础设施上运行(云端或本地部署,取决于公用事业公司的 NERC CIP 态势),并通过集成到现有控制室工作流的操作员仪表盘呈现结果。
NERC CIP-013 供应链风险管理流程使供应商资格审查增加 6-12 个月。我们在项目时间线中计入这一点,并提供公用事业安全团队评估所需的文档套件。
成本取决于范围和公用事业公司的数据成熟度。针对已部署传感器的公用事业公司的 DLR 分析优化项目,通常在 3-6 个月内耗资 20 万至 50 万美元,涵盖走廊优先级排序、季节性额定分析以及与规划工作流的集成。面向 ISO/RTO 的并网排队智能构建规模更大:在 6-12 个月内耗资 50 万至 150 万美元,包括 NLP 筛查模型、拓扑聚类,以及对照 ISO 历史排队数据校准的自动化预筛查工具。
用于停电后韧性的汇集级可观测性系统,根据受监测变电站的数量以及与现有 SCADA 集成的复杂程度,介于 30 万至 80 万美元之间。针对现有 AI 部署的完整电网 AI 合规评估(欧盟《AI 法案》、NERC CIP),在 2-4 个月内耗资 15 万至 40 万美元。
这些是定制构建,而非许可费。每次项目都产出一套公用事业公司自行拥有和运营的系统。作为对比:单次 PJM 容量拍卖耗费纳税人 164 亿美元。推迟一项大型输电工程的 DLR 部署可节省 5,000 万至 5 亿美元。哪怕只将很小比例的可行项目加速推向市场的排队智能,也能在容量采购成本上节省数十亿美元。
本解决方案页面背后的研究。这些交互式白皮书就物理信息电网 AI、并网排队分析和停电后韧性工程提供完整的技术深度。
面向美国容量危机的物理信息神经网络、基于 GNN 的拓扑分析和 DLR 优化。涵盖 PJM 的 6.6 GW 缺口、ERCOT 的 233 GW 排队,以及 FERC Order 2023 集群研究强制要求。
对 2025 年 4 月 28 日级联失效的停电后分析、汇集级可观测性盲区、无功功率强制执行,以及在欧洲电网运营中采用物理约束 AI 的论证。
排队智能、DLR 优化和韧性分析,在第一个规划周期内即可收回成本。
无论您是处理 200+ GW 排队的 ISO、为 FERC Order 1920 合规评估 DLR 的公用事业公司,还是构建停电后韧性的欧洲运营商,我们都能构建您的电网软件无法提供的 AI 系统。