Wide-Area Power System Oscillations from Large-Scale AI Workloads

📄 arXiv: 2508.16457v1 📥 PDF

作者: Min-Seung Ko, Hao Zhu

分类: eess.SY

发布日期: 2025-08-22


💡 一句话要点

提出动态电力剖析方法以解决AI负载引发的电网振荡问题

🎯 匹配领域: 支柱四:生成式动作 (Generative Motion)

关键词: 电力系统 AI负载 动态电力剖析 电网振荡 GPU计算 数据中心 模拟实验

📋 核心要点

  1. 现有方法未能充分考虑大规模AI工作负载对电网振荡的影响,导致电网稳定性风险增加。
  2. 论文提出了一种动态电力剖析方法,能够有效建模AI数据中心负载并分析其对电网的影响。
  3. 通过WECC 179-bus系统的模拟实验,发现特定因素如波动频率和数据中心规模显著影响振荡幅度。

📝 摘要(中文)

本文开发了一种新的动态电力剖析方法,用于建模以AI为中心的数据中心负载,并分析其对电网运行的影响,特别是引发广域电网振荡的潜力。我们表征了大规模AI工作负载在训练和微调阶段固有的周期性随机功率波动,这些波动由先进的GPU计算架构驱动。这些持续的大功率波动不同于传统负载的逐步增加,作为持久的强迫输入,能够与局部和区域间振荡模式相互作用并放大。以WECC 179-bus系统为测试案例,我们考察了不同因素下振荡响应的幅度和变异性,包括系统强度、渗透水平、波动频率范围、单个数据中心规模和地理部署。模拟结果表明,较窄的波动带、更大的单站容量或分散的选址可能会加剧多种模式下的振荡。

🔬 方法详解

问题定义:本文旨在解决大规模AI工作负载对电网稳定性造成的影响,现有方法未能充分捕捉这些负载的动态特性,导致电网振荡风险增加。

核心思路:提出了一种动态电力剖析方法,通过建模AI负载的周期性随机功率波动,分析其对电网振荡的影响,旨在为电网规划和运营提供量化依据。

技术框架:整体架构包括数据中心负载建模、功率波动特征提取、振荡响应分析和模拟实验四个主要模块。首先对AI负载进行建模,然后提取其功率波动特征,接着分析这些波动对电网振荡的影响,最后通过模拟验证结果。

关键创新:最重要的创新点在于首次将AI工作负载的动态特性与电网振荡研究相结合,揭示了AI负载对电网稳定性的潜在影响,填补了现有研究的空白。

关键设计:在模型设计中,重点考虑了功率波动的频率范围、数据中心的规模和地理分布等因素,采用了适应性损失函数来优化模型性能。

📊 实验亮点

实验结果显示,较窄的功率波动带和更大的单站容量会显著加剧电网振荡,尤其是在多种振荡模式下。模拟中,某些配置下的振荡幅度提升幅度超过30%,为电网管理提供了重要的量化依据。

🎯 应用场景

该研究的潜在应用领域包括电力系统规划、智能电网设计和数据中心运营管理。通过更好地理解AI负载对电网的影响,可以制定更有效的电网运营策略,确保电网的稳定性和可靠性,支持未来AI技术的持续发展。

📄 摘要(原文)

This paper develops a new dynamic power profiling approach for modeling AI-centric datacenter loads and analyzing their impact on grid operations, particularly their potential to induce wide-area grid oscillations. We characterize the periodic stochastic power fluctuations inherent to large-scale AI workloads during both the training and fine-tuning stages, driven by the state-of-the-art GPU computing architecture designs. These sustained, large power fluctuations, unlike conventional load ramping, act as persistent forcing inputs capable of interacting with and amplifying local and inter-area oscillation modes. Using the WECC 179-bus system as a test case, we examine the amplitude and variability of oscillatory responses under different factors, ranging from system strength, penetration level, fluctuation frequency range, individual datacenter size, to geographical deployment. Simulation results show that, notably, narrower fluctuation bands, larger single-site capacities, or dispersed siting can intensify oscillations across multiple modes. Our models and numerical studies provide a quantitative basis for integrating AI-dominant electricity demands into grid oscillation studies, and further support the development of new planning and operational measures to power the continuous AI load growth.