ChronoGraph: A Real-World Graph-Based Multivariate Time Series Dataset
作者: Adrian Catalin Lutu, Ioana Pintilie, Elena Burceanu, Andrei Manolache
分类: cs.LG, cs.AI
发布日期: 2025-09-04 (更新: 2025-11-27)
备注: Accepted as an oral presentation at the NeurIPS 2025 Workshop on Recent Advances in Time Series Foundation Models (BERT2S)
💡 一句话要点
ChronoGraph:一个基于真实微服务依赖图的多变量时间序列数据集,用于预测和异常检测。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多变量时间序列 图神经网络 微服务架构 异常检测 服务依赖图
📋 核心要点
- 现有时间序列数据集缺乏真实微服务架构的复杂性,难以有效评估结构感知预测和异常检测方法。
- ChronoGraph通过构建基于真实微服务依赖图的多变量时间序列数据集,提供了一个更贴近实际应用场景的基准。
- 该数据集包含专家标注的异常事件,能够评估预测模型在运营中断期间的鲁棒性,并为异常检测算法提供有效标签。
📝 摘要(中文)
本文介绍ChronoGraph,一个图结构化的多变量时间序列预测数据集,它构建于真实的生产微服务环境。每个节点代表一个服务,该服务产生包含CPU、内存和网络使用模式等系统级性能指标的多变量数据流;有向边则编码了服务之间的依赖关系。主要任务是预测服务级别上这些信号的未来值。此外,ChronoGraph还提供了专家标注的事件窗口作为异常标签,从而能够评估异常检测方法,并评估预测在运营中断期间的鲁棒性。与来自工业控制系统或交通和空气质量领域的现有基准相比,ChronoGraph独特地结合了(i)多变量时间序列,(ii)显式的、机器可读的依赖图,以及(iii)与真实事件对齐的异常标签。我们报告了涵盖预测模型、预训练时间序列基础模型和标准异常检测器的基线结果。ChronoGraph为研究微服务系统中的结构感知预测和事件感知评估提供了一个真实的基准。
🔬 方法详解
问题定义:现有的时间序列预测和异常检测基准数据集通常来自工业控制系统、交通或空气质量领域,缺乏对真实微服务架构复杂性的建模能力。这些数据集忽略了服务之间的依赖关系,并且缺乏与真实事件相关的异常标签,导致模型难以在实际微服务环境中有效应用。因此,需要一个能够反映真实微服务系统特点,包含服务依赖关系和异常事件信息的数据集,以促进结构感知预测和事件感知评估方法的研究。
核心思路:ChronoGraph的核心思路是构建一个基于真实生产微服务系统的数据集,其中每个服务作为一个节点,节点间的有向边表示服务之间的依赖关系。每个节点产生多变量时间序列数据,包含CPU、内存和网络使用情况等系统级性能指标。此外,数据集还包含专家标注的异常事件窗口,作为异常标签,用于评估异常检测方法的性能和预测模型的鲁棒性。
技术框架:ChronoGraph数据集的构建流程主要包括以下几个步骤:1) 从真实的生产微服务系统中收集服务性能指标数据;2) 构建服务依赖图,其中节点表示服务,有向边表示服务之间的依赖关系;3) 对收集到的时间序列数据进行预处理,例如缺失值填充和数据标准化;4) 由领域专家对数据进行标注,标记出异常事件窗口;5) 将处理后的数据和标注信息整理成统一的格式,方便研究人员使用。
关键创新:ChronoGraph的关键创新在于它将多变量时间序列数据、显式的服务依赖图和专家标注的异常标签结合在一起,提供了一个更贴近真实微服务环境的基准数据集。与现有数据集相比,ChronoGraph能够更好地反映微服务系统的复杂性和动态性,从而促进结构感知预测和事件感知评估方法的研究。
关键设计:ChronoGraph数据集的关键设计包括:1) 选择了具有代表性的系统级性能指标,例如CPU、内存和网络使用情况,以反映服务的运行状态;2) 构建了显式的服务依赖图,用于建模服务之间的依赖关系;3) 采用了专家标注的方式,确保异常标签的准确性和可靠性;4) 提供了多种数据格式,方便研究人员使用不同的工具和方法进行分析和建模。
📊 实验亮点
论文提供了基于ChronoGraph数据集的基线实验结果,涵盖了预测模型、预训练时间序列基础模型和标准异常检测器。实验结果表明,结构感知的预测模型在ChronoGraph数据集上表现出更好的性能,验证了该数据集的有效性。此外,论文还展示了异常检测器在检测专家标注的异常事件方面的能力,为未来的研究提供了参考。
🎯 应用场景
ChronoGraph数据集可广泛应用于微服务系统的性能预测、异常检测和根因分析等领域。通过利用服务依赖图和异常标签,可以开发出更准确、更鲁棒的预测和异常检测模型,从而提高微服务系统的可靠性和可用性。此外,该数据集还可以用于评估不同预测和异常检测算法的性能,促进相关领域的研究进展。
📄 摘要(原文)
We present ChronoGraph, a graph-structured multivariate time series forecasting dataset built from real-world production microservices. Each node is a service that emits a multivariate stream of system-level performance metrics, capturing CPU, memory, and network usage patterns, while directed edges encode dependencies between services. The primary task is forecasting future values of these signals at the service level. In addition, ChronoGraph provides expert-annotated incident windows as anomaly labels, enabling evaluation of anomaly detection methods and assessment of forecast robustness during operational disruptions. Compared to existing benchmarks from industrial control systems or traffic and air-quality domains, ChronoGraph uniquely combines (i) multivariate time series, (ii) an explicit, machine-readable dependency graph, and (iii) anomaly labels aligned with real incidents. We report baseline results spanning forecasting models, pretrained time-series foundation models, and standard anomaly detectors. ChronoGraph offers a realistic benchmark for studying structure-aware forecasting and incident-aware evaluation in microservice systems.