Dual-Interaction-Aware Cooperative Control Strategy for Alleviating Mixed Traffic Congestion
作者: Zhengxuan Liu, Yuxin Cai, Yijing Wang, Xiangkun He, Chen Lv, Zhiqiang Zuo
分类: eess.SY
发布日期: 2026-03-04
💡 一句话要点
提出双重交互感知协同控制策略,缓解混合交通拥堵
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 多智能体强化学习 协同控制 混合交通 交通拥堵缓解 交互感知
📋 核心要点
- 混合交通中人类驾驶车辆行为的不确定性给联网自动驾驶车辆的协同控制带来挑战。
- 提出双重交互感知协同控制策略,增强局部和全局交互感知,提升协同控制效果。
- 实验表明,该策略显著提高了交通效率和适应性,优于现有方法。
📝 摘要(中文)
随着智能交通系统(ITS)的发展,联网自动驾驶车辆(CAV)有望通过协同策略显著减少交通拥堵,尤其是在瓶颈区域。然而,混合交通环境中人类驾驶车辆(HDV)行为的不确定性和多样性给CAV协同带来了重大挑战。本文提出了一种双重交互感知协同控制(DIACC)策略,该策略增强了混合交通瓶颈场景中联网自动驾驶车辆(CAV)在多智能体强化学习(MARL)框架内的局部和全局交互感知。DIACC策略包含三个关键创新:1)去中心化交互自适应决策(D-IADM)模块,通过区分CAV-CAV协同交互和CAV-HDV观察交互来增强actor的局部交互感知。2)中心化交互增强评论家(C-IEC),通过交互感知价值估计来提高评论家对全局交通的理解,为策略更新提供更准确的指导。3)一种奖励设计,采用带温度退火的softmin聚合来优先考虑混合交通中交互密集的场景。此外,一个轻量级的主动安全行动优化(PSAR)模块应用基于规则的校正来加速训练收敛。实验结果表明,与基于规则和基准MARL模型相比,DIACC显著提高了交通效率和适应性。
🔬 方法详解
问题定义:论文旨在解决混合交通瓶颈场景下,由于人类驾驶车辆(HDV)行为的不确定性,联网自动驾驶车辆(CAV)难以有效协同控制,从而导致交通拥堵的问题。现有方法难以区分不同类型的交互,无法准确评估全局交通状况,导致控制策略效果不佳。
核心思路:核心思路是通过增强CAV对局部和全局交互的感知能力,从而实现更有效的协同控制。具体而言,区分CAV-CAV的协同交互和CAV-HDV的观察交互,并利用交互感知的价值估计来提高对全局交通状况的理解。
技术框架:整体框架基于多智能体强化学习(MARL)。主要包含三个模块:1) 去中心化交互自适应决策(D-IADM)模块,负责增强actor的局部交互感知;2) 中心化交互增强评论家(C-IEC)模块,负责提高评论家对全局交通的理解;3) 奖励设计模块,采用softmin聚合来优先考虑交互密集的场景。此外,还包含一个轻量级的主动安全行动优化(PSAR)模块,用于加速训练收敛。
关键创新:主要创新在于双重交互感知的设计:1) 区分CAV-CAV协同交互和CAV-HDV观察交互,从而更准确地评估局部交互;2) 通过交互感知的价值估计,提高评论家对全局交通状况的理解。这种双重交互感知的设计使得CAV能够更好地适应混合交通环境。
关键设计:D-IADM模块通过注意力机制区分不同类型的交互。C-IEC模块使用交互图来表示全局交通状况,并利用图神经网络进行价值估计。奖励函数采用带温度退火的softmin聚合,以优先考虑交互密集的场景。PSAR模块使用基于规则的校正来保证安全性并加速收敛。
🖼️ 关键图片
📊 实验亮点
实验结果表明,DIACC策略在交通效率和适应性方面显著优于基线方法。与基于规则的方法相比,DIACC策略能够减少交通拥堵,提高车辆通行速度。与基准MARL模型相比,DIACC策略能够更好地适应混合交通环境,提高控制策略的鲁棒性。具体性能提升数据未知。
🎯 应用场景
该研究成果可应用于智能交通系统,尤其是在城市交通瓶颈区域,通过部署联网自动驾驶车辆,缓解交通拥堵,提高交通效率。该策略还可扩展到其他混合交通场景,例如高速公路匝道等。未来,该研究有望促进自动驾驶技术的普及和应用,提升城市交通的智能化水平。
📄 摘要(原文)
As Intelligent Transportation System (ITS) develops, Connected and Automated Vehicles (CAVs) are expected to significantly reduce traffic congestion through cooperative strategies, such as in bottleneck areas. However, the uncertainty and diversity in the behaviors of Human-Driven Vehicles (HDVs) in mixed traffic environments present major challenges for CAV cooperation. This paper proposes a Dual-Interaction-Aware Cooperative Control (DIACC) strategy that enhances both local and global interaction perception within the Multi-Agent Reinforcement Learning (MARL) framework for Connected and Automated Vehicles (CAVs) in mixed traffic bottleneck scenarios. The DIACC strategy consists of three key innovations: 1) A Decentralized Interaction-Adaptive Decision-Making (D-IADM) module that enhances actor's local interaction perception by distinguishing CAV-CAV cooperative interactions from CAV-HDV observational interactions. 2) A Centralized Interaction-Enhanced Critic (C-IEC) that improves critic's global traffic understanding through interaction-aware value estimation, providing more accurate guidance for policy updates. 3) A reward design that employs softmin aggregation with temperature annealing to prioritize interaction-intensive scenarios in mixed traffic. Additionally, a lightweight Proactive Safety-based Action Refinement (PSAR) module applies rule-based corrections to accelerate training convergence. Experimental results demonstrate that DIACC significantly improves traffic efficiency and adaptability compared to rule-based and benchmark MARL models.