RL-AWB: Deep Reinforcement Learning for Auto White Balance Correction in Low-Light Night-time Scenes

作者: Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, Yu-Lun Liu

分类: cs.CV

发布日期: 2026-01-08

备注: Project page: https://ntuneillee.github.io/research/rl-awb/

🔗 代码/项目: PROJECT_PAGE

💡 一句话要点

提出RL-AWB，结合统计方法与深度强化学习，解决低光夜景场景下的自动白平衡问题。

🎯 匹配领域: 支柱二：RL算法与架构 (RL & Architecture)

关键词: 自动白平衡 深度强化学习 低光照图像增强 夜间场景 色彩恒常性

📋 核心要点

夜间低光照和复杂光照条件使得色彩恒常性成为难题，现有方法难以有效处理夜间场景。
RL-AWB结合统计方法与深度强化学习，模仿专业调色师，动态优化参数，实现更好的白平衡。
论文构建了多传感器夜间数据集，实验表明该方法在不同光照条件下具有良好的泛化能力。

📝 摘要（中文）

夜间色彩恒常性是计算摄影学中一个具有挑战性的问题，这主要是由于低光噪声和复杂的光照条件所致。我们提出了一种新颖的框架RL-AWB，它结合了统计方法与深度强化学习，用于夜间白平衡。我们的方法首先采用一种为夜间场景量身定制的统计算法，该算法集成了显著灰像素检测和新颖的光照估计。在此基础上，我们开发了第一个用于色彩恒常性的深度强化学习方法，该方法利用统计算法作为其核心，通过动态优化每个图像的参数来模仿专业的AWB调整专家。为了方便跨传感器评估，我们引入了第一个多传感器夜间数据集。实验结果表明，我们的方法在低光和光照良好的图像中都具有卓越的泛化能力。

🔬 方法详解

问题定义：论文旨在解决低光夜间场景中自动白平衡（AWB）校正的问题。现有的AWB算法在光照条件良好时表现良好，但在低光环境下，由于噪声和复杂的光照，性能显著下降，导致图像色彩失真。因此，需要一种能够适应夜间低光环境的AWB算法。

核心思路：论文的核心思路是将传统的统计方法与深度强化学习相结合。首先，利用统计方法进行初步的光照估计，然后利用深度强化学习动态调整参数，模仿专业调色师的行为，从而实现更精确的白平衡校正。这种结合利用了统计方法的稳定性和深度强化学习的自适应性。

技术框架：RL-AWB框架主要包含两个阶段：1) 基于统计的初步光照估计：该阶段使用专门为夜间场景设计的统计算法，包括显著灰像素检测和新颖的光照估计方法。2) 基于深度强化学习的参数优化：该阶段使用深度强化学习智能体，以初步光照估计的结果作为输入，通过与环境的交互，动态调整AWB参数。整个框架以端到端的方式进行训练。

关键创新：论文的关键创新在于将深度强化学习应用于自动白平衡问题，并将其与统计方法相结合。这是首次尝试使用深度强化学习来模拟专业调色师的调色过程，从而实现更智能、更自适应的AWB校正。此外，论文还构建了一个多传感器夜间数据集，为该领域的研究提供了新的资源。

关键设计：在统计方法部分，论文设计了专门针对夜间场景的显著灰像素检测算法和光照估计方法。在深度强化学习部分，论文设计了合适的奖励函数，以鼓励智能体学习到正确的调色策略。具体的网络结构和参数设置在论文中有详细描述，但此处未知。

📊 实验亮点

实验结果表明，RL-AWB在低光夜间场景中取得了显著的性能提升。相较于传统的AWB算法和现有的深度学习方法，RL-AWB在色彩还原度和图像质量方面均有明显优势。此外，该方法在多传感器数据集上表现出良好的泛化能力，证明了其在不同设备上的适用性。具体的性能指标和对比结果在论文中有详细展示，但此处未知。

🎯 应用场景

该研究成果可广泛应用于夜间监控、自动驾驶、夜间摄影等领域。通过提升低光照条件下的图像质量，可以提高夜间监控系统的识别精度，改善自动驾驶系统的环境感知能力，并为夜间摄影爱好者提供更好的拍摄体验。未来，该技术有望进一步扩展到其他图像增强和色彩校正任务中。

📄 摘要（原文）

Nighttime color constancy remains a challenging problem in computational photography due to low-light noise and complex illumination conditions. We present RL-AWB, a novel framework combining statistical methods with deep reinforcement learning for nighttime white balance. Our method begins with a statistical algorithm tailored for nighttime scenes, integrating salient gray pixel detection with novel illumination estimation. Building on this foundation, we develop the first deep reinforcement learning approach for color constancy that leverages the statistical algorithm as its core, mimicking professional AWB tuning experts by dynamically optimizing parameters for each image. To facilitate cross-sensor evaluation, we introduce the first multi-sensor nighttime dataset. Experiment results demonstrate that our method achieves superior generalization capability across low-light and well-illuminated images. Project page: https://ntuneillee.github.io/research/rl-awb/

RL-AWB: Deep Reinforcement Learning for Auto White Balance Correction in Low-Light Night-time Scenes

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册