QNeRF: Neural Radiance Fields on a Simulated Gate-Based Quantum Computer
作者: Daniele Lizzio Bosco, Shuteng Wang, Giuseppe Serra, Vladislav Golyanik
分类: cs.CV
发布日期: 2026-01-08
备注: 30 pages, 15 figures, 11 tables; project page: https://4dqv.mpi-inf.mpg.de/QNeRF/
💡 一句话要点
提出QNeRF,一种基于量子计算机的新视角合成方法,模型更紧凑且性能媲美经典NeRF。
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱三:空间感知与语义 (Perception & Semantics)
关键词: 神经辐射场 量子计算 新视角合成 量子机器学习 3D表示学习
📋 核心要点
- 神经辐射场(NeRF)在新视角合成中表现出色,但模型较大且训练密集,存在模型复杂度和训练成本的挑战。
- QNeRF利用参数化量子电路编码空间和视角信息,通过量子叠加和纠缠实现更紧凑的模型表示,降低模型复杂度。
- 实验表明,QNeRF在参数量更少的情况下,性能可与经典NeRF基线相媲美,验证了量子机器学习在3D表示学习中的潜力。
📝 摘要(中文)
本文提出QNeRF,一种用于新视角合成的混合量子-经典模型,它扩展了量子视觉场(QVFs)的思想。QNeRF利用参数化的量子电路,通过量子叠加和纠缠来编码空间和视角相关的信息,从而实现比经典模型更紧凑的表示。论文提出了两种架构变体:Full QNeRF最大化地利用所有量子幅度来增强表示能力;Dual-Branch QNeRF通过分支空间和视角相关的量子态制备引入了任务相关的归纳偏置,显著降低了操作的复杂度,确保了可扩展性和潜在的硬件兼容性。实验结果表明,在适中分辨率的图像上训练时,QNeRF在参数量不到经典NeRF一半的情况下,性能可以匹配甚至超过经典NeRF基线。这些结果表明,量子机器学习可以作为计算机视觉中级任务(如从2D观测学习3D表示)中连续信号表示的一种有竞争力的替代方案。
🔬 方法详解
问题定义:论文旨在解决神经辐射场(NeRF)模型参数量大、训练成本高的问题,尤其是在新视角合成任务中。现有NeRF方法虽然能够从2D图像中学习紧凑的3D场景表示,但其庞大的模型规模限制了其在资源受限环境中的应用,并且训练过程耗时较长。
核心思路:QNeRF的核心思路是利用量子计算的特性,如量子叠加和纠缠,来更有效地编码空间和视角相关的信息。通过将NeRF中的部分计算转移到量子电路中进行,可以实现更紧凑的模型表示,从而减少参数量和计算复杂度。这种混合量子-经典的方法旨在充分利用量子计算的优势,同时保持与现有经典机器学习框架的兼容性。
技术框架:QNeRF的整体架构包含一个经典神经网络和一个参数化的量子电路(PQC)。经典神经网络负责处理输入图像,提取特征并生成量子电路的参数。PQC则负责进行核心的辐射场计算,例如颜色和密度的预测。论文提出了两种架构变体:Full QNeRF和Dual-Branch QNeRF。Full QNeRF将所有信息编码到单个量子态中,最大化利用量子幅度。Dual-Branch QNeRF则将空间和视角信息分别编码到不同的量子态中,降低了量子电路的复杂度。
关键创新:QNeRF的关键创新在于将量子计算引入到神经辐射场中,利用量子叠加和纠缠来提高模型的表示效率。与传统的经典NeRF相比,QNeRF能够使用更少的参数实现相当甚至更好的性能。此外,Dual-Branch QNeRF的设计通过引入任务相关的归纳偏置,进一步降低了量子电路的复杂度,使其更易于在实际量子硬件上实现。
关键设计:QNeRF的关键设计包括量子电路的结构、参数化方法以及混合量子-经典训练策略。量子电路通常由一系列的单量子比特旋转门和双量子比特纠缠门组成,这些门的参数由经典神经网络预测。损失函数通常采用经典的NeRF损失函数,例如均方误差(MSE)损失,用于衡量渲染图像与真实图像之间的差异。训练过程采用混合量子-经典优化算法,例如变分量子本征求解器(VQE)或量子近似优化算法(QAOA)的变体。
📊 实验亮点
实验结果表明,QNeRF在适中分辨率的图像上训练时,能够以不到经典NeRF一半的参数量,达到甚至超过经典NeRF基线的性能。例如,在特定数据集上,QNeRF在PSNR、SSIM等指标上与NeRF相当,但参数量减少了50%以上。这表明QNeRF在模型压缩方面具有显著优势,验证了量子机器学习在3D表示学习中的潜力。
🎯 应用场景
QNeRF在资源受限环境下的3D场景重建、虚拟现实/增强现实、机器人导航等领域具有潜在应用价值。更紧凑的模型表示使得QNeRF能够在移动设备或嵌入式系统上运行,实现实时的3D渲染和新视角合成。此外,QNeRF的研究也推动了量子机器学习在计算机视觉领域的应用,为未来的量子视觉算法设计提供了新的思路。
📄 摘要(原文)
Recently, Quantum Visual Fields (QVFs) have shown promising improvements in model compactness and convergence speed for learning the provided 2D or 3D signals. Meanwhile, novel-view synthesis has seen major advances with Neural Radiance Fields (NeRFs), where models learn a compact representation from 2D images to render 3D scenes, albeit at the cost of larger models and intensive training. In this work, we extend the approach of QVFs by introducing QNeRF, the first hybrid quantum-classical model designed for novel-view synthesis from 2D images. QNeRF leverages parameterised quantum circuits to encode spatial and view-dependent information via quantum superposition and entanglement, resulting in more compact models compared to the classical counterpart. We present two architectural variants. Full QNeRF maximally exploits all quantum amplitudes to enhance representational capabilities. In contrast, Dual-Branch QNeRF introduces a task-informed inductive bias by branching spatial and view-dependent quantum state preparations, drastically reducing the complexity of this operation and ensuring scalability and potential hardware compatibility. Our experiments demonstrate that -- when trained on images of moderate resolution -- QNeRF matches or outperforms classical NeRF baselines while using less than half the number of parameters. These results suggest that quantum machine learning can serve as a competitive alternative for continuous signal representation in mid-level tasks in computer vision, such as 3D representation learning from 2D observations.