cs.LG（2025-11-24）

📊 共 4 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签
1	First-order Sobolev Reinforcement Learning	提出一阶Sobolev强化学习，通过梯度一致性加速critic收敛并稳定策略梯度。	reinforcement learning SAC actor-critic
2	Learning Massively Multitask World Models for Continuous Control	提出Newt：一种大规模多任务世界模型，用于连续控制任务	reinforcement learning world model
3	Leveraging LLMs for reward function design in reinforcement learning control tasks	提出LEARN-Opt，利用LLM自主设计强化学习控制任务的奖励函数，无需人工干预。	reinforcement learning reward design

#	题目	一句话要点	标签	🔗	⭐
4	AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention	AVA-VLA：通过主动视觉注意力提升视觉-语言-动作模型在具身智能任务中的性能。	dual-arm sim-to-real