cs.LG(2025-11-24)
📊 共 4 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | First-order Sobolev Reinforcement Learning | 提出一阶Sobolev强化学习,通过梯度一致性加速critic收敛并稳定策略梯度。 | reinforcement learning SAC actor-critic | ||
| 2 | Learning Massively Multitask World Models for Continuous Control | 提出Newt:一种大规模多任务世界模型,用于连续控制任务 | reinforcement learning world model | ||
| 3 | Leveraging LLMs for reward function design in reinforcement learning control tasks | 提出LEARN-Opt,利用LLM自主设计强化学习控制任务的奖励函数,无需人工干预。 | reinforcement learning reward design |
🔬 支柱一:机器人控制 (Robot Control) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention | AVA-VLA:通过主动视觉注意力提升视觉-语言-动作模型在具身智能任务中的性能。 | dual-arm sim-to-real |