cs.LG(2025-11-26)
📊 共 2 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Massively Parallel Imitation Learning of Mouse Forelimb Musculoskeletal Reaching Dynamics | 提出基于大规模并行模仿学习的小鼠前肢肌肉骨骼运动动力学建模方法 | imitation learning MuJoCo | ||
| 2 | Predictive Safety Shield for Dyna-Q Reinforcement Learning | 提出基于预测的安全盾,提升Dyna-Q强化学习在离散空间的安全性和性能 | reinforcement learning |