cs.LG(2025-10-20)
📊 共 4 篇论文 | 🔗 1 篇有代码
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (3 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | Provably Optimal Reinforcement Learning under Safety Filtering | 提出安全过滤下的可证明最优强化学习方法,解决安全约束下的性能损失问题 | reinforcement learning | ||
| 2 | Demystifying Transition Matching: When and Why It Can Beat Flow Matching | 揭示Transition Matching优势:在高斯分布及混合模型中超越Flow Matching | flow matching | ||
| 3 | An Empirical Study of Lagrangian Methods in Safe Reinforcement Learning | 研究安全强化学习中拉格朗日方法的λ敏感性与自动更新策略的鲁棒性。 | reinforcement learning | ✅ |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | MILES: Modality-Informed Learning Rate Scheduler for Balancing Multimodal Learning | 提出MILES:一种模态感知学习率调度器,用于平衡多模态学习。 | multimodal |