cs.LG(2025-11-27)
📊 共 1 篇论文
🎯 兴趣领域导航
🔬 支柱二:RL算法与架构 (RL & Architecture) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | BiCQL-ML: A Bi-Level Conservative Q-Learning Framework for Maximum Likelihood Inverse Reinforcement Learning | 提出BiCQL-ML,通过双层保守Q学习解决离线逆强化学习中的奖励函数恢复问题 | reinforcement learning policy learning inverse reinforcement learning |