cs.LG（2025-11-19）

📊 共 1 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	GRPO-RM: Fine-Tuning Representation Models via GRPO-Driven Reinforcement Learning	提出GRPO-RM，通过GRPO驱动的强化学习微调表征模型	reinforcement learning representation learning