cs.LG（2025-09-24）

📊 共 3 篇论文

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Training Task Reasoning LLM Agents for Multi-turn Task Planning via Single-turn Reinforcement Learning	提出单轮强化学习训练任务推理LLM Agent，解决多轮任务规划问题	reinforcement learning large language model
2	PIRF: Physics-Informed Reward Fine-Tuning for Diffusion Models	提出PIRF，通过物理信息奖励微调扩散模型，提升科学领域的生成质量。	distillation spatiotemporal

#	题目	一句话要点	标签	🔗	⭐
3	Video models are zero-shot learners and reasoners	Veo 3视频模型展现零样本学习与推理能力，或成通用视觉基石	affordance large language model foundation model