cs.CV（2025-09-08）

📊 共 2 篇论文 | 🔗 1 篇有代码

🎯 兴趣领域导航

#	题目	一句话要点	标签	🔗	⭐
1	Interleaving Reasoning for Better Text-to-Image Generation	提出交错推理生成框架IRG，提升文本到图像生成中的指令遵循和细节保持能力	foundation model multimodal instruction following	✅
2	Multi-Modal Camera-Based Detection of Vulnerable Road Users	提出一种多模态相机融合的弱势道路使用者检测框架，提升恶劣环境下的检测性能。	multimodal