arXiv 中文要点汇总
🤖 cs.RO
机器人📊 领域分布
机器人控制 6062
RL算法与架构 983
具身大模型 748
空间感知与语义 676
物理动画 83
动作重定向 73
空间感知 65
生成式动作 59
视频提取与匹配 47
其他 13
交互与反应 9
📆 最近更新
📝 最新论文
- SafeMind: A Risk-Aware Differentiable Control Framework for ...
SafeMind:一种风险感知的可微控制框架,用于自适应和安全的四足机器人运动 - Sim-to-Real Transfer for Muscle-Actuated Robots via Generali...
提出广义执行器网络GeAN,实现肌肉驱动机器人从仿真到真实的策略迁移 - HTNav: A Hybrid Navigation Framework with Tiered Structure f...
提出HTNav,一种用于城市空中视觉-语言导航的分层混合导航框架 - HEX: Humanoid-Aligned Experts for Cross-Embodiment Whole-Bod...
HEX:面向跨具身全身操作的人形对齐专家系统 - Sumo: Dynamic and Generalizable Whole-Body Loco-Manipulation
Sumo:基于预训练策略和测试时规划的通用动态全身操作
👁️ cs.CV
视觉📊 领域分布
具身大模型 4742
RL算法与架构 3375
空间感知与语义 3264
机器人控制 984
视频提取与匹配 435
生成式动作 432
物理动画 380
动作重定向 332
空间感知 328
交互与反应 148
视频提取与匹配 6
其他 4
📆 最近更新
📝 最新论文
- Learning Vision-Language-Action World Models for Autonomous ...
提出VLA-World模型,融合预测想象与反思推理,提升自动驾驶的预见性和安全性... - HM-Bench: A Comprehensive Benchmark for Multimodal Large Lan... 🔗
提出HM-Bench,用于评估多模态大语言模型在高光谱遥感图像理解中的能力。 - Large-Scale Universal Defect Generation: Foundation Models a... 🔗
提出UniDG:一个大规模通用缺陷生成模型,解决缺陷生成数据匮乏问题。 - Visually-Guided Policy Optimization for Multimodal Reasoning
提出VGPO,增强视觉引导的多模态推理能力,解决视觉信息利用不足问题 - PhysInOne: Visual Physics Learning and Reasoning in One Suit...
PhysInOne:构建大规模物理场景数据集,促进AI系统物理推理能力
🎨 cs.GR
图形学📊 领域分布
空间感知与语义 254
机器人控制 92
具身大模型 63
生成式动作 56
RL算法与架构 45
物理动画 38
动作重定向 15
视频提取与匹配 12
空间感知 6
交互与反应 3
视频提取与匹配 1
📆 最近更新
📝 最新论文
- Physics-Based Motion Tracking of Contact-Rich Interacting Ch...
提出基于渐进神经网络的运动跟踪方法,解决接触丰富的交互角色动画生成问题 - AniGen: Unified $S^3$ Fields for Animatable 3D Asset Generat... 🔗
AniGen:提出统一的S³场,用于生成可动画的3D资产 - Splats under Pressure: Exploring Performance-Energy Trade-of...
研究不同GPU功耗预算下实时3D高斯溅射的性能-能耗权衡 - GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores ...
提出GEMM-GS以加速3D高斯点云渲染 - PhysGaia: A Physics-Aware Benchmark with Multi-Body Interact...
PhysGaia:一个用于动态新视角合成的物理感知多体交互基准
🧠 cs.LG
机器学习 (RL, Diffusion, World Model)📊 领域分布
RL算法与架构 4431
具身大模型 4051
机器人控制 525
物理动画 366
生成式动作 100
交互与反应 63
动作重定向 60
空间感知与语义 54
视频提取与匹配 26
空间感知 3
其他 1
📆 最近更新
📝 最新论文
- Revisiting the Capacity Gap in Chain-of-Thought Distillation...
重新审视CoT蒸馏中的能力差距,关注实际应用场景 - WOMBET: World Model-based Experience Transfer for Robust and...
WOMBET:基于世界模型的经验迁移,提升强化学习的鲁棒性和样本效率 - How does Chain of Thought decompose complex tasks?
通过分解复杂任务,链式思考(CoT)能显著降低大语言模型的分类误差。 - Dictionary-Aligned Concept Control for Safeguarding Multimod...
提出DACO框架,通过概念字典对齐控制多模态LLM,提升安全性。 - Toward World Models for Epidemiology
提出流行病学世界模型框架,解决流行病决策中潜变量推理与反事实推断难题
🤔 cs.AI
人工智能 (Agents, Planning)📊 领域分布
具身大模型 6236
RL算法与架构 2074
机器人控制 410
物理动画 120
空间感知与语义 85
生成式动作 71
交互与反应 51
动作重定向 33
视频提取与匹配 29
空间感知 3
📆 最近更新
📝 最新论文
- PilotBench: A Benchmark for General Aviation Agents with Saf...
PilotBench:面向通用航空代理,带安全约束的基准测试 - SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks
提出SPPO以解决长时间推理任务中的PPO不稳定问题 - Advantage-Guided Diffusion for Model-Based Reinforcement Lea...
提出Advantage引导的扩散模型(AGD-MBRL),提升基于扩散模型的模型... - On the Representational Limits of Quantum-Inspired 1024-D Do...
评估量子启发式1024维文档嵌入的表征能力极限,揭示其在信息检索中的局限性 - Constraint-Aware Corrective Memory for Language-Based Drug D...
提出CACM框架,通过约束感知的修正记忆提升语言驱动的药物发现Agent性能。
💬 cs.CL
自然语言 (VLA, Text-to-Motion)📊 领域分布
具身大模型 11817
RL算法与架构 2292
机器人控制 204
视频提取与匹配 68
空间感知与语义 43
物理动画 30
生成式动作 28
动作重定向 24
交互与反应 16
空间感知 1
📆 最近更新
📝 最新论文
- From Reasoning to Agentic: Credit Assignment in Reinforcemen...
针对大语言模型在强化学习中信用分配问题,提出系统性综述、评估基准与方法论指导。 - GRASP: Grounded CoT Reasoning with Dual-Stage Optimization f...
提出GRASP框架,通过双阶段优化和Grounded CoT推理解决多模态讽刺目... - Hierarchical Alignment: Enforcing Hierarchical Instruction-F...
提出神经符号分层对齐(NSHA),通过逻辑一致性增强LLM的分层指令遵循能力 - Large Language Models Generate Harmful Content Using a Disti...
通过权重剪枝揭示大语言模型生成有害内容的统一机制 - CONDESION-BENCH: Conditional Decision-Making of Large Langua...
提出CONDESION-BENCH,评估大语言模型在组合动作空间中的条件决策能力
⚙️ eess.SY
系统控制 (MPC, Dynamics)📊 领域分布
机器人控制 825
RL算法与架构 329
生成式动作 176
物理动画 147
具身大模型 129
交互与反应 18
空间感知与语义 8
动作重定向 5
其他 4
空间感知 3
视频提取与匹配 3
📆 最近更新
📝 最新论文
- Efficient Uniform Feasible Set Sampling for Approximate Line...
提出线性MPC Hit-and-Run采样器,加速近似线性MPC的训练数据生成。 - Bandwidth reduction methods for packetized MPC over lossy ne...
针对丢包网络下的分组化MPC,提出双重带宽缩减方法 - Discounted MPC and infinite-horizon optimal control under pl...
针对模型失配下的折扣MPC与无限时域最优控制,提出稳定性与次优性分析框架 - Learning over Forward-Invariant Policy Classes: Reinforcemen...
提出基于前向不变策略类的安全强化学习框架,解决安全约束问题 - From Cut-In to Rated: Multi-Region Floating Offshore Wind Fa...
针对漂浮式海上风电场,提出多区域控制框架,实现二次频率调节。