arXiv 中文要点汇总
🤖 cs.RO
机器人📊 领域分布
机器人控制 5662
RL算法与架构 928
具身大模型 698
空间感知与语义 634
物理动画 77
动作重定向 68
空间感知 65
生成式动作 56
视频提取与匹配 44
其他 13
交互与反应 9
📆 最近更新
📝 最新论文
- Moving Through Clutter: Scaling Data Collection and Benchmar...
提出MTC框架,通过VR数据收集与评测,实现3D杂乱场景下的人形机器人运动。 - History-Conditioned Spatio-Temporal Visual Token Pruning for...
提出一种免训练的时空视觉Token剪枝框架,用于高效的视觉-语言导航。 - SuperSuit: An Isomorphic Bimodal Interface for Scalable Mobi...
SuperSuit:一种用于可扩展移动操作的同构双模态接口 - Data Analogies Enable Efficient Cross-Embodiment Transfer
数据类比提升跨具身迁移效率,解决异构机器人数据利用难题 - Restoring Linguistic Grounding in VLA Models via Train-Free ...
提出IGAR,通过无训练注意力重校准解决VLA模型中的语言盲区问题
👁️ cs.CV
视觉📊 领域分布
具身大模型 4303
RL算法与架构 3024
空间感知与语义 2995
机器人控制 880
视频提取与匹配 392
生成式动作 385
物理动画 337
空间感知 328
动作重定向 287
交互与反应 134
视频提取与匹配 6
其他 4
📆 最近更新
📝 最新论文
- Towards Motion Turing Test: Evaluating Human-Likeness in Hum...
提出运动图灵测试框架,评估人形机器人运动的类人程度,并构建HHMotion数据集... - Transforming Omnidirectional RGB-LiDAR data into 3D Gaussian...
提出一种RGB-LiDAR到3D高斯溅射的转换方法,用于高效构建大规模数字孪生。 - EntON: Eigenentropy-Optimized Neighborhood Densification in ...
EntON:基于特征熵优化的3D高斯溅射邻域稠密化,提升几何精度与渲染质量。 - CylinderSplat: 3D Gaussian Splatting with Cylindrical Tripla...
CylinderSplat:利用柱面Triplane的3D高斯溅射实现全景新视角... - VG3S: Visual Geometry Grounded Gaussian Splatting for Semant...
VG3S:利用视觉几何先验的高斯溅射实现语义占据预测
🎨 cs.GR
图形学📊 领域分布
空间感知与语义 245
机器人控制 88
具身大模型 60
生成式动作 55
RL算法与架构 43
物理动画 38
动作重定向 14
视频提取与匹配 12
空间感知 6
交互与反应 3
视频提取与匹配 1
📆 最近更新
📝 最新论文
- Generalized non-exponential Gaussian splatting
推广3D高斯溅射至非指数高斯,显著加速复杂场景渲染 - TopoEdit: Fast Post-Optimization Editing of Topology Optimiz...
TopoEdit:利用预训练拓扑模型实现快速拓扑优化结构编辑 - BRepMAE: Self-Supervised Masked BRep Autoencoders for Machin...
提出BRepMAE自监督框架,用于CAD模型加工特征识别。 - D3MAS: Decompose, Deduce, and Distribute for Enhanced Knowle...
D3MAS:通过分解、推导与分发增强多智能体系统中的知识共享 - HyperAgent: Leveraging Hypergraphs for Topology Optimization...
HyperAgent:利用超图优化多智能体通信拓扑,提升协作效率与任务适应性
🧠 cs.LG
机器学习 (RL, Diffusion, World Model)📊 领域分布
RL算法与架构 4141
具身大模型 3780
机器人控制 475
物理动画 340
生成式动作 95
交互与反应 63
动作重定向 58
空间感知与语义 49
视频提取与匹配 22
空间感知 3
其他 1
📆 最近更新
📝 最新论文
- When One Modality Rules Them All: Backdoor Modality Collapse...
揭示多模态扩散模型后门攻击中的模态坍塌现象,强调单模态主导风险 - COLD-Steer: Steering Large Language Models via In-Context On...
COLD-Steer:通过上下文单步学习动态引导大语言模型 - Synthetic Monitoring Environments for Reinforcement Learning
提出合成监控环境SMEs,用于强化学习算法的白盒诊断与性能分析。 - Adapter-Augmented Bandits for Online Multi-Constrained Multi...
提出M-CMAB框架,解决在线多约束多模态推理调度问题,提升资源利用率。 - From Entropy to Calibrated Uncertainty: Training Language Mo...
提出一种基于熵校准的语言模型不确定性推理训练方法,提升校准性和计算效率。
🤔 cs.AI
人工智能 (Agents, Planning)📊 领域分布
具身大模型 5779
RL算法与架构 1909
机器人控制 380
物理动画 111
空间感知与语义 79
生成式动作 67
交互与反应 46
动作重定向 28
视频提取与匹配 26
空间感知 3
📆 最近更新
📝 最新论文
- Boosting deep Reinforcement Learning using pretraining with ...
提出H^2RL:利用逻辑选项预训练增强深度强化学习,提升长时决策能力 - Knowing without Acting: The Disentangled Geometry of Safety ...
提出DSH以解决大型语言模型安全机制的解耦问题 - Lexara: A User-Centered Toolkit for Evaluating Large Languag...
Lexara:一个以用户为中心的工具包,用于评估会话式可视化分析的大型语言模型 - Depth Charge: Jailbreak Large Language Models from Deep Safe...
提出SAHA框架,通过攻击深度安全注意力头破解大语言模型的安全对齐。 - A Reference Architecture of Reinforcement Learning Framework...
提出强化学习框架的参考架构,用于统一比较、评估和集成不同的框架。
💬 cs.CL
自然语言 (VLA, Text-to-Motion)📊 领域分布
具身大模型 11374
RL算法与架构 2183
机器人控制 196
视频提取与匹配 63
空间感知与语义 42
物理动画 30
生成式动作 25
动作重定向 22
交互与反应 14
空间感知 1
📆 最近更新
📝 最新论文
- ReflexiCoder: Teaching Large Language Models to Self-Reflect... 🔗
ReflexiCoder:通过强化学习教大型语言模型自省和自纠代码 - Beyond Rows to Reasoning: Agentic Retrieval for Multimodal S...
提出BRTR:基于Agent的迭代式检索框架,用于多模态电子表格理解与编辑。 - SPOT: Span-level Pause-of-Thought for Efficient and Interpre...
SPOT:通过跨度级暂停思想提升大语言模型推理效率与可解释性 - Who We Are, Where We Are: Mental Health at the Intersection ...
结合个体与情境,利用大语言模型预测社交媒体用户的心理健康状态。 - ROSE: Reordered SparseGPT for More Accurate One-Shot Large L... 🔗
ROSE:重排序的SparseGPT,提升大语言模型单次剪枝的准确性
⚙️ eess.SY
系统控制 (MPC, Dynamics)📊 领域分布
机器人控制 756
RL算法与架构 311
生成式动作 165
物理动画 139
具身大模型 122
交互与反应 18
空间感知与语义 7
动作重定向 5
其他 4
空间感知 3
视频提取与匹配 3
📆 最近更新
📝 最新论文
- Adaptive Data-Driven Min-Max MPC for Linear Time-Varying Sys...
提出一种自适应数据驱动的Min-Max MPC方法,用于线性时变系统控制。 - A Unified Hybrid Control Architecture for Multi-DOF Robotic ...
提出一种统一混合控制架构,解决多自由度机器人控制难题。 - NL2GDS: LLM-aided interface for Open Source Chip Design
NL2GDS:利用LLM将自然语言硬件描述转化为GDSII版图 - Design of Grid Forming Multi Timescale Coordinated Control S...
针对弱电网,提出基于多时间尺度协调控制的动态虚拟电厂设计 - Multistage Stochastic Programming for Rare Event Risk Mitiga...
提出基于多阶段随机规划的电力系统罕见事件风险缓解方法