arXiv 中文要点汇总
🤖 cs.RO
机器人📊 领域分布
机器人控制 2081
RL算法与架构 297
具身大模型 230
空间感知与语义 177
空间感知 94
动作重定向 17
视频提取与匹配 15
物理动画 15
生成式动作 13
其他 13
交互与反应 2
📆 最近更新
📝 最新论文
- A High-Fidelity Digital Twin for Robotic Manipulation Based ...
提出基于3D高斯溅射的机器人操作高保真数字孪生方法 - Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment fo...
提出基于触觉和力控的零样本Sim-to-Real灵巧操作框架,解决虚实迁移难题 - SOP: A Scalable Online Post-Training System for Vision-Langu...
提出SOP:一种可扩展的在线后训练系统,用于视觉-语言-动作模型 - LOST-3DSG: Lightweight Open-Vocabulary 3D Scene Graphs with ... 🔗
LOST-3DSG:轻量级开放词汇3D场景图,用于动态环境中语义跟踪 - Reinforcement Learning for Follow-the-Leader Robotic Endosco...
提出基于深度强化学习的内窥镜导航方法,通过合成数据提升导航精度和安全性
👁️ cs.CV
视觉📊 领域分布
具身大模型 1241
RL算法与架构 1023
空间感知与语义 786
空间感知 463
机器人控制 341
生成式动作 133
视频提取与匹配 131
物理动画 103
动作重定向 81
交互与反应 55
视频提取与匹配 6
其他 3
📆 最近更新
📝 最新论文
- SA-ResGS: Self-Augmented Residual 3D Gaussian Splatting for ...
SA-ResGS:用于最佳视角选择的自增强残差3D高斯溅射 - AnatomiX, an Anatomy-Aware Grounded Multimodal Large Languag... 🔗
AnatomiX:面向胸部X光片解读的解剖学感知多模态大语言模型 - Text-Guided Layer Fusion Mitigates Hallucination in Multimod...
提出TGIF:文本引导层融合缓解多模态LLM中的幻觉问题 - Understanding Multi-Agent Reasoning with Large Language Mode...
提出多Agent LLM框架,解决卡通VQA中视觉抽象和叙事推理难题 - PrismVAU: Prompt-Refined Inference System for Multimodal Vid...
PrismVAU:用于多模态视频异常理解的Prompt优化推理系统
🎨 cs.GR
图形学📊 领域分布
空间感知与语义 96
机器人控制 37
生成式动作 23
具身大模型 18
RL算法与架构 16
物理动画 15
空间感知 8
视频提取与匹配 7
动作重定向 2
交互与反应 2
视频提取与匹配 1
📆 最近更新
📝 最新论文
- The perceptual gap between video see-through displays and na...
量化VST头显与自然视觉的感知差距,揭示低光环境下性能退化 - SketchRodGS: Sketch-based Extraction of Slender Geometries f...
SketchRodGS:基于草图从高斯溅射场景中提取细长几何体用于动画 - Spatiotemporal Detection and Uncertainty Visualization of At...
提出一种时空检测与不确定性可视化框架,用于分析大气阻塞事件,助力气候风险评估。 - PhysTalk: Language-driven Real-time Physics in 3D Gaussian S...
PhysTalk:基于语言驱动的3D高斯场景实时物理交互 - AirGS: Real-Time 4D Gaussian Streaming for Free-Viewpoint Vi...
AirGS:面向自由视点视频的实时4D高斯流传输框架
🧠 cs.LG
机器学习 (RL, Diffusion, World Model)📊 领域分布
RL算法与架构 946
具身大模型 855
机器人控制 103
物理动画 68
生成式动作 24
交互与反应 18
动作重定向 7
空间感知与语义 6
空间感知 4
视频提取与匹配 3
其他 1
📆 最近更新
📝 最新论文
- Uni-FinLLM: A Unified Multimodal Large Language Model with M...
Uni-FinLLM:统一多模态大语言模型,用于微观股票预测和宏观系统性风险评估 - Empowering Reliable Visual-Centric Instruction Following in ...
提出VC-IFEval基准,提升多模态大语言模型在视觉约束下的指令跟随能力 - Adversarial Contrastive Learning for LLM Quantization Attack...
提出对抗对比学习ACL,提升LLM量化攻击的成功率 - Sparse Knowledge Distillation: A Mathematical Framework for ...
提出稀疏知识蒸馏框架以优化模型压缩与温度缩放问题 - Decentralized Autoregressive Generation
提出去中心化自回归生成方法,解决多模态语言模型训练中的专家协作问题。
🤔 cs.AI
人工智能 (Agents, Planning)📊 领域分布
具身大模型 1307
RL算法与架构 442
机器人控制 103
空间感知与语义 22
物理动画 18
生成式动作 13
交互与反应 12
动作重定向 8
视频提取与匹配 6
空间感知 3
📆 最近更新
📝 最新论文
- Rationale-Grounded In-Context Learning for Time Series Reaso...
提出RationaleTS,通过先验知识推理提升多模态大语言模型在时间序列推理中... - Interpretable All-Type Audio Deepfake Detection with Audio L...
提出基于频率-时间强化学习的音频大语言模型,用于可解释的全类型音频深度伪造检测 - Sample-Efficient Neurosymbolic Deep Reinforcement Learning
提出神经符号深度强化学习方法,提升样本效率和泛化能力,解决复杂环境下的序贯决策问... - Multi-Modal Data-Enhanced Foundation Models for Prediction a...
综述:多模态数据增强的无线网络预测与控制基础模型 - Time-Scaling Is What Agents Need Now
提出时间尺度调整,提升智能体在认知约束下的深度推理与问题解决能力
💬 cs.CL
自然语言 (VLA, Text-to-Motion)📊 领域分布
具身大模型 2540
RL算法与架构 534
机器人控制 46
视频提取与匹配 13
物理动画 10
空间感知与语义 8
生成式动作 8
动作重定向 6
交互与反应 2
空间感知 1
📆 最近更新
📝 最新论文
- Limited Linguistic Diversity in Embodied AI Datasets
分析具身AI数据集的语言多样性,揭示指令重复性问题并提出改进方向。 - Mitigating Prompt-Induced Hallucinations in Large Language M...
提出基于结构化推理的知识蒸馏链模型,缓解大语言模型中的提示诱导幻觉问题 - Reducing Hallucinations in LLMs via Factuality-Aware Prefere...
提出F-DPO,通过事实感知偏好学习减少LLM中的幻觉问题 - Window-based Membership Inference Attacks Against Fine-tuned...
提出基于窗口比较的WBC方法,提升针对微调大语言模型的成员推理攻击效果。 - Who Laughs with Whom? Disentangling Influential Factors in H...
通过用户聚类和LLM分析,解耦幽默偏好中的影响因素
⚙️ eess.SY
系统控制 (MPC, Dynamics)📊 领域分布
机器人控制 168
RL算法与架构 79
生成式动作 42
物理动画 31
具身大模型 30
交互与反应 4
空间感知 4
其他 4
视频提取与匹配 2
动作重定向 1
空间感知与语义 1
📆 最近更新
📝 最新论文
- Conditioning Aircraft Trajectory Prediction on Meteorologica...
提出一种基于物理信息的机器学习方法,利用气象数据提升飞机轨迹预测精度。 - Hierarchical Preemptive Holistic Collaborative Systems for E...
提出分层抢占式整体协作框架Prollect,解决具身多智能体系统中的安全、可扩展... - Policy Optimization with Differentiable MPC: Convergence Ana...
提出基于可微MPC的策略优化方法,结合递归系统辨识,提升不确定性下的控制性能。 - Machine Learning Guided Cooling Optimization for Data Center...
提出基于物理信息的机器学习框架,优化数据中心冷却能耗。 - A formal theory on problem space as a semantic world model i...
形式化问题空间理论,为系统工程构建语义世界模型。