arXiv 中文要点汇总

▶

🤖 cs.RO

机器人

📅 最新: 2026-01-06 📄 共 2954 篇

📊 领域分布

机器人控制 2081 RL算法与架构 297 具身大模型 230 空间感知与语义 177 空间感知 94 动作重定向 17 视频提取与匹配 15 物理动画 15 生成式动作 13 其他 13 交互与反应 2

📆 最近更新

2026-01-06 (15篇) 2026-01-05 (5篇) 2026-01-02 (4篇) 2025-12-31 (11篇) 2025-12-29 (7篇) 2025-12-26 (4篇) 2025-12-24 (14篇) 更多... (224)

📝 最新论文

A High-Fidelity Digital Twin for Robotic Manipulation Based ...
提出基于3D高斯溅射的机器人操作高保真数字孪生方法
Closing the Reality Gap: Zero-Shot Sim-to-Real Deployment fo...
提出基于触觉和力控的零样本Sim-to-Real灵巧操作框架，解决虚实迁移难题
SOP: A Scalable Online Post-Training System for Vision-Langu...
提出SOP：一种可扩展的在线后训练系统，用于视觉-语言-动作模型
LOST-3DSG: Lightweight Open-Vocabulary 3D Scene Graphs with ... 🔗
LOST-3DSG：轻量级开放词汇3D场景图，用于动态环境中语义跟踪
Reinforcement Learning for Follow-the-Leader Robotic Endosco...
提出基于深度强化学习的内窥镜导航方法，通过合成数据提升导航精度和安全性

▶

👁️ cs.CV

视觉

📅 最新: 2026-01-06 📄 共 4366 篇

📊 领域分布

具身大模型 1241 RL算法与架构 1023 空间感知与语义 786 空间感知 463 机器人控制 341 生成式动作 133 视频提取与匹配 131 物理动画 103 动作重定向 81 交互与反应 55 视频提取与匹配 6 其他 3

📆 最近更新

2026-01-06 (22篇) 2026-01-05 (26篇) 2026-01-02 (8篇) 2025-12-31 (14篇) 2025-12-29 (30篇) 2025-12-26 (11篇) 2025-12-24 (25篇) 更多... (232)

📝 最新论文

SA-ResGS: Self-Augmented Residual 3D Gaussian Splatting for ...
SA-ResGS：用于最佳视角选择的自增强残差3D高斯溅射
AnatomiX, an Anatomy-Aware Grounded Multimodal Large Languag... 🔗
AnatomiX：面向胸部X光片解读的解剖学感知多模态大语言模型
Text-Guided Layer Fusion Mitigates Hallucination in Multimod...
提出TGIF：文本引导层融合缓解多模态LLM中的幻觉问题
Understanding Multi-Agent Reasoning with Large Language Mode...
提出多Agent LLM框架，解决卡通VQA中视觉抽象和叙事推理难题
PrismVAU: Prompt-Refined Inference System for Multimodal Vid...
PrismVAU：用于多模态视频异常理解的Prompt优化推理系统

▶

🎨 cs.GR

图形学

📅 最新: 2026-01-06 📄 共 225 篇

📊 领域分布

空间感知与语义 96 机器人控制 37 生成式动作 23 具身大模型 18 RL算法与架构 16 物理动画 15 空间感知 8 视频提取与匹配 7 动作重定向 2 交互与反应 2 视频提取与匹配 1

📆 最近更新

2026-01-06 (1篇) 2026-01-05 (1篇) 2026-01-02 (1篇) 2025-12-31 (1篇) 2025-12-24 (2篇) 2025-12-23 (3篇) 2025-12-16 (1篇) 更多... (125)

📝 最新论文

The perceptual gap between video see-through displays and na...
量化VST头显与自然视觉的感知差距，揭示低光环境下性能退化
SketchRodGS: Sketch-based Extraction of Slender Geometries f...
SketchRodGS：基于草图从高斯溅射场景中提取细长几何体用于动画
Spatiotemporal Detection and Uncertainty Visualization of At...
提出一种时空检测与不确定性可视化框架，用于分析大气阻塞事件，助力气候风险评估。
PhysTalk: Language-driven Real-time Physics in 3D Gaussian S...
PhysTalk：基于语言驱动的3D高斯场景实时物理交互
AirGS: Real-Time 4D Gaussian Streaming for Free-Viewpoint Vi...
AirGS：面向自由视点视频的实时4D高斯流传输框架

▶

🧠 cs.LG

机器学习 (RL, Diffusion, World Model)

📅 最新: 2026-01-06 📄 共 2035 篇

📊 领域分布

RL算法与架构 946 具身大模型 855 机器人控制 103 物理动画 68 生成式动作 24 交互与反应 18 动作重定向 7 空间感知与语义 6 空间感知 4 视频提取与匹配 3 其他 1

📆 最近更新

2026-01-06 (15篇) 2026-01-05 (16篇) 2026-01-02 (10篇) 2025-12-31 (17篇) 2025-12-29 (17篇) 2025-12-26 (8篇) 2025-12-24 (9篇) 更多... (203)

📝 最新论文

Uni-FinLLM: A Unified Multimodal Large Language Model with M...
Uni-FinLLM：统一多模态大语言模型，用于微观股票预测和宏观系统性风险评估
Empowering Reliable Visual-Centric Instruction Following in ...
提出VC-IFEval基准，提升多模态大语言模型在视觉约束下的指令跟随能力
Adversarial Contrastive Learning for LLM Quantization Attack...
提出对抗对比学习ACL，提升LLM量化攻击的成功率
Sparse Knowledge Distillation: A Mathematical Framework for ...
提出稀疏知识蒸馏框架以优化模型压缩与温度缩放问题
Decentralized Autoregressive Generation
提出去中心化自回归生成方法，解决多模态语言模型训练中的专家协作问题。

▶

🤔 cs.AI

人工智能 (Agents, Planning)

📅 最新: 2026-01-06 📄 共 1934 篇

📊 领域分布

具身大模型 1307 RL算法与架构 442 机器人控制 103 空间感知与语义 22 物理动画 18 生成式动作 13 交互与反应 12 动作重定向 8 视频提取与匹配 6 空间感知 3

📆 最近更新

2026-01-06 (20篇) 2026-01-05 (20篇) 2026-01-02 (6篇) 2025-12-31 (17篇) 2025-12-29 (16篇) 2025-12-26 (1篇) 2025-12-24 (10篇) 更多... (191)

📝 最新论文

Rationale-Grounded In-Context Learning for Time Series Reaso...
提出RationaleTS，通过先验知识推理提升多模态大语言模型在时间序列推理中...
Interpretable All-Type Audio Deepfake Detection with Audio L...
提出基于频率-时间强化学习的音频大语言模型，用于可解释的全类型音频深度伪造检测
Sample-Efficient Neurosymbolic Deep Reinforcement Learning
提出神经符号深度强化学习方法，提升样本效率和泛化能力，解决复杂环境下的序贯决策问...
Multi-Modal Data-Enhanced Foundation Models for Prediction a...
综述：多模态数据增强的无线网络预测与控制基础模型
Time-Scaling Is What Agents Need Now
提出时间尺度调整，提升智能体在认知约束下的深度推理与问题解决能力

▶

💬 cs.CL

自然语言 (VLA, Text-to-Motion)

📅 最新: 2026-01-06 📄 共 3168 篇

📊 领域分布

具身大模型 2540 RL算法与架构 534 机器人控制 46 视频提取与匹配 13 物理动画 10 空间感知与语义 8 生成式动作 8 动作重定向 6 交互与反应 2 空间感知 1

📆 最近更新

2026-01-06 (40篇) 2026-01-05 (19篇) 2026-01-02 (5篇) 2025-12-31 (11篇) 2025-12-29 (17篇) 2025-12-26 (7篇) 2025-12-24 (15篇) 更多... (168)

📝 最新论文

Limited Linguistic Diversity in Embodied AI Datasets
分析具身AI数据集的语言多样性，揭示指令重复性问题并提出改进方向。
Mitigating Prompt-Induced Hallucinations in Large Language M...
提出基于结构化推理的知识蒸馏链模型，缓解大语言模型中的提示诱导幻觉问题
Reducing Hallucinations in LLMs via Factuality-Aware Prefere...
提出F-DPO，通过事实感知偏好学习减少LLM中的幻觉问题
Window-based Membership Inference Attacks Against Fine-tuned...
提出基于窗口比较的WBC方法，提升针对微调大语言模型的成员推理攻击效果。
Who Laughs with Whom? Disentangling Influential Factors in H...
通过用户聚类和LLM分析，解耦幽默偏好中的影响因素

▶

⚙️ eess.SY

系统控制 (MPC, Dynamics)

📅 最新: 2026-01-06 📄 共 366 篇

📊 领域分布

机器人控制 168 RL算法与架构 79 生成式动作 42 物理动画 31 具身大模型 30 交互与反应 4 空间感知 4 其他 4 视频提取与匹配 2 动作重定向 1 空间感知与语义 1

📆 最近更新

2026-01-06 (2篇) 2026-01-05 (2篇) 2026-01-02 (1篇) 2025-12-31 (2篇) 2025-12-29 (3篇) 2025-12-24 (6篇) 2025-12-23 (1篇) 更多... (143)

📝 最新论文

Conditioning Aircraft Trajectory Prediction on Meteorologica...
提出一种基于物理信息的机器学习方法，利用气象数据提升飞机轨迹预测精度。
Hierarchical Preemptive Holistic Collaborative Systems for E...
提出分层抢占式整体协作框架Prollect，解决具身多智能体系统中的安全、可扩展...
Policy Optimization with Differentiable MPC: Convergence Ana...
提出基于可微MPC的策略优化方法，结合递归系统辨识，提升不确定性下的控制性能。
Machine Learning Guided Cooling Optimization for Data Center...
提出基于物理信息的机器学习框架，优化数据中心冷却能耗。
A formal theory on problem space as a semantic world model i...
形式化问题空间理论，为系统工程构建语义世界模型。

arXiv 中文要点汇总

🤖 cs.RO

📊 领域分布

📆 最近更新

📝 最新论文

👁️ cs.CV

📊 领域分布

📆 最近更新

📝 最新论文

🎨 cs.GR

📊 领域分布

📆 最近更新

📝 最新论文

🧠 cs.LG

📊 领域分布

📆 最近更新

📝 最新论文

🤔 cs.AI

📊 领域分布

📆 最近更新

📝 最新论文

💬 cs.CL

📊 领域分布

📆 最近更新

📝 最新论文

⚙️ eess.SY

📊 领域分布

📆 最近更新

📝 最新论文

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文