arXiv 中文要点汇总
🤖 cs.RO
机器人📊 领域分布
机器人控制 2094
RL算法与架构 300
具身大模型 233
空间感知与语义 177
空间感知 94
动作重定向 17
视频提取与匹配 15
物理动画 15
生成式动作 14
其他 13
交互与反应 2
📆 最近更新
📝 最新论文
- UniBiDex: A Unified Teleoperation Framework for Robotic Bima...
UniBiDex:用于灵巧双臂机器人遥操作的统一框架 - LaST$_{0}$: Latent Spatio-Temporal Chain-of-Thought for Robo...
LaST$_{0}$: 基于隐空间时空链式思考的机器人视觉-语言-动作模型 - SKATER: Synthesized Kinematics for Advanced Traversing Effic...
提出基于轮滑摆动步态的人形机器人运动控制方法,提升能量效率和关节寿命 - Optimizing Path Planning using Deep Reinforcement Learning f...
针对精准农业UGV,提出基于深度强化学习的路径规划优化方法 - Multiagent Reinforcement Learning with Neighbor Action Estim...
提出基于邻居动作估计的多智能体强化学习框架,解决通信受限场景下的协作问题。
👁️ cs.CV
视觉📊 领域分布
具身大模型 1262
RL算法与架构 1041
空间感知与语义 797
空间感知 463
机器人控制 346
生成式动作 134
视频提取与匹配 132
物理动画 104
动作重定向 83
交互与反应 56
视频提取与匹配 6
其他 3
📆 最近更新
📝 最新论文
- ProFuse: Efficient Cross-View Context Fusion for Open-Vocabu...
ProFuse:高效跨视角上下文融合的开放词汇3D高斯溅射 - GeM-VG: Towards Generalized Multi-image Visual Grounding wit...
提出GeM-VG,一个用于广义多图视觉定位的多模态大语言模型。 - SOVABench: A Vehicle Surveillance Action Retrieval Benchmark...
提出SOVABench车辆监控行为检索基准,用于评估多模态大语言模型 - OceanSplat: Object-aware Gaussian Splatting with Trinocular ...
OceanSplat:利用三目一致性的水下场景物体感知高斯溅射重建 - Forge-and-Quench: Enhancing Image Generation for Higher Fide... 🔗
提出Forge-and-Quench框架,利用理解增强图像生成保真度
🎨 cs.GR
图形学📊 领域分布
空间感知与语义 96
机器人控制 39
生成式动作 23
具身大模型 18
RL算法与架构 16
物理动画 15
空间感知 8
视频提取与匹配 7
动作重定向 2
交互与反应 2
视频提取与匹配 1
📆 最近更新
📝 最新论文
- LooseRoPE: Content-aware Attention Manipulation for Semantic...
LooseRoPE:通过内容感知注意力操纵实现语义协调的图像编辑 - GenAI-DrawIO-Creator: A Framework for Automated Diagram Gene...
GenAI-DrawIO-Creator:利用LLM自动生成draw.io图表的... - The perceptual gap between video see-through displays and na...
量化VST头显与自然视觉的感知差距,揭示低光环境下性能退化 - SketchRodGS: Sketch-based Extraction of Slender Geometries f...
SketchRodGS:基于草图从高斯溅射场景中提取细长几何体用于动画 - Spatiotemporal Detection and Uncertainty Visualization of At...
提出一种时空检测与不确定性可视化框架,用于分析大气阻塞事件,助力气候风险评估。
🧠 cs.LG
机器学习 (RL, Diffusion, World Model)📊 领域分布
RL算法与架构 967
具身大模型 866
机器人控制 105
物理动画 71
生成式动作 24
交互与反应 19
空间感知与语义 7
动作重定向 7
空间感知 4
视频提取与匹配 3
其他 1
📆 最近更新
📝 最新论文
- MPM-LLM4DSE: Reaching the Pareto Frontier in HLS with Multim... 🔗
MPM-LLM4DSE:利用多模态学习和LLM驱动探索实现HLS帕累托前沿优化 - Precision over Diversity: High-Precision Reward Generalizes ...
高精度奖励胜过多样性:提升指令跟随的鲁棒性与泛化能力 - GPU-Accelerated INT8 Quantization for KV Cache Compression i...
提出基于GPU加速的INT8量化方法,用于压缩大语言模型中的KV缓存。 - Intraday spatiotemporal PV power prediction at national scal...
提出基于卫星的太阳能预测模型,实现国家尺度内光伏功率时空预测 - Nightmare Dreamer: Dreaming About Unsafe States And Planning...
提出 Nightmare Dreamer,通过预测不安全状态进行安全强化学习。
🤔 cs.AI
人工智能 (Agents, Planning)📊 领域分布
具身大模型 1350
RL算法与架构 463
机器人控制 104
空间感知与语义 23
物理动画 18
生成式动作 13
交互与反应 12
动作重定向 8
视频提取与匹配 6
空间感知 3
📆 最近更新
📝 最新论文
- ThinkDrive: Chain-of-Thought Guided Progressive Reinforcemen...
ThinkDrive:基于思维链引导的渐进式强化学习微调,用于自动驾驶 - SciIF: Benchmarking Scientific Instruction Following Towards...
SciIF:提出科学指令遵循基准,评估LLM在科学推理中的严谨性 - Bridging Temporal and Textual Modalities: A Multimodal Frame...
提出一种多模态框架,用于自动化云故障根因分析,弥合时间序列和文本模态之间的鸿沟。 - Know Thy Enemy: Securing LLMs Against Prompt Injection via D...
提出InstruCoT,通过多样数据合成和指令级CoT学习增强LLM抵御Prom... - ConMax: Confidence-Maximizing Compression for Efficient Chai...
提出ConMax,通过置信度最大化压缩CoT推理链,提升效率。
💬 cs.CL
自然语言 (VLA, Text-to-Motion)📊 领域分布
具身大模型 2611
RL算法与架构 549
机器人控制 47
视频提取与匹配 13
物理动画 10
空间感知与语义 8
生成式动作 8
动作重定向 6
交互与反应 2
空间感知 1
📆 最近更新
📝 最新论文
- Hán Dān Xué Bù (Mimicry) or Qīng Chū Yú Lán (Mastery)? A Cog...
推理蒸馏无法有效传递大语言模型的人类认知对齐特性 - Qwen3-VL-Embedding and Qwen3-VL-Reranker: A Unified Framewor...
提出Qwen3-VL系列以解决多模态检索与排序问题 - SemPA: Improving Sentence Embeddings of Large Language Model...
SemPA:通过语义偏好对齐提升大语言模型的句子嵌入表示 - CRANE: Causal Relevance Analysis of Language-Specific Neuron...
CRANE:通过因果相关性分析多语言大模型中特定语言神经元 - Compositional Steering of Large Language Models with Steerin...
提出基于Steering Tokens的组合式大语言模型控制方法,实现多重行为的...
⚙️ eess.SY
系统控制 (MPC, Dynamics)📊 领域分布
机器人控制 173
RL算法与架构 81
生成式动作 42
物理动画 33
具身大模型 31
交互与反应 4
空间感知 4
其他 4
视频提取与匹配 2
动作重定向 1
空间感知与语义 1
📆 最近更新
📝 最新论文
- Safe Reinforcement Learning Beyond Baseline Control: A Hiera...
提出一种用于空间三角形系绳编队系统的分层强化学习安全控制框架 - Online Bayesian Learning of Agent Behavior in Differential G...
提出一种在线贝叶斯方法,用于差分博弈中智能体行为识别。 - On-Device Deep Reinforcement Learning for Decentralized Task...
提出基于设备端深度强化学习的去中心化任务卸载方案,优化边缘计算性能。 - Multi-agent Optimization of Non-cooperative Multimodal Mobil...
提出多智能体优化框架,解决非合作多模式出行系统中的定价与补贴问题 - Accounting for Optimal Control in the Sizing of Isolated Hyb...
提出基于模仿学习的混合可再生能源系统容量优化方法,考虑最优控制。