cs.CV(2023-12-09)
📊 共 6 篇论文
🎯 兴趣领域导航
支柱一:机器人控制 (Robot Control) (2)
支柱九:具身大模型 (Embodied Foundation Models) (1)
支柱四:生成式动作 (Generative Motion) (1)
支柱三:空间感知与语义 (Perception & Semantics) (1)
支柱六:视频提取与匹配 (Video Extraction) (1)
🔬 支柱一:机器人控制 (Robot Control) (2 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | CoGS: Controllable Gaussian Splatting | CoGS:提出可控高斯溅射方法,实现动态场景元素的实时操控。 | manipulation 3D gaussian splatting gaussian splatting | ||
| 2 | Robo360: A 3D Omnispective Multi-Material Robotic Manipulation Dataset | Robo360:一个用于机器人操作的3D全视角多材质数据集 | manipulation world model representation learning |
🔬 支柱九:具身大模型 (Embodied Foundation Models) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 3 | Identifying and Mitigating Model Failures through Few-shot CLIP-aided Diffusion Generation | 提出基于少量样本CLIP辅助扩散生成框架,自动识别并缓解模型失效问题。 | large language model |
🔬 支柱四:生成式动作 (Generative Motion) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 4 | Perceptual Similarity guidance and text guidance optimization for Editing Real Images using Guided Diffusion Models | 提出双重引导扩散模型,用于真实图像编辑,保持编辑区域真实感和未编辑区域一致性 | classifier-free guidance |
🔬 支柱三:空间感知与语义 (Perception & Semantics) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 5 | R2-Talker: Realistic Real-Time Talking Head Synthesis with Hash Grid Landmarks Encoding and Progressive Multilayer Conditioning | 提出R2-Talker以解决实时人头合成效率与效果问题 | NeRF |
🔬 支柱六:视频提取与匹配 (Video Extraction) (1 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 6 | DPoser: Diffusion Model as Robust 3D Human Pose Prior | DPoser:提出基于扩散模型的鲁棒3D人体姿态先验,提升姿态相关任务性能 | human mesh recovery |