cs.CV(2025-11-02)
📊 共 4 篇论文 | 🔗 2 篇有代码
🎯 兴趣领域导航
🔬 支柱三:空间感知 (Perception & SLAM) (4 篇)
| # | 题目 | 一句话要点 | 标签 | 🔗 | ⭐ |
|---|---|---|---|---|---|
| 1 | GeoToken: Hierarchical Geolocalization of Images via Next Token Prediction | GeoToken:通过预测地理位置Token序列实现图像的层级地理定位 | localization | ✅ | |
| 2 | GraphGeo: Multi-Agent Debate Framework for Visual Geo-localization with Heterogeneous Graph Neural Networks | 提出GraphGeo框架,利用异构图神经网络进行多智能体辩论,提升视觉地理定位精度 | localization | ||
| 3 | A Unified Reasoning Framework for Holistic Zero-Shot Video Anomaly Analysis | 提出统一推理框架,实现零样本视频异常事件的整体分析 | localization | ✅ | |
| 4 | Occlusion-Aware Diffusion Model for Pedestrian Intention Prediction | 提出遮挡感知扩散模型,解决行人意图预测中遮挡场景下的不完整观测问题。 | navigation |