Social World Models

📄 arXiv: 2509.00559v1 📥 PDF

作者: Xuhui Zhou, Jiarui Liu, Akhila Yerukola, Hyunwoo Kim, Maarten Sap

分类: cs.AI

发布日期: 2025-08-30


💡 一句话要点

提出S3AP以提升AI对社交动态的理解能力

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 社交推理 结构化表示 部分可观测马尔可夫决策过程 社交动态预测 人工智能

📋 核心要点

  1. 现有AI系统在理解和推理社交互动的隐性动态方面存在显著不足,难以有效处理复杂的社交情境。
  2. 本文提出的S3AP通过结构化元组表示社交互动,基于POMDP设计,能够自动从自由文本中提取社交信息。
  3. 实验结果显示,S3AP在社交推理任务中实现了显著提升,尤其在理论心智推理和社交动态预测方面,达到了新的最优性能。

📝 摘要(中文)

人类在社交互动中能够直观地模拟隐含动态并推理他人的视角,而AI系统在自动构建和推理这些隐性社交背景方面存在困难。本文提出了一种新颖的结构化社交世界表示形式(S3AP),旨在帮助AI系统更有效地推理社交动态。S3AP基于部分可观测马尔可夫决策过程(POMDP)设计,将社交互动表示为结构化元组,包括状态、观察、代理行为和心理状态,这些可以从自由形式叙述或其他输入中自动诱导。实验表明,S3AP在五个社交推理任务中显著提升了大型语言模型(LLM)对社交叙述的理解能力,尤其在OpenAI的o1上,理论心智推理的性能提升达51%。此外,从这些结构化表示中诱导的社交世界模型在预测未来社交动态和改善代理决策方面表现出色,在SOTOPIA社交互动基准上提升了18%。

🔬 方法详解

问题定义:本文旨在解决AI系统在社交互动中缺乏有效推理能力的问题,现有方法难以处理隐性社交背景和动态。

核心思路:S3AP通过结构化社交世界表示,利用POMDP框架将社交互动转化为可推理的元组,增强AI对社交情境的理解和决策能力。

技术框架:S3AP的整体架构包括状态、观察、代理行为和心理状态四个主要模块,能够从自由文本中自动诱导这些信息,形成完整的社交世界模型。

关键创新:S3AP的主要创新在于其结构化表示形式,能够有效捕捉社交动态的复杂性,与传统方法相比,提供了更为系统的推理基础。

关键设计:在设计中,S3AP采用了特定的参数设置和损失函数,以优化社交动态的预测精度,同时结合了深度学习网络结构以增强模型的表达能力。

📊 实验亮点

实验结果显示,S3AP在五个社交推理任务中显著提升了大型语言模型的表现,特别是在理论心智推理任务中,性能提升达51%。此外,在SOTOPIA社交互动基准上,社交世界模型的预测能力提高了18%。

🎯 应用场景

该研究的潜在应用领域包括社交机器人、智能助手和在线社交平台等,能够提升这些系统在复杂社交场景中的表现。未来,S3AP有望推动更具社交意识的AI系统的发展,使其在处理人际互动时更加自然和有效。

📄 摘要(原文)

Humans intuitively navigate social interactions by simulating unspoken dynamics and reasoning about others' perspectives, even with limited information. In contrast, AI systems struggle to automatically structure and reason about these implicit social contexts. In this paper, we introduce a novel structured social world representation formalism (S3AP), designed to help AI systems reason more effectively about social dynamics. Following a POMDP-driven design, S3AP represents social interactions as structured tuples, such as state, observation, agent actions, and mental states, which can be automatically induced from free-form narratives or other inputs. We first show S3AP can help LLMs better understand social narratives across 5 social reasoning tasks (e.g., +51% improvement on FANToM's theory-of-mind reasoning with OpenAI's o1), reaching new state-of-the-art (SOTA) performance. We then induce social world models from these structured representations, demonstrating their ability to predict future social dynamics and improve agent decision-making, yielding up to +18% improvement on the SOTOPIA social interaction benchmark. Our findings highlight the promise of S3AP as a powerful, general-purpose representation for social world states, enabling the development of more socially-aware systems that better navigate social interactions.