A(I)nimism: Re-enchanting the World Through AI-Mediated Object Interaction

📄 arXiv: 2509.25558v1 📥 PDF

作者: Diana Mykhaylychenko, Maisha Thasin, Dunya Baradari, Charmelle Mhungu

分类: cs.AI, cs.HC, cs.MA, cs.MM

发布日期: 2025-09-29


💡 一句话要点

A(I)nimism:通过AI中介的物体交互,探索万物有灵论的新可能

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 人机交互 人工智能 大型语言模型 万物有灵论 物体角色 情感计算 交互设计 GPT-4 Vision

📋 核心要点

  1. 现代技术常被视为冰冷机械,缺乏生命力,这与万物有灵论的观念相悖,该研究旨在探索如何利用AI弥合这一差距。
  2. A(I)nimism通过大型语言对象(LLO)构建物体角色,使用户能够以一种新的、更具情感连接的方式与日常物品互动。
  3. 该装置通过光、声音和触摸等多种感官反馈,营造出一种仪式般的体验,旨在唤起用户对物品的同情和反思。

📝 摘要(中文)

万物有灵论认为生物、植物、景观甚至工具都具有灵魂。这种观念长期以来通过仪式和道德实践塑造着人与非人之间的关系。现代工业社会通常将技术视为沉默和机械的,但人工智能(AI)的最新进展,尤其是大型语言模型(LLM),促使人们将内在生命赋予设备,并对其进行拟人化。本文介绍了一个名为A(I)nimism的交互式装置,旨在探索大型语言对象(LLO)如何调解与日常物品之间的万物有灵关系。该系统位于一个物理“门户”内,利用GPT-4 Vision、语音输入和基于记忆的代理来创建不断演变的物体角色。通过光、声音和触摸,以一种类似仪式的请求、对话和转换过程展开互动,旨在唤起同情、惊奇和反思。我们将该项目置于人类学视角、推测设计和精神人机交互的框架下。我们认为,AI的不透明性促成了万物有灵论的解释,使LLO能够重新赋予平凡事物以魅力,并引发关于能动性、责任和设计的新问题。

🔬 方法详解

问题定义:论文旨在探索如何利用人工智能,特别是大型语言模型,来重新赋予日常物品以“灵魂”,从而挑战现代社会对技术的传统认知,并促进人与物之间更具情感连接的互动。现有方法通常将技术视为工具,缺乏对物品内在价值和情感意义的关注。

核心思路:论文的核心思路是利用大型语言对象(LLO)作为中介,构建具有独特个性的“物体角色”。通过让用户与这些角色进行互动,激发用户对物品的同情、惊奇和反思,从而重新赋予物品以“灵魂”。这种设计旨在挑战人们对技术的固有认知,并探索人与物之间新的关系模式。

技术框架:A(I)nimism系统的整体架构包含以下几个主要模块:1) 物理门户:作为用户与系统交互的界面;2) GPT-4 Vision:用于识别和理解用户提供的物品;3) 语音输入:用于接收用户的请求和问题;4) 基于记忆的代理:用于构建和维护物体角色,并生成相应的回应;5) 感官反馈:通过光、声音和触摸等方式,向用户提供反馈。整个流程包括用户请求、系统识别、角色生成、对话互动和感官反馈等环节。

关键创新:该研究的关键创新在于将大型语言模型应用于物体角色构建,并将其与物理交互相结合,创造了一种全新的互动体验。与传统的基于规则或预定义脚本的交互方式不同,A(I)nimism系统能够根据用户的输入和物品的特性,动态生成个性化的回应,从而使互动更具自然性和情感性。

关键设计:系统使用GPT-4 Vision进行图像识别,并利用其强大的语言生成能力来构建物体角色。基于记忆的代理用于存储和检索与物品相关的知识和用户互动历史,从而使角色能够随着时间的推移而不断演变。感官反馈的设计旨在增强用户的沉浸感和情感体验,例如,通过改变光的颜色和强度来表达角色的情绪,或通过触摸来模拟角色的触感。

📊 实验亮点

由于论文侧重于概念验证和交互体验设计,而非具体的性能指标,因此没有提供量化的实验结果。其亮点在于成功构建了一个可交互的A(I)nimism装置,并通过用户体验评估,验证了该装置在唤起用户同情、惊奇和反思方面的潜力。未来的研究可以进一步探索不同设计参数对用户体验的影响,并进行更严格的量化评估。

🎯 应用场景

该研究具有广泛的应用前景,例如,可用于博物馆、艺术展览等场所,增强观众与展品之间的互动体验;也可应用于教育领域,帮助学生更好地理解和欣赏艺术品;此外,还可用于产品设计,创造更具情感价值和个性化的产品。该研究的未来影响在于,它可能改变人们对技术的认知,并促进人与物之间更具意义和情感连接的互动。

📄 摘要(原文)

Animist worldviews treat beings, plants, landscapes, and even tools as persons endowed with spirit, an orientation that has long shaped human-nonhuman relations through ritual and moral practice. While modern industrial societies have often imagined technology as mute and mechanical, recent advances in artificial intelligence (AI), especially large language models (LLMs), invite people to anthropomorphize and attribute inner life to devices. This paper introduces A(I)nimism, an interactive installation exploring how large language objects (LLOs) can mediate animistic relationships with everyday things. Housed within a physical 'portal', the system uses GPT-4 Vision, voice input, and memory-based agents to create evolving object-personas. Encounters unfold through light, sound, and touch in a ritual-like process of request, conversation, and transformation that is designed to evoke empathy, wonder, and reflection. We situate the project within anthropological perspectives, speculative design, and spiritual HCI. AI's opacity, we argue, invites animistic interpretation, allowing LLOs to re-enchant the mundane and spark new questions of agency, responsibility, and design.