When Algorithms Meet Artists: Topic Modeling the AI-Art Debate, 2013-2025

📄 arXiv: 2508.03037v2 📥 PDF

作者: Ariya Mukherjee-Gandhi, Oliver Muellerklein

分类: cs.CL, cs.CY, cs.HC

发布日期: 2025-08-05 (更新: 2025-08-26)

备注: 23 pages, 7 figures, 8 tables


💡 一句话要点

提出基于BERTopic的方法以分析AI艺术辩论

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: AI艺术 主题建模 艺术家声音 媒体叙事 BERTopic 透明度 创意劳动

📋 核心要点

  1. 核心问题:艺术家在AI艺术辩论中的声音常被边缘化,主流媒体叙事与艺术家感知存在错位。
  2. 方法要点:研究采用BERTopic方法分析了439个文本摘录,识别出五个主题集群,揭示了技术术语的把关作用。
  3. 实验或效果:研究结果显示,艺术家的紧迫问题常被忽视,呼吁更透明的艺术家参与和表达。

📝 摘要(中文)

随着生成性人工智能不断重塑艺术创作和人类表达方式,受到直接影响的艺术家们对同意、透明度和创意劳动的未来提出了紧迫的关注。然而,艺术家的声音在主流公共和学术话语中常常被边缘化。本研究对2013年至2025年间围绕AI生成艺术的英语话语进行了为期十二年的分析,基于439个从意见文章、新闻报道、博客、法律文件和口述记录中提取的500字摘录。通过可重复的方法论,我们识别出五个稳定的主题集群,并揭示了艺术家感知与主流媒体叙事之间的错位。研究结果强调了技术术语的使用如何作为一种微妙的把关形式,常常使艺术家认为最紧迫的问题被忽视。我们的工作提供了一种基于BERTopic的方法论和多模态基线,为未来研究奠定基础,同时明确呼吁在不断发展的AI创意领域中更深入、透明的艺术家视角参与。

🔬 方法详解

问题定义:本研究旨在解决艺术家在AI艺术辩论中声音被边缘化的问题。现有方法未能有效捕捉艺术家的真实感知与主流媒体叙事之间的错位。

核心思路:论文通过分析大量文本数据,采用BERTopic方法识别主题集群,从而揭示艺术家与媒体之间的沟通障碍。这样的设计旨在提供一个可重复的方法论,促进对艺术家观点的深入理解。

技术框架:研究首先收集了439个500字的文本摘录,涵盖意见文章、新闻报道等多种来源。然后,利用BERTopic模型对文本进行主题建模,识别出五个稳定的主题集群。

关键创新:本研究的创新点在于将BERTopic方法应用于AI艺术辩论的分析中,揭示了技术术语如何作为把关机制,影响艺术家的声音被听见的机会。与现有方法相比,提供了更系统的分析框架。

关键设计:研究中使用的BERTopic模型通过聚类算法识别主题,关键参数设置包括主题数量和文本预处理方法,确保了分析的准确性和可重复性。

📊 实验亮点

研究结果表明,艺术家在AI艺术辩论中面临的关键问题常被主流媒体忽视,尤其是在技术术语的使用上。通过BERTopic方法,成功识别出五个主题集群,为未来的研究提供了新的视角和方法论基础。

🎯 应用场景

该研究的潜在应用领域包括艺术创作、文化政策制定和AI技术的伦理讨论。通过深入理解艺术家的观点,可以促进更具包容性的艺术创作环境,并推动政策制定者在技术发展中考虑艺术家的利益。

📄 摘要(原文)

As generative AI continues to reshape artistic production and alternate modes of human expression, artists whose livelihoods are most directly affected have raised urgent concerns about consent, transparency, and the future of creative labor. However, the voices of artists are often marginalized in dominant public and scholarly discourse. This study presents a twelve-year analysis, from 2013 to 2025, of English-language discourse surrounding AI-generated art. It draws from 439 curated 500-word excerpts sampled from opinion articles, news reports, blogs, legal filings, and spoken-word transcripts. Through a reproducible methodology, we identify five stable thematic clusters and uncover a misalignment between artists' perceptions and prevailing media narratives. Our findings highlight how the use of technical jargon can function as a subtle form of gatekeeping, often sidelining the very issues artists deem most urgent. Our work provides a BERTopic-based methodology and a multimodal baseline for future research, alongside a clear call for deeper, transparency-driven engagement with artist perspectives in the evolving AI-creative landscape.