Design Generative AI for Practitioners: Exploring Interaction Approaches Aligned with Creative Practice

📄 arXiv: 2603.03074v1 📥 PDF

作者: Xiaohan Peng, Wendy E. Mackay, Janin Koch

分类: cs.HC, cs.AI

发布日期: 2026-03-03

备注: Accepted to ACM CHI 2026 Workshop on Bidirectional Human-AI Alignment


💡 一句话要点

为设计从业者设计生成式AI:探索与创造性实践对齐的交互方法

🎯 匹配领域: 支柱一:机器人控制 (Robot Control)

关键词: 生成式AI 人机交互 设计实践 创造性支持 动态对齐

📋 核心要点

  1. 现有生成式AI交互方式(如提示词工程)迫使设计师进行不自然的口头推理,与设计师的视觉思维习惯相悖。
  2. 论文提出三种交互方法,在设计流程的不同阶段分配控制权,使AI输出更好地与设计师意图对齐。
  3. 研究表明,AI的角色应根据设计师的需求和创作阶段动态调整,以实现最佳的创作效果。

📝 摘要(中文)

设计是一个非线性的、反思性的过程,从业者通过视觉、语义和其他表达性材料来探索、迭代和完善想法。随着生成式AI(GenAI)融入专业设计实践,传统侧重于提示或整图操作的交互方法可能使AI输出与设计师的意图不一致,迫使视觉思考者进行口头推理或事后调整。本文提出了DesignPrompt、FusAIn和DesignTrace三种交互方法,将控制权分配到意图、输入和过程的不同阶段,使设计师能够在交互的不同阶段指导AI对齐。进一步认为,对齐是一种动态协商,AI根据设计师的工具性和启发性需求以及创作阶段,采取主动或被动角色。

🔬 方法详解

问题定义:现有生成式AI在设计领域的应用,主要依赖于提示词工程或全局图像编辑,这与设计师的创作流程和思维方式存在错位。设计师通常依赖视觉探索和迭代,而现有方法迫使他们将视觉想法转化为语言描述,或者在生成结果后进行繁琐的调整,效率低下且难以充分发挥创造力。

核心思路:论文的核心在于将AI的控制权分散到设计的不同阶段,包括意图表达、输入方式和过程控制。通过更灵活的交互方式,使AI能够更好地理解和响应设计师的意图,从而实现更高效、更自然的创作流程。这种思路强调AI与设计师之间的动态协商,AI的角色根据设计师的需求和创作阶段进行调整。

技术框架:论文提出了三个具体的交互方法:DesignPrompt、FusAIn和DesignTrace。DesignPrompt侧重于通过更直观的视觉提示来引导AI生成;FusAIn则允许设计师在设计过程中融合AI生成的元素;DesignTrace则关注于记录和追踪设计过程,以便更好地理解和控制AI的行为。这三个方法并非孤立存在,而是可以根据具体的设计需求进行组合和调整。

关键创新:论文的关键创新在于提出了“动态对齐”的概念,即AI与设计师之间的对齐不是一个静态的过程,而是一个动态的协商过程。AI的角色可以根据设计师的需求和创作阶段进行调整,例如,在早期阶段,AI可以扮演启发者的角色,提供新的想法和灵感;在后期阶段,AI可以扮演执行者的角色,帮助设计师快速实现具体的设计方案。

关键设计:论文中提到的三种交互方法都包含具体的设计细节。例如,DesignPrompt可能涉及自定义的视觉提示界面和算法,FusAIn可能涉及图像融合和编辑的技术,DesignTrace可能涉及设计过程的记录和分析方法。具体的参数设置、损失函数和网络结构等技术细节在论文中可能没有详细描述,需要进一步查阅相关文献或联系作者。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

论文通过提出DesignPrompt、FusAIn和DesignTrace三种交互方法,展示了在不同设计阶段如何更有效地引导生成式AI。虽然论文中没有提供具体的性能指标或对比基线,但其核心价值在于提出了与设计师创作流程更契合的交互范式,为未来的研究方向提供了有益的启示。

🎯 应用场景

该研究成果可应用于各种设计领域,如平面设计、UI/UX设计、工业设计等。通过更自然、更高效的交互方式,生成式AI可以成为设计师更有力的助手,帮助他们更快地探索创意、实现想法,并提升设计质量。未来,这种动态对齐的交互模式有望成为生成式AI在设计领域的主流趋势。

📄 摘要(原文)

Design is a non-linear, reflective process in which practitioners engage with visual, semantic, and other expressive materials to explore, iterate, and refine ideas. As Generative AI (GenAI) becomes integrated into professional design practice, traditional interaction approaches focusing on prompts or whole-image manipulation can misalign AI output with designers' intent, forcing visual thinkers into verbal reasoning or post-hoc adjustments. We present three interaction approaches from DesignPrompt, FusAIn, and DesignTrace that distribute control across intent, input, and process, enabling designers to guide AI alignment at different stages of interaction. We further argue that alignment is a dynamic negotiation, with AI adopting proactive or reactive roles according to designers' instrumental and inspirational needs and the creative stage.