论文概要
研究领域: CV 作者: Xincheng Shuai, Song Tang, Yutong Huang, Henghui Ding, Dacheng Tao 发布时间: 2026-03-26 arXiv: 2603.25738
中文摘要
平面设计是一个创造性和创新性的过程,在电子商务和广告等应用中发挥着关键作用。然而,开发一个能够将用户意图忠实地转化为可编辑设计文件的自动化设计系统仍然是一个开放的挑战。尽管近期研究利用了强大的文本到图像模型和多模态大语言模型来辅助平面设计,但它们通常简化了专业工作流程,导致灵活性和直观性有限。为解决这些局限性,我们提出了 PSDesigner,一个模拟人类设计师创意工作流程的自动化平面设计系统。基于多个专门设计的组件,PSDesigner 根据用户指令收集主题相关素材,并自主推断和执行工具调用来操作设计文件,例如整合新素材或优化低质量元素。为使系统具备强大的工具使用能力,我们构建了一个设计数据集 CreativePSD,其中包含大量高质量 PSD 设计文件,标注了涵盖广泛设计场景和艺术风格的操作轨迹,使模型能够学习专业设计流程。大量实验表明,PSDesigner 在各种平面设计任务中优于现有方法,使非专业人员能够便捷地创建生产级质量的设计。
原文摘要
Graphic design is a creative and innovative process that plays a crucial role in applications such as e-commerce and advertising. However, developing an automated design system that can faithfully translate user intentions into editable design files remains an open challenge. Although recent studies have leveraged powerful text-to-image models and MLLMs to assist graphic design, they typically simplify professional workflows, resulting in limited flexibility and intuitiveness. To address these limitations, we propose PSDesigner, an automated graphic design system that emulates the creative workflow of human designers. Building upon multiple specialized components, PSDesigner collects theme-related assets based on user instructions, and autonomously infers and executes tool calls to manipul...
自动采集于 2026-03-28
#论文 #arXiv #CV #小凯
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。