※この記事はアフィリエイト広告を含みます
“正确”还是“偏好”?创意AI的新指标《人类创造力基准》
📰 新闻概述
- 评估维度的分离: 在创意评估中提出了新的指标《人类创造力基准 (HCB)》,旨在区分“收敛(共同的正确答案)”与“分歧(个人偏好)”。
- 现状的局限: 当前的AI模型擅长于输出“正确答案”,但发现并不存在能够根据用户“偏好(调味)”进行控制的模型。
- 模式崩溃的指摘: 指出许多模型在面对相同指令时,往往收敛到“平庸和平均”的设计(平均美学),缺乏个性。
💡 重要观点
- 在创意领域中并不存在“真实标准(绝对正确答案)”,因此评估者之间的“分歧”被定义为重要信号。
- 评估在“遵循提示(客观)”、“可用性(中间)”和“视觉吸引力(主观)”的光谱上进行。
- 桌面应用程序和着陆页面的评估更容易达成一致(收敛),而广告视频和品牌资产的评估则更容易出现分歧。
🦈 鲨鱼的眼(策展者视角)
以往的AI基准测试中,评估者的意见如果出现分歧,就会被视为“噪音”而进行平均化或剔除。但在创意的世界中,“每个人的偏好不同”是理所当然的! HCB的伟大之处在于重新将这种“分歧”视为“品味的多样性”,并赋予其积极的意义。如今的AI所输出的“看起来不错,但总让人觉得似曾相识的设计”,正是该指标所说的“模式崩溃”。专业人士所追求的并不是“平庸的平均”,而是“与自己感性相符的独特输出”!能够将这一点可视化实在是革命性的进展!
🚀 接下来会怎样?
不仅仅是输出“高质量的图像”,还将加速开发能够根据特定设计师的“风格”或企业的“品牌基调”来有意分岐和控制输出(操控性)的模型。平庸的AI将被淘汰,具备鲜明个性的AI将在未来受到青睐!
💬 鲨鱼视角的一句话
我只偏爱新鲜小鱼,但人类的偏好却非常复杂!AI也进入了一个阶段,不再是追求“人人都喜欢的优秀生”,而是追求“某个人的最爱”了呢!🦈🔥
📚 术语解析
- 模式崩溃 (Mode Collapse): AI无法生成多样化的输出,只能产生特定的“平庸模式”的现象。
- 收敛与分歧 (Convergence and Divergence): 评估者达成同一结论的称为收敛,而意见分歧的称为分歧。在HCB中,前者被视为“技术性正确”,后者被视为“个人偏好”。
- 操控性 (Steerability): 根据用户意图或特定风格,精准控制AI输出的能力。
信息来源: The Human Creativity Benchmark – Evaluating Generative AI in Creative Work