“正确”还是“偏好”？创意AI的新指标《人类创造力基准》

#HumanCreativityBenchmark #设计AI #模式崩溃

※この記事はアフィリエイト広告を含みます

“正确”还是“偏好”？创意AI的新指标《人类创造力基准》

📰 新闻概述

评估维度的分离: 在创意评估中提出了新的指标《人类创造力基准 (HCB)》，旨在区分“收敛（共同的正确答案）”与“分歧（个人偏好）”。
现状的局限: 当前的AI模型擅长于输出“正确答案”，但发现并不存在能够根据用户“偏好（调味）”进行控制的模型。
模式崩溃的指摘: 指出许多模型在面对相同指令时，往往收敛到“平庸和平均”的设计（平均美学），缺乏个性。

💡 重要观点

在创意领域中并不存在“真实标准（绝对正确答案）”，因此评估者之间的“分歧”被定义为重要信号。
评估在“遵循提示（客观）”、“可用性（中间）”和“视觉吸引力（主观）”的光谱上进行。
桌面应用程序和着陆页面的评估更容易达成一致（收敛），而广告视频和品牌资产的评估则更容易出现分歧。

🦈 鲨鱼的眼（策展者视角）

以往的AI基准测试中，评估者的意见如果出现分歧，就会被视为“噪音”而进行平均化或剔除。但在创意的世界中，“每个人的偏好不同”是理所当然的！ HCB的伟大之处在于重新将这种“分歧”视为“品味的多样性”，并赋予其积极的意义。如今的AI所输出的“看起来不错，但总让人觉得似曾相识的设计”，正是该指标所说的“模式崩溃”。专业人士所追求的并不是“平庸的平均”，而是“与自己感性相符的独特输出”！能够将这一点可视化实在是革命性的进展！

🚀 接下来会怎样？

不仅仅是输出“高质量的图像”，还将加速开发能够根据特定设计师的“风格”或企业的“品牌基调”来有意分岐和控制输出（操控性）的模型。平庸的AI将被淘汰，具备鲜明个性的AI将在未来受到青睐！

💬 鲨鱼视角的一句话

我只偏爱新鲜小鱼，但人类的偏好却非常复杂！AI也进入了一个阶段，不再是追求“人人都喜欢的优秀生”，而是追求“某个人的最爱”了呢！🦈🔥

📚 术语解析

模式崩溃 (Mode Collapse): AI无法生成多样化的输出，只能产生特定的“平庸模式”的现象。
收敛与分歧 (Convergence and Divergence): 评估者达成同一结论的称为收敛，而意见分歧的称为分歧。在HCB中，前者被视为“技术性正确”，后者被视为“个人偏好”。
操控性 (Steerability): 根据用户意图或特定风格，精准控制AI输出的能力。

信息来源: The Human Creativity Benchmark – Evaluating Generative AI in Creative Work