IT之家GPT-4.5 创造力比 GPT-4o 弱，浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准 Telegraph | 原文 | 🔔科技频道[奇诺分享-ccino.org]⚡️

12:23 · 2025年4月4日 · 周五

IT之家
GPT-4.5 创造力比 GPT-4o 弱，浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准 Telegraph | 原文

GPT-4.5 创造力比 GPT-4o 弱，浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准 - IT之家

近来风头正盛的 GPT-4.5，不仅在日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。当 GPT-4.5 在创意写作、教育咨询、设计提案等任务中展现出惊人的连贯性与创造力时，一个关键问题浮出水面：多模态大模型（MLLMs）的“创造力天花板”究竟在哪里？写一篇基于图片的短篇小说、分析一张复杂的教学课件、甚至设计一份用户界面…… 这些对于人类驾轻就熟的任务，对于现有的部分多模态大模型却往往是“高难动作”。但现有的评测基准首先难以衡量多模态大模型的输出是否具有创造性…

Powered by BroadcastChannel & Sepia