🔔科技频道[奇诺分享-ccino.org]⚡️
13:02 · 2025年3月4日 · 周二
IT之家
OpenAI GPT-4.5 登顶 6 小时即失守,xAI Grok-3 上演 1 分逆袭
Telegraph
|
原文
Telegraph
OpenAI GPT-4.5 登顶 6 小时即失守,xAI Grok-3 上演 1 分逆袭 - IT之家
基础模型竞争又紧张刺激起来了! GPT-4.5 刚登顶竞技场且全任务分类第一名,6 小时后总榜就被马斯克的新版 Grok-3 反超。 两者都是获得 3000 + 票数,总分 1412:1411 只差一分。 目前 Grok-3 总分第一,只在总体带风格控制、困难提示词带风格控制和略输 GPT-4.5 一点。 DeepSeek-R1 总分第 6,数学和困难提示词带风格控制分项与 GPT-4.5 并列第一。 也有用户对此结果产生了怀疑,仅仅 6 个小时就能发生如此大的变化吗? 有人解释原因在于,大模型竞技场有…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia