🔔科技频道[奇诺分享-ccino.org]⚡️
15:54 · 2025年3月14日 · 周五
机器之心
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
Telegraph
|
原文
Telegraph
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板 - 机器之心
本文来自港科与 MIT 教授团队。本文有两个共同一作:张鉴殊为武汉大学本科四年级,本篇为其在港科大访问期间完成,将于 2025 秋季前往美国西北大学攻读 CS PhD。姚栋宇目前就读于 CMU CS 系下的 MSCV 项目。 论文链接:https://arxiv.org/pdf/2502.12084 项目主页:https://vlm2-bench.github.io/ 当前,视觉语言模型(VLMs)的能力边界不断被突破,但大多数评测基准仍聚焦于复杂知识推理或专业场景。本文提出全新视角:如果一项能力对人类而言是…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia