🔔科技频道[奇诺分享-ccino.org]⚡️
4 小时前
雷锋网
GAIR Paper 106|追踪视觉 Token 的演化轨迹,实现无损压缩与 60% 推理加速|CVPR 2026
Telegraph
|
原文
Telegraph
GAIR Paper 106|追踪视觉 Token 的演化轨迹,实现无损压缩与 60% 推理加速|CVPR 2026 - 雷锋网
作者丨李傲 中国人民大学 近年来,以LLaVA、Qwen系列为代表的大视觉语言模型(LVLM)推动了多模态智能的发展,在视觉理解与推理任务中展现不错的表现。然而,其伴随着高昂的推理成本。面对高分辨率图像或者视频时,模型往往需要处理大量视觉Token,而这些Token会在整个推理过程中持续参与…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia