🔔科技频道[奇诺分享-ccino.org]⚡️
3 小时前
雷锋网
ICML 2026:视觉自恢复 + 双奖励强化学习,提升受损图像理解
Telegraph
|
原文
Telegraph
ICML 2026:视觉自恢复 + 双奖励强化学习,提升受损图像理解 - 雷锋网
原文作者:公众号“Today读什么” 原文链接:https://mp.weixin.qq.com/s/BrsWJJAv22qHVa_gfv2cpg 一张照片被压缩、噪声、暗光和模糊破坏后,多模态模型仍然可以写出一段逻辑完整的分析。但分析越流畅,不代表它看到的证据越充分:车头朝向已经模糊,模型仍能解释车辆为何“直行”;公交车轮廓已经重叠,它依然可以自信地数出三辆。 过去的方法通常让视觉编码器适应噪声,或者让模型先用文字分析图像受到了什么破坏。Robust-U1 换了一条路线:**既然关键视觉信息已经丢…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia