🔔科技频道[奇诺分享-ccino.org]⚡️
3 天前
机器之心
开源多模态推理「破壁」时刻:MMFineReason助力4B逆袭30B
Telegraph
|
原文
Telegraph
开源多模态推理「破壁」时刻:MMFineReason助力4B逆袭30B - 机器之心
长期以来,开源多模态模型在复杂推理任务上,始终与 GPT-4o、Gemini 等顶尖闭源模型存在一道难以逾越的鸿沟。 社区开发者们逐渐意识到,核心痛点或许不在于模型架构的精进或者模型参数的规模。真正的瓶颈,在于高质量、思维链(CoT)密集的推理数据极度匮乏。 在纯文本领域,DeepSeek-R1 的成功已验证了高质量后训练数据(Post-training Data)的威力,但在多模态领域,我们面对的是横亘在眼前的「两座大山」: 数据失衡:现有开源多模态数据仍以简单 VQA 与自然图像为主,而对于真正具有高推理价值的数据,如…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia