🔔科技频道[奇诺分享-ccino.org]⚡️
3 小时前
IT之家
MiniMax 不认马嘉祺?稀宇科技公布大模型“失语”原因:特定词元后训练不足导致
Ithome
MiniMax 不认马嘉祺?稀宇科技公布大模型“失语”原因:特定词元后训练不足导致 - IT之家
稀宇科技(MiniMax)发现其 M2 模型无法正确输出“马嘉祺”等特定人名,根源在于后训练数据中某些词元(如“嘉祺”)样本极少,导致其生成概率被高频词元“挤压”。团队通过全词表合成数据修复,使模型性能显著提升。这暴露了大模型训练中词元覆盖不均衡的普遍性问题。#AI 大模型##稀宇科技#
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia