🔔科技频道[奇诺分享-ccino.org]⚡️
3 天前
机器之心
腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多
Telegraph
|
原文
Telegraph
腾讯混元大模型核心论文曝光:Scaling law、MoE、合成数据以及更多 - 机器之心
随着 ChatGPT 的横空出世,大语言模型能力开始在各项领域(传统 NLP、数学、代码等)得到广泛验证,目前已经深刻影响到腾讯混元团队日常生活的方方面面。腾讯混元团队长期致力于大语言模型的探索之路,大模型生产的各个环节开展研究创新以提升其基础能力,并将混元大模型的能力跟业务做深度结合,让生成式 AI 成为业务增长的放大器。 大语言模型的设计、训练和优化是一项复杂的系统工程,涉及到模型结构创新、训练范式优化、数据获取和评测设计、关键能力提升和挑战性问题的解决等方方面面。腾讯混元团队在大模型研究探索中积累…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia