🔔科技频道[奇诺分享-ccino.org]⚡️
4 天前
IT之家
DeepSeek 新论文剧透 V4 新框架:用闲置网卡加速智能体推理性能,打破 PD 分离瓶颈
Telegraph
|
原文
Telegraph
DeepSeek 新论文剧透 V4 新框架:用闲置网卡加速智能体推理性能,打破 PD 分离瓶颈 - IT之家
DeepSeek 这小子最精了,当全世界都在盯着他的 GitHub 仓库,等待 V4 时 —— 他和北大、清华在 ArXiv 悄咪咪地上了一篇论文,发布了一个全新的针对智能体的推理框架:DualPath。 而且就跟前几天曝出的算力话题相关。 DualPath 的核心在于解决 Agent 长文本推理场景下的 I/O 瓶颈,通过优化从外部存储加载 KV-Cache 的速度,确保计算资源不被存储读取拖累。 它改变了传统的存储至预填充引擎(Storage-to-Prefill)单路径加载模式,引入了存储至解码引擎(Storage…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia