🔔科技频道[奇诺分享-ccino.org]⚡️

ICLR 2026｜把LLM Embedding Model算力瓶颈，从Query侧彻底移走，LightRetriever来了 - 机器之心

近年来，大模型文本检索（LLM-based Text Retrieval）技术发展迅猛，SOTA 的 LLM Embedding Model 参数量普遍在 7B 以上，相关性搜索性能提升的同时，部署成本也大幅增长。众所周知，LLM Embedding Model 是一种对称式双塔结构，Query 和 Doc 侧常共享同一个完整的 LLM。但一个长期被忽视的问题是：线上推理中，查询端（Query）真的需要和文档端（Document）一样 “重” 的大模型吗？在我们最新的研究论文 LightRetriever…