机器之心上下文记忆力媲美Genie3，且问世更早：港大和可灵提出场景一致的交互式视频世界模型 Telegraph | 原文 | 🔔科技频道[奇诺分享-ccino.org]⚡️

机器之心
上下文记忆力媲美Genie3，且问世更早：港大和可灵提出场景一致的交互式视频世界模型 Telegraph | 原文

上下文记忆力媲美Genie3，且问世更早：港大和可灵提出场景一致的交互式视频世界模型 - 机器之心

要让视频生成模型真正成为模拟真实物理世界的「世界模型」，必须具备长时间生成并保留场景记忆的能力。然而，交互式长视频生成一直面临一个致命短板：缺乏稳定的场景记忆。镜头稍作移动再转回，眼前景物就可能「换了个世界」。这一问题严重制约了视频生成技术在游戏、自动驾驶、具身智能等下游应用的落地。8 月初，Google DeepMind 发布的 Genie 3 引爆 AI 圈，以其在长视频生成中依旧保持极强场景一致性的能力，被视为世界模型领域的质变之作。不过遗憾的是，Genie 3 并未公开任何技术细节。来自港大…

Powered by BroadcastChannel & Sepia