🔔科技频道[奇诺分享-ccino.org]⚡️
4 天前
机器之心
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型
Telegraph
|
原文
Telegraph
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型 - 机器之心
要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一直面临一个致命短板:缺乏稳定的场景记忆。镜头稍作移动再转回,眼前景物就可能「换了个世界」。 这一问题严重制约了视频生成技术在游戏、自动驾驶、具身智能等下游应用的落地。8 月初,Google DeepMind 发布的 Genie 3 引爆 AI 圈,以其在长视频生成中依旧保持极强场景一致性的能力,被视为世界模型领域的质变之作。不过遗憾的是,Genie 3 并未公开任何技术细节。 来自港大…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia