机器之心ICLR 2026 | CineTrans: 首个转场可控的多镜头视频生成模型，打破闭源技术壁垒 Telegraph | 原文 | 🔔科技频道[奇诺分享-ccino.org]⚡️

机器之心
ICLR 2026 | CineTrans: 首个转场可控的多镜头视频生成模型，打破闭源技术壁垒 Telegraph | 原文

ICLR 2026 | CineTrans: 首个转场可控的多镜头视频生成模型，打破闭源技术壁垒 - 机器之心

本文一作吴晓雪目前是复旦-上海人工智能实验室的联培博士生，目前的研究方向是可控多镜头生成、长视频生成。随着视频生成模型的快速发展，其在画面质量、条件控制、美学表现上都已表现出影视级效果。然而，影视级长视频往往并非为单个镜头的无限延续，而是具有转场的多镜头序列（Multi-shot Sequence）。闭源模型 Sora2、Veo3 中多镜头视频已经能够表现出惊艳的效果。如何使生成的视频带有自然的转场，如何指定转场的位置，如何令多个镜头形成丰富的语义流信号，是视频生成模型在未来所面临的新挑战。针对这…

Powered by BroadcastChannel & Sepia