🔔科技频道[奇诺分享-ccino.org]⚡️
12 小时前
IT之家
小米开源可控视频音效生成模型 ControlFoley,让声音“按你想要的来”
Telegraph
|
原文
Telegraph
小米开源可控视频音效生成模型 ControlFoley,让声音“按你想要的来” - IT之家
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 ControlFoley 开源模型,面向视频同步音效生成中的“可控性”难题,统一支持文本引导视频配音、文本控制视频配音和参考音频控制视频配音三类任务。 ControlFoley 在多个视频音效生成任务上达到开源 SOTA 表现,在语义对齐、时间同步、声音质量以及多模态控制能力上取得全面提升。代码、模型权重、技术报告、在线 Demo 和开箱即用 Skill 均已开放。 给一段无声视频自动配上音效,已经不再是新鲜事。视频音效生成模型可以根据画面内容…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia