🔔科技频道[奇诺分享-ccino.org]⚡️
5 天前
机器之心
预测下一个像素还需要几年?谷歌:五年够了
Telegraph
|
原文
Telegraph
预测下一个像素还需要几年?谷歌:五年够了 - 机器之心
既然语言可以当序列来学,那图像能不能也当序列来学? 通过将图像表示为像素序列,先前的研究表明通过下一像素预测,可以以一种简单、端到端的方式同时学习视觉识别与生成。 从概念上讲,下一像素预测非常容易扩展,因为它是无监督学习:无需任何人工标注。同时,将图像表示为像素序列,也对图像结构施加了最少的归纳偏置。 然而,尽管像素级端到端建模在早期被证明是可行的,但这一范式近年来却不再流行。 其主要原因在于出现了计算效率更高的方法,例如:使用视觉 tokenizer 进行 patch 级别学习。 尽管研究重心已经发生…
Home
Blog
Discuss
Gsearch
Powered by
BroadcastChannel
&
Sepia