谷歌大脑:像BigGAN那样生成高清大图不一定需要

时间: 2019-03-09

然而,实际上大部分数据是未标注的,而标注通常成本较高,还容易出错。诚然无监督图像生成近期取得了一些进展,但就样本质量而言,条件模型和无监督模型之间的差距仍是很大的。

论文 :High-Fidelity Image Generation With Fewer Labels

本文应用生成对抗网络,大大缩小了前提模型跟无监督模型在高保真图像生成方面的差距。本文运用了两个简单但富强的概念:

原版的 GAN 是一种无监督学习,咱们只有准备大量切实数据就行了。而如果要像 BigGAN 那样在 ImageNet 上生成高保真度的图像,咱们还是需要大量类别信息。本研究介绍了如何在不标注或有少量标注数据的情况下生成高保真图像,这大大缩小了条件GAN 与无监督 GAN 的差距。

本文贡献如下:

图 1:基线方式跟本文提出方法的 FID 得分。垂直线表示利用了所有标注数据的基线(BigGAN)。本文提出的措施(S^3GAN)仅用 10% 的标注数据就可能媲美当前最佳水平的基线模型,用 20% 的标注数据就超过了基线。

论文地址:https://arxiv.org/abs/1903.02271

正如 GoodFellow 所言,只管 GAN 本身是无监视的,但高保真自然图像的生成(通常在 ImageNet 上练习)取决于是否访问大批标注数据。这并不奇怪,因为标签会在训练过程中引入丰富的辅助信息,从而有效地将极具挑战性的图像天生义务分成语义上有意思的子任务。


      友情链接:
  • Copyright 2018-2021 金多宝论坛 版权所有,未经授权,禁止转载。