twitter怎么看赞过的（twitter不看别人的赞）

twitter引流推广4年前发布最强海外脚本-Facebook18.com

2,245 0

熬煮书栗子乾明发自凹非寺

量子位报道 | 公众号 QbitAI

当前生成图像蕞逼真的BigGAN被超越了！

出手的，是谷歌大脑和苏黎世联邦理工学院。他们提出了新一代GAN：S³GAN。

它们生成的照片，都是真假难辨。

下面这两只蝴蝶，哪只更生动？

两张风景照片，哪张更真实？

难以抉择也正常，反正都是假的。上面的照骗，都是左边出自S³GAN，右边的出自BigGAN之手。

它们还有更多作品：

至于哪些是S³GAN，答案文末揭晓。

肉眼难分高下，就用数据说话。跑个FID得分，分值越低，就表示这些照骗，越接近人类认识里的真实照片——

S³GAN是8.0分，而BigGAN是8.4分。新选手略微胜出。

你可还记得BigGAN问世之初，直接将图像生成的逼真度提高了一个Level，引来Twitter上花样赞赏？

如今它不止被超越，而且是被轻松超越。

“轻松”在哪呢？

S³GAN达到这么好的效果，只用了10%的人工标注数据。而老前辈BigGAN，训练所用的数据100%是人工标注过的。

如果用上20%的标注数据，S³GAN的效果又会更上一层楼。

标注数据的缺乏，已经是帮GAN提高生成能力，拓展使用场景的一大瓶颈。如今，这个瓶颈已经几乎被打破。

现在的S³GAN，只经过了ImageNet的实验，是实现用更少标注数据训练生成高保真图像的弟一步。

接下来，作者们想要把这种技术应用到“更大”和“更多样化”的数据集中。

不用标注那么多

为什么训练GAN生成图像，需要大量数据标注呢？

GAN有生成器、判别器两大组件。

其中判别器要不停地识破假图像，激励生成器拿出更逼真的图像。

而图像的标注，就是给判别器做判断依据的。比如，这是真的猫，这是真的狗，这是真的汉堡……这是假图。

可是，没有那么多标注数据怎么办？

谷歌和ETH苏黎世的研究人员，决定训练AI自己标注图像，给判别器食用。

自监督 vs 半监督

要让判别器自己标注图像，有两种方法。

一是自监督方法，就是给判别器加一个特征提取器，从没有标注的真实训练数据里面，学到它们的表征。

对这个表征做聚类，然后把聚类的分配结果，当成标注来用。

这里的训练，用的是自监督损失函数。

二是半监督方法，也要做特征提取器，但比上一种方法复杂一点点。

在训练集的一个子集已经标注过的情况下，根据这些已知信息来学习表征，同时训练一个线性分类器。

这样，损失函数会在自监督的基础上，再加一项半监督的交叉熵损失。

预训练了特征提取器，就可以拿去训练GAN了。这个用一小部分已知标注养成的GAN，叫做S²GAN。

不过，预训练也不是唯一的方法。

想要双管齐下，可以用协同训练：

直接在判别器的表征上面，训练一个半监督的线性分类器，用来预测没有标注的图像。这个过程，和GAN的训练一同进行。

这样就有了S²GAN的协同版，叫S²GAN-CO。

升级一波

然后，团队还想让S²GAN变得更强大，就在GAN训练的稳定性上面花了心思。

研究人员说，判别器自己就是一个分类器嘛，如果把这个分类器扩增一下，可能疗效上佳。

于是，他们给了分类器一个额外的自监督任务，就是为旋转扩增过的训练集，做个预测。

再把这个步骤，和前面的半监督模型结合起来，GAN的训练变得更加稳定，就有了升级版S³GAN：

架构脱胎于BigGAN

不管是S²GAN还是S³GAN，都借用了前辈BigGAN的网络架构，用的优化超参数也和前辈一样。

不同的是，这个研究中，没有使用正交正则化，也没有使用截断技巧。

△BigGAN的生成器和鉴别器架构图

训练的数据集，来自ImageNet，其中有130万训练图像和5万测试图像，图像中共有1000个类别。

图像尺寸被调整成了128×128×3，在每个类别中随机选择k%的样本，来获取半监督方法中的使用的部分标注数据集。

蕞后，在128核的Google TPU v3 Pod进行训练。

超越BigGAN

研究对比的基线，是DeepMind的BigGAN，当前记录的保持者，FID得分为7.4。

不过，他们在ImageNet上自己实现的BigGAN，FID为8.4，IS为75，并以此作为了标准。

在这个图表中，S²GAN是半监督的预训练方法。S²GAN-CO是半监督的协同训练方法。

S³GAN，是S²GAN加上一个自监督的线性分类器。

其中，效果蕞好的是S³GAN，只使用10%由人工标注的数据，FID得分达到8.0，IS得分为78.7，表现均优于BigGAN。

如果你对这项研究感兴趣，请收好传送门：

论文：

High-Fidelity Image Generation With Fewer Labels

https://arxiv.org/abs/1903.02271

文章开头的这些照骗展示，就出自论文之中：

弟一行是BigGAN作品，弟二行是S³GAN新品，你猜对了吗？

另外，他们还在GitHub上开源了论文中实验所用全部代码：

https://github.com/google/compare_gan

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ\’ᴗ\’ ի 追踪AI技术和产品新动态

海外精品引流脚本–最强海外引流

官网：www.facebook18.com

唯一TG：https://t.me/Facebook181818

更多海外引流脚本方案

如果你需要脚本演示、部署咨询或海外获客方案，可以通过下面入口继续查看。

官网首页 | 演示视频 | TG 在线客服 | TG 频道

Telegram广告，如何在Telegram广告中有效投放广告——逐步指南

未分类

7个月前

2,81510

雷电模拟器改机所有文件

未分类 # 模拟器教程

12个月前

19,50012

黑科技·信息资源网

未分类

2年前

177,42996.9K

hugging face

ai-热门工具网站 # ai-热门工具网站

2年前

9,96015

twitter怎么看赞过的（twitter不看别人的赞）

更多海外引流脚本方案

相关阅读

Twitter怎么抽奖（instagram抽奖）

Twitter怎么刷新不了（twitter自动更新）

相关文章

Telegram广告，如何在Telegram广告中有效投放广告——逐步指南

雷电模拟器改机所有文件

黑科技·信息资源网

hugging face