首页 理论教育 打造多样风格,StarGAN带你解锁惊奇视界

打造多样风格,StarGAN带你解锁惊奇视界

时间:2023-06-21 理论教育 版权反馈
【摘要】:针对这种困境,Star GAN解决了这类问题。如图7-8所示,Star GAN希望能够通过一个生成器解决所有跨域类别问题。Star GAN作为CycleGAN的推广,将两两映射变成了多领域之间的映射,是图像翻译领域的又一重大突破。此外,Star GAN还可以实现多数据集之间的联合训练,比如将拥有肤色、年龄等标签的Celeb A数据集和拥有生气、害怕等表情标签的RaFD数据集训练到同一个模型,完成模型的压缩。

打造多样风格,StarGAN带你解锁惊奇视界

虽然Pix2Pix解决了有配对的图像翻译问题,CycleGAN解决了无配对的图像翻译问题,但是无论是Pix2Pix还是CycleGAN,它们对图像翻译而言,都是一对一的,即一类图像对一类图像。然而涉及多类图像之间的转换,就需要CycleGAN进行一对一逐个训练,如图7-8(a)所示,显然这样的行为是极为低效的。

针对这种困境,Star GAN解决了这类问题。如图7-8(b)所示,Star GAN希望能够通过一个生成器解决所有跨域类别问题。

图7-8 跨域模型(如CycleGAN等)与Star GAN

StarGAN中生成器与判别器的设计以及模型结构如图7-9所示。

图7-9 Star GAN模型结构示意图

模型中(a)~(d)的要求如下:

(a)D学会区分真实图像和生成图像,并将真实图像分类到其对应的域。因此,对D而言,实际上是由两部分组成的,即D:x→{Dsrc(x);Dcls(x)};

(b)拼接目标标签与输入图片,将之输入G,并生成相应的图像;

(c)在给定原始域标签的情况下,G要尽量能重建原始图像,这与CycleGAN的循环一致性一脉相承

(d)这一点与一般的GAN相同,G要尽量生成与真实图像相似的图像,但同时又要尽量能被D区分出来。

从目标函数来看,首先判别器的目标函数要求满足GAN的结构,即(www.zuozong.com)

此外,还需要判别器能将真实图像分类到相应的域:

针对生成器,除了Ladv对应的GAN结构外,还要求判别器能将生成图像分类到相应的域:

此外,还要求尽量能重建原始图像:

其中,c′为原始图像对应的类别。如此,可以得到判别器的目标函数为

以及生成器的目标函数为

其中λcls和λrec均为常数。

Star GAN作为CycleGAN的推广,将两两映射变成了多领域之间的映射,是图像翻译领域的又一重大突破。此外,Star GAN还可以实现多数据集之间的联合训练,比如将拥有肤色、年龄等标签的Celeb A数据集和拥有生气、害怕等表情标签的RaFD数据集训练到同一个模型,完成模型的压缩。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈

相关推荐