4.1学习记录
记录下今天看的两篇论文。
1. Image-to-Image Translation with Conditional Adversarial Networks
D:Patch GAN
论文提到,虽然在图像生成方面,使用L1或者L2 loss会导致生成的图像产生模糊(fail to encourage high-frequency crispness),但是可以大多数情况下它们可以准确地捕捉低频信息。 因此,D限制为仅对图像的高频结构建模, 即仅关注image patch的高频信息。D对image patch进行fake or real的判断,从而二分,然后卷积整个图像,得到D对图像整体的判断。
G: U-NET
U-NET结构与encoder-decoder类似,增加了跳跃连接(skip connections),如图。
loss: conditional GAN 的input是{image x, noise z}, GT为image y。lossL1限制图像的低频信息。