读论文Creating Irish Music using a Generative Adversarial Network
目的:
用已有的Irish Music生成…
用ABC notation将曲子转换成…
知识点:
在Discrimination中应用:
multi-tower : 意思就是用多个同样的输入,然后分别计算卷积。原文如下:
The discriminator starts off with a 6-tower convolution network (that is, 6 convolutions run sideby-side, as opposed to being dependent on each other).
dilated convolution : 意思就是扩大的卷积,有助于扩大感受野,获取更大范围内的信息,在提取具有序列信息的地方用的多。
以上两个方法在论文中用 下图展示:第一张图是正常卷积,灰色的为卷积中心,卷积核为2*9。
第二张图的黄色部分为卷积提取样点,灰色为卷积中心。
第三张图的红色部分为卷积提取样点,灰色为卷积中心。
…
在这个6-tower经过dilated-conv后就将他们铺平在一起。进行之后的操作。
可以看出,这样做的目的扩大感受野,采用multi-tower获取更多的信息。原文的描述如下:
Having multiple towers each learning different aspects gives us versatility and helps avoid the ”tunnel vision” nature of other generative music models.
论文链接:https://arxiv.org/pdf/2010.15772.pdf