zero-shot learning(ZSL)语义对齐方法总结

zero-shot learning(ZSL)语义对齐方法总结

zero-shot learning(ZSL)语义对齐方法总结
最近在研究ZSL问题,姑且读了几篇文章,想做一个简单的总结。
主要将ZSL问题分为:

  • 经典的方法(17年之前,简常规数学方法,机器学习方法),诸如线性对齐、非线性对齐、贝叶斯概率模型、中间空间映射(通过直方图将视觉特征映射和语义空间做对齐);
  • 现代方法:GAN、VAE方法,常用encoder-decoder模型,加强对齐效果。GAN中还常用attention机制,以及增强GAN做图像和文本数据集增强。其次,分为视觉空间工程和语义空间工程。视觉空间工程中例如用交并补的方法,将没有笼子的老虎和有笼子的老虎,用补集把笼子提取出来,用于有笼子的鸟识别。语义空间工程:一方面对语义空间进行增强划分,譬如下图:zero-shot learning(ZSL)语义对齐方法总结
    将whale,killer_whale、dolphin、sea_lion水下动物划分为一类,增强对齐效果。另外,近两年GCN(Graph Convolutional Network)盛行,也有非凡效果。
    就目前paper,我视觉空间对齐到语义空间效果提升不明显,有的特征很难对过去。之前的方法都存在属性或类别没有关联的问题。比如一个鸟有头、羽毛、尾巴、颜色等特征,一般采用直接的浅表示方法,并没有用到之间的图特征。鸟和马有共通的头,但这两怎么能区分、怎么又算是有共性,值得思考。
    目前常用数据集:COCO,ImageNet、AWA2(AWA1不开源授权)、CUB等。

Github资源:

综述类文章:

上图PDF文件请关注公众号:大数据视角 ,回复:语义对齐方法 获取
zero-shot learning(ZSL)语义对齐方法总结
喜欢我的请毫不犹豫的打赏我吧,1分1毛也是爱~么么哒(づ ̄ 3 ̄)づ
zero-shot learning(ZSL)语义对齐方法总结