[dialog-system]阅读笔记 - 2017__迁移学习在Q-A系统中的应用

吐槽:**** 的博客标签竟然有长度限制,图片的插入方式不够友好,比简书差太远。:(

Ref

  • Modelling Domain Relationships for Transfer Learning on Retrieval-based Qestion Answering Systems in E-commerce.Jianfei Yu, Minghui Qiu, Jing Jiang, Jun Huang, Shuangyong Song, Wei Chu, Haiqing Chen. 2017

Introduction

  • 基于信息检索的问答系统(Q-A system), AliMe
  • 通过迁移学习,将resource-rich source domain 的知识应用到 resource-poor target domain
  • 使用了KB
  • 迁移学习中,采用CNN-based methods ,且组合了sentence encoding (SE)-based methods and sentence interaction (SI)-based methods,因为这两种方式高度互补(highly complement )
  • 数据集:source domain data >> target domain data, Quora as source domain data, ali E-commerce dataset as the target domain

problem

  • Retrieval-based system 需要大量的标注数据
  • 效率上难以满足工业级要求
  • 现有的迁移学习仅仅学习了域间的共享特征空间,而忽略了source and target domains 之间的关系

model

  • sentence representation

    • 考虑响应时间的需求,作者放弃了精度更好的lstm-based method,而采用了cnn-based method
    • 采用 cnn-based methods 表示句子
    • 采用 SE-based methods 和 SI-based methods 相结合的方式,因为两者互补。对SE做了些更改,并将最后的embedding 进行 concatenate
  • Transfer Learning Framework

    • key issue:如何将源域和目标域的公共信息从源域迁移到目标域,同时将源域的领域知识排除在外
    • intuition:(1) 共享特征是领域独立的,那么共享特征与source domain的关系 和 与 target domain的关系应该是正相关的;(2)对于source domain 来说,共享特征和source domain内部的特征分别是领域独立和领域相关的,因此两者应该是无关的
    • 措施:在学习域间和域内特征表示的同时,学习域间和域内特征相结合的权重关系;具体地就是采用协方差矩阵来学习权重关系
    • 为了使共享特征空间更为稳定(more invariant),实际上通过以上的学习,共享空间仍然包含了来自领域的noisy,因此 进一步加入了对抗网络和对抗损失函数,具体地,用学习到的share representation zc 预测其来自于source domain 还是target domain,概率为p(d|zc),使基于此概率的熵最大即可(熵越大, 说明zc越不能区分source-domain 和target-domain,也就越 domian-independent)
      [dialog-system]阅读笔记 - 2017__迁移学习在Q-A系统中的应用

comment

  • 完整的描述了 the workflow of IR-based QA systems, 对本人来说,信息量还是蛮大的;
  • 完整的描述了transfer learning framework, 对我这种首次接触tf的来说, 信息量依然很大;