《Toward Unsupervised Text Content Manipulation》论文笔记
贡献:
1.这篇文章主要是提出了一个新的任务:和文本迁移任务,复写任务不同,文本迁移是修改一个特定句子的文章风格属性不修改文章的内容,而我们的任务是修改特定句子的内容而不修改风格
2.提出了这个任务相应的数据集
3.提出了这个任务的无监督模型
总结
这篇文章不难,主要就是构建一个篮球比赛的数据集,构建一个结构化数据x,以及这个x对应的原始语句y-aux;以及找到一个和x相似但不同的参考语句(作为生成语句风格的参考句子)y`,以及y`对应的结构化数据x`,然后分别用两个loss函数构建生成句子的保真性和文章风格,以及用了一个约束保证x的每个元组都被生成了。
模型如下:training部分显示了两个loss的训练,以及模型是采用了拷贝注意机制实现的。
摘要:
控制生成文本具有很高的实际应用价值。最近的努力在生成或编辑具有特定文本属性 (例如情感) 的句子方面取得了令人印象深刻的进展。本文研究了一种新的文本内容操作的实用设置。给定一个结构化的记录, 如 (Player:lebon, 点数:20, assists:10), 和一个参考句子, 如科比很容易下降30分, 我们的目标是生成一个句子, 准确地描述完整的内容, 在记录中, 以相同的写作风格 (例如,引用的措辞、过渡)。由于在实践中缺乏并行数据, 该问题在无人监管的情况下处于无人监管状态, 并且很难对文本进行最低限度但有效的操作 (通过重写/删除文本部分), 以确保对结构化内容的保真度。我们从篮球比赛报告语料库中推导出一个数据集作为我们的试验台, 并开发了一种具有无监督竞争目标和明确内容覆盖约束的神经方法。自动和人工评估显示了我们的方法优于竞争方法的优势, 包括为风格转让而设计的基于规则的强大基线和事先方法。