《Toward Unsupervised Text Content Manipulation》论文笔记

贡献:

1.这篇文章主要是提出了一个新的任务:和文本迁移任务,复写任务不同,文本迁移是修改一个特定句子的文章风格属性不修改文章的内容,而我们的任务是修改特定句子的内容而不修改风格

2.提出了这个任务相应的数据集

《Toward Unsupervised Text Content Manipulation》论文笔记

3.提出了这个任务的无监督模型

总结

这篇文章不难,主要就是构建一个篮球比赛的数据集,构建一个结构化数据x,以及这个x对应的原始语句y-aux;以及找到一个和x相似但不同的参考语句(作为生成语句风格的参考句子)y`,以及y`对应的结构化数据x`,然后分别用两个loss函数构建生成句子的保真性和文章风格,以及用了一个约束保证x的每个元组都被生成了。

模型如下:training部分显示了两个loss的训练,以及模型是采用了拷贝注意机制实现的。

《Toward Unsupervised Text Content Manipulation》论文笔记

摘要:

控制生成文本具有很高的实际应用价值。最近的努力在生成或编辑具有特定文本属性 (例如情感) 的句子方面取得了令人印象深刻的进展。本文研究了一种新的文本内容操作的实用设置。给定一个结构化的记录, 如 (Player:lebon, 点数:20, assists:10), 和一个参考句子, 如科比很容易下降30分, 我们的目标是生成一个句子, 准确地描述完整的内容, 在记录中, 以相同的写作风格 (例如,引用的措辞、过渡)。由于在实践中缺乏并行数据, 该问题在无人监管的情况下处于无人监管状态, 并且很难对文本进行最低限度但有效的操作 (通过重写/删除文本部分), 以确保对结构化内容的保真度。我们从篮球比赛报告语料库中推导出一个数据集作为我们的试验台, 并开发了一种具有无监督竞争目标和明确内容覆盖约束的神经方法。自动和人工评估显示了我们的方法优于竞争方法的优势, 包括为风格转让而设计的基于规则的强大基线和事先方法。

《Toward Unsupervised Text Content Manipulation》论文笔记

《Toward Unsupervised Text Content Manipulation》论文笔记

《Toward Unsupervised Text Content Manipulation》论文笔记

 

《Toward Unsupervised Text Content Manipulation》论文笔记

《Toward Unsupervised Text Content Manipulation》论文笔记

《Toward Unsupervised Text Content Manipulation》论文笔记

《Toward Unsupervised Text Content Manipulation》论文笔记