什么样的回答才足够个性?吾来个性化回复举手参评
文 | AI训练师
整理 | 吾来君
前言
一般来说,知识点中相似问越多,效果越好。但一味增加反而会导致知识点下相似问的冗余。
很多情况下,用户描述一个句子可能是用了某个很具体的特征,可以看下面两个例子。
案例一:“什么时候发货”这个知识点,在用户的叙述中很可能是“今天有没有发货信息”、“周一能发货吗”、“18号当天能发货吗”;
案例二:“产品是不是正品行货”这个知识点,用户叙述的可能一般都是具体的产品,“X系列产品是正品吗”、“X产品X型号是真的吧”、“我买的XX是行货吧”;
那我们想可不可以让机器人把“XX系列”都当成一种特征,而这些特征反复的出现在我们的知识中,可以单独进行维护,这样用户说产品的任意一个系列,机器人对这个知识点也能认识。谨以此文献给那些一起战斗过的AI训练师和产品经理。
0
1
句式的产生
含有“XX系列”,“X型号”,“X色号”,“X条件”,这种情况的相似问题,我们就可以添加句式来解决,用户说的时间和产品名称,型号,系列等关键信息就是实体。
这时用户说XX系列是真的吗?就可以升级成句式“@产品系列 是真的吗?”。
句式是相似说法的模板。当你需要在一个知识点中添加大量句子结构类似的相似说法时,就可以使用句式来减少相似说法的数量。
其实“XX系列”,“X型号”,“X色号”,“X规则”我们也想全都让机器人识别到任意一个配上后面的提问“是不是正品”等就能全部识别到这个知识点呢?
那吾来现在是可以设定只要符合这些规则中的任意一个,就能放到这个模式下,让机器人来识别。
盛放这些不同实体值的工具我们叫做词槽,大家可以简单的理解为一个篮子。
加上词槽之后,这个句式就变成了“@产品:产品系列,产品型号,产品色号 是真的吗”。
其中,产品是盛放不同实体值的词槽,符合产品系列,产品型号,产品色号这些实体规定规则的值或文本,类似于金装(奶粉系列),10875H(CPU型号),999(口红色号),我们称作实体值。
产品系列,产品型号,产品色号是不同的实体,是判定用户语句是否包含或符合特定规则的筛选工具。
注:关于实体与词槽的更多解释请注册登录后查看吾来产品手册。
0
2
配置个性化回复的准备工作
那我们需要添加实体和词槽来帮助我们完成这件事。
首先需要将用户说的特征信息总结一下,先在对话搭建的词库菜单里添加枚举实体等,吾来自身也配有如日期,数字这种预设实体,有需要也可以直接使用。
第二步要在词槽管理新建问答词槽并关联实体。
第三步新建知识点或在已有知识点点击新增句式添加,在需要使用这些信息替代用户的具体说法的地方输入“@”调用对应词槽。
这样,无需穷举所有具体信息,就能覆盖所有模式一样的句子了。
而机器人会将句式在参与召回的时候将句式还原成具体的相似问题,参与计算评分。这样做了之后,句式的评分和相似问题的评分就变得可以比较了。
句式的评分和相似问题的评分可以比较后,吾来的召回逻辑理解起来就很简单了。
吾来也支持使用更多的词槽来描述一个具体的问题,比如“@产品系列:产品系列 的@产品型号:产品型号 介绍一下?”,这样避免了一个问题仅有一个重要特征来描述不够精确,容易无召回或误召回的问题。
通过实体而不是同义词的方法,能让我们区分出不同的实体值,甚至可以根据不同的实体值,比如说产品型号,给用户个性化的回复,又不增加更多的泛化相似问题投入。
0
3
个性化回复的设置
不同的产品型号系列的对应答案,为了方便整理,可以放置到一个表格中,这样就能精准的找到应该回复用户的问题了。
商品编号 |
系列 |
阶段 |
答案 |
100001 |
天启 |
二段 |
天启二段奶粉…… |
100002 |
天启 |
三段 |
天启三段奶粉…… |
100003 |
美赋 |
三段 |
美赋三段奶粉…… |
其实在很多知识在业务中,也都是使用表格存放的,所以如果直接能将表格中的内容组织后回复出来,对机器人搭建来说是非常高效的。
个性化回复的答案我们可以在对话搭建-个性化体验-个性化回复创建表格并添加。
目前吾来支持创建多个表格,每个表格可以有一万行,可以添加10组用来定位条件的属性列,以及20组答案列;答案列中的答案可以点击添加,支持文字、图片、图文、卡片、文件、语音和视频格式;答案也可以批量导入,批量导入的答案只支持文字。
关联表格也很简单,只需要开启个性化回复,选择表格,配置查询条件,返回的答案所在列就行了。
保存后,我们就可以在调试机器人,体验版网页或其他正式渠道看到效果了。
可以在调试机器人处看到对应的句式,知道这个问题是哪个知识点,甚至是哪个句式影响下才发送回复的,这可以支持我们进行快速准确的进行调优。
查询的条件现在还支持用户的询问语句结合用户自身的属性一起使用,可以实现不同地区,身份,渠道的用户提问可以回复不一样的答案。
现在,吾来机器人对话平台可以在配置这样结构的知识点后,精准的回复用户诸如“帮我找一下X城市的门店地址”,“X系列产品有X功能吗”这样的问题,并且可以减少很多低水平重复的相似问添加工作。
多个知识点可以利用同一张表格,更加节省配置的工作量。
所以,通过知识点关联表格,用句式来查询表格并回复答案这个方案非常的精准,避免了仅采用词向量、句向量和自然语言查表查数据库的能力进行召回,效果难以干预和修复问题。
简单的知识图谱类需求,我们可以转化成问答调用表格进行回复,大大降低搭建和维护知识图谱的成本。
0
4
个性化回复的其他优化
针对句式和读表我们也做了大量的优化,以使这个过程更具有实操性和落地性。
在搭建时,完全不需要英文单词,不需要代码或者任何接口,只要准备好表格,我们就能创建这样一个知识点。
在配置过程中,也可以将已输入的相似问题,简单点击就能升级为句式。
原有的知识库可以很方便的升级为带句式和个性化回复的知识库。
知识库也支持了携带句式的导入导出,方便在其他APP复用知识库。
在任务对话中,也可以利用句式来填槽和触发,这样在触发的同时,我们也能精准的收集到用户说的关键信息。
添加了词槽之后,使用句式可以精准的将诸如出发地和到达地这样的信息精准的收集到。
例如,“帮我买一张@出发地:城市 到@到达地:城市 的@出行类型:交通方式 票”,就可以识别如帮我买一张上海到北京的高铁票这样的需求,并且精准的将出发地填入上海,到达地填入北京,出行类型填入高铁。
那如果有新增的品类或者给另外的产品线使用,我们只需要替换或者新增实体值就可以完美复用原来的知识点了。知识库的通用性和专业性都能得到保证。
除此之外,我们还针对这类知识点的相似说法挖掘能力做了大量优化。
如果您有清洗过的和用户对话记录,可以先导入语料库,而后从挖掘机器人导入挖掘库中指定的语料。
导入之后选择立即挖掘。
注:挖掘功能及部分效果优化功能目前仅在基础版和专业版提供。
机器人会根据句子的特征和里面包含的实体进行聚类,含有实体的聚类的结果可以点击自动升级句式,得到更加精准的推荐,方便做进一步处理。
点击对应的代表问题后的筛选问题,可以查看机器自主聚类的的单簇结果。
上图所示就是句式携带实体时的聚类表现,我们可以再展开相应的相似问挑选相似问,可以看到机器人已经将类似于“X个月宝宝的正常体重”,“X个月宝宝X斤是否正常”这样的句子全都汇总在一起了。
点击簇后可以发现有些已经被机器人预选上了,另外一些没有,预选上的句子是机器人推荐入库的,其余的句子和已被预选的句子十分接近,不需要重复添加机器人也能回复正确。
更少但更有代表性的句子,也减少了我们后期维护知识库的难度。
筛选时仍然要注意注意要选择保留意图单一,非关键词,完整又不和其他知识点的意图重合的句子。
对挖掘出来的知识做必要的整理,根据聚类的结果对知识点进行命名,如添加相似问,选择分类,转移,删掉不相关意图的相似问之后,我们就能在下方将知识点入库了。
如果是属于现有知识点的相似说法,我们也可以点击转移到已有知识点进行添加,若还想找到更多相似问题,可以尝试点击推荐相似簇和推荐相似问按钮。
结语
专业开放的对话机器人平台"吾来"已全面支持句式查询表格给出个性化回复答案,无需编程、无需部署、免费试用,支持企业快速拥有自己的对话机器人。
大家可以扫描下方二维码,免费注册一个吾来平台的账号,尝试搭建自己的个性化智能机器人,并利用本文的方法将自己的机器人快速发布并体验。
点击「阅读原文」
快速免费试用吾来对话机器人平台!
????????