Rails 4:在ElasticSearch索引上的Wysiwyg编辑器中清除文本

问题描述:

我有一个名为offers的索引,我尝试使用Elastic搜索执行全文搜索,使用gem Tire进行Im。Rails 4:在ElasticSearch索引上的Wysiwyg编辑器中清除文本

我的模型有一个描述字段,但是这一领域的投入是一个所见即所得的编辑器,所以当我检查ElasticSearch索引的索引数据的description场已全部<p>的新生产线\n等众多编码字符像这样:

<h2>Qu&eacute; hay en la caja:</h2>\r\n\r\n<ul>\r\n\t<li>Tablet KRONO 7021</li>\r\n\t<li>Cable USB</li>\r\n\t<li>

我的问题是:你认为该文本需要ElasticSearch进行解码,以不影响全文搜索?

+0

你在该领域使用的分析仪是什么? –

你绝对应该解码你的文字。两个选项:

将文本保存为两个不同的字段 - 一个带有所见即所得标签,另一个则是对该列进行清理和搜索 - 如果您有很多条目,则会出现问题。

使用Elastic的"char_filter": [ "html_strip" ]选项。你将不得不手动尝试它,看看它在你的情况下有多好。

+0

我只是有个问题,我已经用'“char_filter”添加了一个自定义分析器:[“html_strip”]'但是当检查elasticsearch上的索引数据时,文本仍然是相同的,所以我不知道我是否在做某件事错误或者如果是这样,分析器不会在索引上显示结果? – SsouLlesS

+0

你是否重新编制了你的文件? –

+0

即时通讯使用弹性搜索2.4,是的我重新调整,我的意思是,我应该能够看到它在索引上解码? – SsouLlesS