从Web服务器获取UTF-8编码的数据
问题描述:
我的数据管道 - >从Web服务器获取UTF-8编码的数据
Web服务器 - >资料撷取通过管道 - > Solr的
在Nifi利用GetHTTP处理器,我从读书Web服务器。处理器正在与Accept Content-Type = content-type: text/plain; charset=utf-8
合作。但是,当我在Solr中加载这些内容时,我会看到奇怪的字符。
当文件是通过浏览器下载(从服务器上),我看到了一个不同的一组奇怪的字符(包括在浏览器窗口,并在诸如记事本编辑++)
横跨整个管道,我有工作仅限UTF 8字符集。
有什么能看到Solr中,浏览器和下载的文件不同人物的理由(记事本++ - 编码成UTF-8)
答
我用InvokeHTTP代替GetHTTP或任何其他处理器做一些类似的HTTP动作。 调用HTTP云帮助您了解详细信息。使用此处理器并将响应保存在文件中共享我们云帮助您的这个文件。或者您可以更改处理器中的调试lv,然后查看日志。
GetHTTP后可以存储文件(PutFile)并发布有问题吗?你也说过你可以用浏览器下载文件。你可以比较文件吗?或发布第二个文件.. – daggett