从Web服务器获取UTF-8编码的数据

问题描述：

Web服务器 - >资料撷取通过管道 - > Solr的

在Nifi利用GetHTTP处理器，我从读书Web服务器。处理器正在与Accept Content-Type = content-type: text/plain; charset=utf-8合作。但是，当我在Solr中加载这些内容时，我会看到奇怪的字符。

当文件是通过浏览器下载（从服务器上），我看到了一个不同的一组奇怪的字符（包括在浏览器窗口，并在诸如记事本编辑++）

横跨整个管道，我有工作仅限UTF 8字符集。

有什么能看到Solr中，浏览器和下载的文件不同人物的理由（记事本++ - 编码成UTF-8）

GetHTTP后可以存储文件（PutFile）并发布有问题吗？你也说过你可以用浏览器下载文件。你可以比较文件吗？或发布第二个文件.. – daggett

答

我用InvokeHTTP代替GetHTTP或任何其他处理器做一些类似的HTTP动作。调用HTTP云帮助您了解详细信息。使用此处理器并将响应保存在文件中共享我们云帮助您的这个文件。或者您可以更改处理器中的调试lv，然后查看日志。