更改R中的XML文件的unicode
我想执行一项简单的任务: 我有60,000个xml文件,我想将它们的编码更改为utf-8。 我想要做的就是编写一种读取xml文件的循环,然后用正确的编码立即保存它。而已。我如何在R中做到这一点?更改R中的XML文件的unicode
如this后建议使用iconv
。
一般:
writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"), "tmp2.html")
在Windows上使用:
writeLines(iconv(readLines("tmp.html"), from = "ANSI_X3.4-1986", to = "UTF8"),
file("tmp2.html", encoding="UTF-8"))
虽然此链接可能会回答问题,但最好在此处包含答案的重要部分并提供供参考的链接。如果链接页面更改,则仅链接答案可能会失效。 - [来自评论](/ review/low-quality-posts/17133775) –
感谢澄清[yoh-deadfall](https://stackoverflow.com/users/4593390/yoh-deadfall)现在编辑我的回复! –
这种方法的问题是它使XML声明保持不变,这意味着随后尝试解析文件可能会尝试对其进行错误解码。 –
他们都有相同的电流编码,或者你需要读取XML声明,以确定编码? –