将latin1字符串转换为utf8?
答
看你的标签,我想你想是这样的:
require 'rubygems'
require 'open-uri'
require 'nokogiri'
require 'iconv'
file = open(your_uri)
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n")))
doc.xpath(your_xpath)
如果你不知道什么字符集的URI的用途,您可以使用file.charset
来获取字符集而不是。