将latin1字符串转换为utf8?

问题描述:

如何将包含latin1字符的字符串转换为utf8?将latin1字符串转换为utf8?

该字符串是一个文档,由open-uri打开并包含这些特殊字符。

问候

Iconv

require 'iconv' 
i = Iconv.new('UTF-8','LATIN1') 
a_with_hat = i.iconv("\xc2") 

看你的标签,我想你想是这样的:

require 'rubygems' 
require 'open-uri' 
require 'nokogiri' 
require 'iconv' 

file = open(your_uri) 
doc = Nokogiri::HTML(Iconv.conv('utf-8', 'latin1', file.readlines.join("\n"))) 
doc.xpath(your_xpath) 

如果你不知道什么字符集的URI的用途,您可以使用file.charset来获取字符集而不是​​。