获取URL的源代码
问题描述:
我需要使用java代码获取特定URL的源代码。我能够获得UTF-8编码网页的源代码,但无法获取ISO-8859-1编码字符集的代码。我的问题是,有可能使用java程序获得iso-8859-1网站的源代码?请帮助获取URL的源代码
答
如果您是使用下面的方法读取你需要
URL url = new URL(URL_TO_READ);
BufferedReader in = new BufferedReader(
new InputStreamReader(url.openStream(),"ISO-8859-1"));
如何过,如果有一点解析包括与您的要求,指定字符明确设置我会建议你使用JSOUP,它会从服务器的响应读取字符集,也可以explicitly set the charset
+0
以及JSOUP的工作......感谢朋友 – prasad
+0
不客气,你可以把它标记为接受:) –
向我们显示您的代码。可能您正在使用您的默认系统编码,并且必须在某处明确指定“ISO”编码。 –
你用来获取utf-8页面的代码是什么,它的失败在哪里? – Mark