获取URL的源代码

问题描述:

我需要使用java代码获取特定URL的源代码。我能够获得UTF-8编码网页的源代码,但无法获取ISO-8859-1编码字符集的代码。我的问题是,有可能使用java程序获得iso-8859-1网站的源代码?请帮助获取URL的源代码

+0

向我们显示您的代码。可能您正在使用您的默认系统编码,并且必须在某处明确指定“ISO”编码。 –

+0

你用来获取utf-8页面的代码是什么,它的失败在哪里? – Mark

如果您是使用下面的方法读取你需要

URL url = new URL(URL_TO_READ); 
    BufferedReader in = new BufferedReader(
    new InputStreamReader(url.openStream(),"ISO-8859-1")); 

如何过,如果有一点解析包括与您的要求,指定字符明确设置我会建议你使用JSOUP,它会从服务器的响应读取字符集,也可以explicitly set the charset

+0

以及JSOUP的工作......感谢朋友 – prasad

+0

不客气,你可以把它标记为接受:) –