wget没有返回正确的页面

问题描述:

当我通过我的Firefox 13访问this网站时,我收到了一些内容。但是当我用wget下载它时:wget没有返回正确的页面

wget http://tinhvan.com 

我在下载的HTML页面上获得了其他内容。尝试设置用户代理:

wget -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

但得到了相同的结果。

发生了什么事?以及我如何获得与通过Firefox访问时相同的结果?

UPDATE

这里是从Firefox =>视图源:

<!DOCTYPE html> 

<html dir="ltr" lang="vi"> 

    <head id="ctl00_page_header"> 




      <title> 

       Tinhvan Group - Trang chủ  

和这里从下载由wget的

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><link href="Content/images/main.css" rel="stylesheet" type="text/css" /><link href="Content/images/mail-detail.css" rel="stylesheet" type="text/css" /> 
    <script src="../../Content/JqueryUI/js/jquery-1.3.2.min.js" type="text/javascript"></script>  
    <title> 

    Trang chủ - Tinhvan Group Website 
+1

它会帮助显示什么'wget'返回 – CharlesB 2012-07-31 08:58:16

+0

我想我得到相同的结果。 – 2012-07-31 08:59:19

+0

@CharlesB:我更新了问题g – HVNSweeting 2012-07-31 09:18:45

火狐(不只是FF,铬,IE, etc也可以)自动添加Accept *标头。

例如

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Encoding: gzip, deflate 
Accept-Language: en-US, en;q=0.5 

尝试

wget --header="Accept: text/html" -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

注意:如果你不接受申报,然后头自动wget的增加接受:*/*,这意味着给我什么,你有。看起来,该网站默认返回aplication/xhtml + xml,但您期望text/html。