wget没有返回正确的页面
问题描述:
当我通过我的Firefox 13访问this网站时,我收到了一些内容。但是当我用wget下载它时:wget没有返回正确的页面
wget http://tinhvan.com
我在下载的HTML页面上获得了其他内容。尝试设置用户代理:
wget -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com
但得到了相同的结果。
发生了什么事?以及我如何获得与通过Firefox访问时相同的结果?
UPDATE
这里是从Firefox =>视图源:
<!DOCTYPE html>
<html dir="ltr" lang="vi">
<head id="ctl00_page_header">
<title>
Tinhvan Group - Trang chủ
和这里从下载由wget的
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><link href="Content/images/main.css" rel="stylesheet" type="text/css" /><link href="Content/images/mail-detail.css" rel="stylesheet" type="text/css" />
<script src="../../Content/JqueryUI/js/jquery-1.3.2.min.js" type="text/javascript"></script>
<title>
Trang chủ - Tinhvan Group Website
答
火狐(不只是FF,铬,IE, etc也可以)自动添加Accept *标头。
例如
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding: gzip, deflate
Accept-Language: en-US, en;q=0.5
尝试
wget --header="Accept: text/html" -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com
注意:如果你不接受申报,然后头自动wget的增加接受:*/*,这意味着给我什么,你有。看起来,该网站默认返回aplication/xhtml + xml,但您期望text/html。
它会帮助显示什么'wget'返回 – CharlesB 2012-07-31 08:58:16
我想我得到相同的结果。 – 2012-07-31 08:59:19
@CharlesB:我更新了问题g – HVNSweeting 2012-07-31 09:18:45