HTTP权威指南03——HTTP报文
1. HTTP报文由:起始行、包含属性的首部块,可选的包含数据的主体三部分组成
2. 所有的HTTP报文都可以分为两类:请求报文和响应报文。请求报文会向Web服务器请求一个动作,响应报文会将请求的结果返回给客户端。
3. 请求报文和响应报文格式
请求报文的格式 | 响应报文的格式 |
<method><request-URL><version> <headers>
<entity-body> |
<version><status><reason-phrase> <headers>
<entity-body> |
请求报文示例 | 响应报文示例 |
1)方法(method):客户端希望服务器对资源执行的操作,是一个单独的单词,比如GET、HEAD或POST
2)请求URL(request-URL):命名了所请求资源,或者URL路径组件的完整URL。如果直接与服务器进行对话,只要URL的路径组件是资源的绝对路径,通常就不会有什么问题——服务器可以假定自己是URL的主机/端口
3)版本(version):报文所使用的HTTP报文,其格式看起来是这样的:HTTP/<major>.<minor>,其中主要版本号和次要版本号都是整数
4)状态码(status-code):三位数字描述了请求过程中所发生的情况。每个状态码的第一位数字都是用于描述状态的一般类别(成功、出错等)
5)原因短语(reason-phrase):数字状态码的可读版本,包含行终止序列之前的所有文本。原因短语只对人类有意义
6)首部:可以有零个或多个首部,每个首部都包含一个名字,后面跟着一个冒号(:),然后是一个可选的空格,接着是一个值,最后是一个CRLF。首部由一个空行结束,表示了首部列表的结束和实体部分的开始。
7)实体的主体部分:实体的主体部分包含一个由任意数据组成的数据块。并不是所有的报文都包含实体的主体部分
3. 起始行:
1)请求行
2)响应行
3)方法(GET、HEAD、POST、PUT、TRACE、OPTIONS、DELETE)
- GET:用于请求服务器发送某个资源
- HEAD:与GET方法的行为类似,但服务器在响应中只返回首部
- PUT:向服务器写入文档,让服务器用请求的主体部分创建一个由所请求的URL命名的新文档,如果那个URL已经存在的话,就用这个主体来替代它
- POST:用来向服务器输入数据
- TRACE:允许客户端在最终请求发送给服务器时,看看它变成什么样子
- OPTIONS:请求Web服务器告知其支持的各种功能
- DELETE:请服务器删除请求URL所指定的资源,但是客户端应用程序无法保证删除操作一定会被执行。因为HTTP规范允许服务器在不通知客户端的情况下撤销请求。
4)状态码
状态码 | 原因短语 | 含义 |
100~101表示信息提示 | ||
100 | Continue | 说明收到了请求的初始部分,请客户端继续。发送了这个状态码之后,服务器在收到请求之后必须进行响应。 |
101 | Switching Protocols | 说明服务器正在根据客户端的指定,将协议切换成Update首部所列的协议 |
200~206表示成功 | ||
200 | OK | 请求没问题,实体的主体部分包含了所请求的资源 |
201 | Created | 用于创建服务器对象的请求,比如:PUT。响应的实体主体部分中应该包含各种引用了已创建的资源的URL |
202 | Accepted | 请求已被接收,但服务器还未对其执行任何动作。不能保证服务器会完成这个请求,这只是意味着接收请求时,它看起来是有效的 |
203 |
Non-Authoritative Information | 实体首部包含的信息不是来自源端服务器,而是来自资源的一个副本。如果中间节点有一份资源副本,但无法或者没有对它所发送的与资源有关的元信息进行验证,就会出现这种情况 |
204 | No Content | 响应报文中包含若干首部和一个状态行,但没有实体的主体部分。主体要用于在浏览器不转为显示新文档的情况下,对其进行更新 |
205 | Reset Content | 另一个主要用于浏览器的代码,负责告知浏览器清楚当前页面中所有HTML表单元素 |
206 | Partial Content | 成功执行一个部分或Range请求 |
300~305表示资源已经被移走了 | ||
300 | Multiple Choices | 客户端请求一个实际上只向多个资源的URL时会返回这个状态码,比如服务器上有某个HRML文档的英语和法语版本。返回这个代码时会带有一个选项列表;这样用户就可以选择他希望使用的那一项了 |
301 | Moved Permanently | 在请求的URL已被移除是使用。响应的Location首部中应该包含资源现在所处的URL |
302 | Found | 与301类似,但是客户端应该使用Location首部给出的URL来临时定位资源。将来的请求仍应使用老的URL |
303 | See Other | 告知客户端应该用另一个URL来获取资源,新的URL位于响应报文的Location首部。其主要目的是允许POST请求的响应将客户端定向到某个资源上去 |
304 | Not Modified | 客户端可以通过所包含的请求首部,使请求变成有条件的。如果客户端发起了一个条件GET请求,而最近资源未被修改的话,就可以用这个状态码来说明资源未被修改。带有这个状态码的响应不应该包含实体的主体部分 |
305 | Use Proxy | 用来说明必须通过一个代理来访问资源,代理的位置由Location首部给出 |
306 | 未使用 | 未使用 |
307 | Temporary Redirect | 与301类型,但客户端应该使用Location首部给出的URL来临时定位资源。将来的请求应该使用老的URL |
400~415表示客户端请求出错 | ||
400 | Bad Request | 用于告知客户端它发送了一个错误的请求 |
401 | Unauthorized | 与适当的首部一同返回,在这些首部中请求客户端在获取对资源的访问之前,对自己进行认证 |
402 | Payment Request | 还未使用 |
403 | Forbidden | 用于说明请求被服务器拒绝,如果服务器想说明为什么拒请求可以包含实体的主体部分来对原因进行描述,但这个状态码通常是在服务器不想说明拒绝原因的时候使用的 |
404 | Not Found | 用于说明服务器无法找到所请求的URI,通常会包含一个实体,以便客户端应用程序显示给用户看 |
405 | Method Not Allowed | 发起的请求中所请求的URL不支持的方法时,使用此状态码。应该在响应中包含Allow首部,以告知客户端对请求的资源可以使用那些方法 |
406 | Not Acceptable | 客户端可以指定参数来说明它们愿意接受什么类型的实体。服务器没有与客户端可接受的URL相匹配的资源时使用此代码。 |
407 | Proxy Authentication | 与401状态码相似,但用于要求对资源进行认证的代理服务器 |
408 | Request Timeout | 如果客户端完成请求所花的时间太长,服务器可以回送此状态码并关闭连接。超时时长随服务器的不同有所不同,但通常对所有的合法请求来说都是够长的 |
409 | Conflict | 用于说明请求可能在资源上引发的冲突,服务器担心请求会引发冲突时,可以发送此状态码 |
410 | Gone | 与404类似,只是服务器曾经拥有过此资源。主要用于Web站点的维护,这一服务器的管理者就可以在资源被移除的情况下通知客户端了 |
411 | Length Required | 服务器要求在请求报文中包含Content-Length首部时使用 |
412 | Precondition Failed | 客户端发起了条件请求,且其中一个条件失败了的时候使用。客户端包含了Expect首部时发起的就是条件请求 |
413 | Request Entity Too Large | 客户端发送的实体主体部分比服务器能够活着希望处理的要大时,使用此状态码 |
414 | Request URI Too Long | 客户端所发请求中的请求URL比服务器能够活希望处理的要长时,使用此状态码 |
415 | Unsupported Media Type | 服务器无法理解或无法指定客户端所发实体的内容是,使用此状态码 |
416 | Requested Range Not Satisfiable | 请求报文所请求的是指定资源的某个范围,而此范围无效或无法满足时,使用此状态码 |
417 | Expectation Failed | 请求的Expect请求首部包含了一个期望,但服务器无法满足此期望时,使用此状态码 |
500~505表示服务器出错 | ||
500 | Internal Server Error | 服务器遇到一个妨碍它为请求提供服务的错误时,使用此状态码 |
501 | Not Implemented | 客户端发起的请求超出服务器的能力范围时,使用此状态码 |
502 | Bad Gateway | 作为代理或网关使用的服务器从请求响应链的下一条链路上收到了一条伪响应时,使用此状态 |
503 | Service Unavailable | 用来说明服务器现在无法为请求提供服务,但将来可以。如果服务器知道什么时候资源会变为可用的,可以在响应中包含一个Retry-After首部 |
504 | Gateway Timeout | 与408类型,这是这里的响应来自一个网关或代理,它们在等待另一服务器对其请求进行响应时超时了 |
505 | HTTP Version Not Supported | 服务器收到的请求使用了它无法或不愿支持的协议版本时,使用此状态码 |
5)原因短语
6)版本号(HTTP/x.y形式)
4. 首部
1)首部分类
首部 | 描述 |
通用首部(既可以出现在请求报文中,也可以出现在响应报文中) | |
Connection | 允许客户端和服务器指定与请求/响应连接有关的选项 |
Date | 提供日期和时间标志,说明报文时说明时间创建的 |
MIME-version | 给出发送端使用的MIME版本 |
Trailer | 如果报文采用了分块传输编码方式,就可以用这个首部列出位于报文拖挂(Trailer)部分的首部集合 |
Transfer-Encoding | 告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式 |
Update | 给出了发送端可能想要“升级”使用的新版本或协议 |
Via | 显示报文经过的中间节点 |
Cache-Control | 用于随报文传送缓存指示 |
Pragma | 另一种随报文传送指示的方式,但并不专用于缓存 |
请求首部(通过更多有关请求的信息) | |
Client-IP | 提供了运行客户端的机器的IP地址 |
From | 提供了客户端用户的Email地址 |
Host | 给出了接收请求的服务器的主机名和端口号 |
Referer | 提供了包含当前请求URI的文档的URL |
UA-Color | 提供了与客户端显示器的先是颜色有关的信息 |
UA-CPU | 提供了客户端CPU的类型或制造商 |
UA-Disp | 提供了与客户端显示器能力有关的信息 |
UA-OS | 给出了运行在客户端机器上的操作系统名称及版本 |
UA-Pixels | 提供了客户端显示器的像素信息 |
User-Agent | 将发起请求的应用程序名称告知服务器 |
Accept | 告诉服务器能够发送哪些媒体类型 |
Accept-Charset | 告诉服务器能够发送哪些字符集 |
Accept-Encoding | 告诉服务器能够发送哪些编码方式 |
Accept-Language | 告诉服务器能够发送哪些语言 |
TE | 告诉服务器可以使用哪些扩展传输编码 |
Expect | 允许客户端列出某请求所要求的服务器行为 |
If-Match | 如果实体标记与文档当前的实体标记相匹配,就获取这份文档 |
If-Modified-Since | 除非在某个指定的日期之后资源被修改过,否则就限制这个请求 |
If-None-Match | 如果提供的实体标记与当前文档的实体标记不相符,就获取文档 |
If-Range | 允许对文档的某个范围进行请求 |
If-Unmodified-Since | 除非在某个指定日期之后资源没有被修改过,否则就限制这个请求 |
Range | 如果服务器支持范围请求,就请求资源的指定范围 |
Authorization | 包含了客户端提供给服务器,以便对自身进行认证的数据 |
Cookie | 客户端用它向服务器传送一个令牌,它并不是真正的安全首部,但确实隐含了安全功能 |
Cookie2 | 用来说明请求支持的cookie版本 |
Max-Forward | 在通往源端服务器的路径上,将请求转发给其他代理或网关的最大次数 |
Proxy-Authorization | 与Authorization首部相同,但这个首部是在与代理进行认证时使用的 |
Proxy-Connection | 与Connection首部相同,但这个首部是在与代理建立连接时使用的 |
响应首部(提供更多有关响应的信息) | |
Age | 从最初创建开始响应持续时间 |
Public | 服务器为其资源支持的请求方法列表 |
Retry-After | 如果资源不可用的话,在此日期或时间重试 |
Server | 服务器应用软件的名称和版本 |
Title | 对于HTML文档来说,就是HTML文档的源端给出额标题 |
Warning | 比原因短语更详细一些的警告报文 |
Accept-Ranges | 对此资源来说,服务器可接受的范围类型 |
Vary | 服务器查看的其他首部列表,可能会使响应发送变化,也就是说,这是一个首部列表,服务器会根据这些首部的内容挑选出最适合的资源版本发送给客户端 |
Proxy-Authenticate | 来自代理的对客户端的质询列表 |
Set-Cookie | 部署真正的安全首部,但隐含有安全功能,可以在客户端设置一个令牌,以便服务器对客户端进行标识 |
Set-Cookies | 与Set-Cookie类似 |
WWW-Authenticate | 来自服务器的对客户端的质询列表 |
实体首部(描述注意的长度或内容) | |
Allow | 列出了可以对此实体执行的请求方法 |
Location | 告知客户端实体实际上位于何处,用于将接收端定向到资源的位置上去 |
Content-Base | 解析主体中相对URL时使用的基础URL |
Content-Encoding | 对主体执行的任意编码方式 |
Content-Language | 理解主体时最适宜使用的自然语言 |
Content-Length | 主体的长度或尺寸 |
Content-Location | 资源实际所处的位置 |
Content-MD5 | 主体的MD5校验和 |
Content-Range | 在整个资源中此实体表示字节范围 |
Content-Type | 这个主体的对象类型 |
ETag | 与此实体相关的实体标记 |
Expires | 实体不再有效,要从原始的源端再次获取此实体的日期和时间 |
Last-Modified | 这个实体最后一次修改的日期和时间 |
扩展首部(规范中没有定义的新首部) |
2)首部延续行:将长的首部划分为多行可以提供可读性,多出来的每行前面至少有一个空格或制表符。
HTTP/1.0 200 OK Content-Type: image/gif Content-Length: 8572 Server: Test Server Version 1.0 | 响应报文中包含了一个Server首部,其值被划分成多个延续行,该首部的完整值为Test Server Version 1.0 |