【面试必备】用最明白的话总结面试最常问的HTTP
本文旨在用“通俗”一点、又不失专业的话术,来说明白这些知识点。
文章目录
- HTTP请求方法
- URL和URI的区别
- GET和POST有什么区别?
- PUT和POST都可以给服务器新增资源,有什么区别?
- PUT和PATCH都可以向服务器更新资源,有什么区别?
- HTTP请求报文是什么样的?
- HTTP响应报文是什么样的?
- 聊一聊HTTP首部有哪些?
- RFC2616定义的47种首部字段
- 通用首部(General Header Fields)9个
- 请求首部(Request Header Fields)19个
- 响应首部(Response Header Fields)9个
- 实体首部(Entiy Header Fields)10个
- 非HTTP/1.1的首部字段
- HTTP状态码
- HTTP的keep-alive是干什么的?
- HTTP和HTTPS的区别?
- HTTP/1.0和HTTP/1.1有什么区别?
- HTTP2相对于HTTP/1.X有什么优势?
- HTTPS的加密通信是怎么样的?
- HTTP缓存过程是怎样的?
- 强缓存和协商缓存?
- 常见的网络攻击方法和解决方案?
HTTP请求方法
HTTP/1.0
- GET:向服务器请求,获取资源。eg:请求某个页面。
- POST:传输实体主体,将数据发送给服务器。eg:把登录信息发送给服务器验证是否可以登录。
- HEAD:请求资源头部信息,和GET的资源头部信息一致,只是不返回报文主体。eg:下载大文件之前,先获取其大小,再决定是否要下载,以此节省带宽资源。
HTTP/1.1
- PUT:传输文件给服务器,然后保存到URI指定位置。eg:博客添加新文章。
- DELETE:删除指定文件,与PUT相反。eg:博客删除已存在的文章。
- OPTIONS:获取目标资源所支持的请求方法。eg:黑客常用OPTIONS请求来查看目标服务器支持的HTTP请求方法。
- TRACE:原样返回客户端请求的内容。eg:测试代理服务器中转时,请求是否被篡改。
- CONNECT:与代理服务器建立隧道来通信(网页开发用不到)。eg:翻墙时,为了通过国外服务器进行中转,首先需要客户端与国外服务器建立连接,这时使用CONNECT方法。
- PATCH:局部更新资源,是对PUT方法对补充。eg:局部更新指定文章的标题。
URL和URI的区别
- URI是统一资源标识符,只是一个字符串的格式标准,并没有指定它的用途。
- URL是统一资源定位符,是资源定位的规范,包括网址、ftp服务器、文件路径等。
可以把URI理解成URL更高层次的抽象,其实URI本来是由URL和URN(统一资源名称)组成的,但URN没流行起来,导致现在的URI基本都是URL。
GET和POST有什么区别?
- 数据传输方式不同:get在URL中,post在请求体中
- 安全性不同:get在URL中,很容易通过历史记录、缓存查到数据信息
- 数据类型不同:get只允许ASCII字符,post无限制
- 特性:get安全幂等。post非安全非幂等。这里的安全是指不会引起服务器状态变化。
幂等(idempotence):多次请求结果和一次请求结果相同。
“Methods can also have the property of “idempotence” in that (aside from error or expiration issues) the side-effects of N > 0 identical requests is the same as for a single request.”
PUT和POST都可以给服务器新增资源,有什么区别?
- PUT:幂等,URI指向单一资源。
- POST:非幂等,URI指向资源集合。
eg:比如博客系统,创建新文章,用POST https://www.blog.com/articles
,多次调用,就创建多个文章。如果更新指定文章的标题,用PUT https://www.blog.com/articles/000001
,多次调用,和第一次调用效果相同。
PUT和PATCH都可以向服务器更新资源,有什么区别?
PATCH是对PUT的补充。PUT是更新整条记录,对重复字段也进行覆盖。PATCH对资源进行“局部更新”。
HTTP请求报文是什么样的?
请求报文4部分组成:
- 请求行
- 请求头部
- 空行
- 请求体
上图来自《图解HTTP》,GET方法无请求体,如果是POST方法,可能会有形如name=admin&password=admin的请求体。
HTTP响应报文是什么样的?
请求报文有4部分组成:
- 响应行
- 响应头
- 空行
- 响应体
聊一聊HTTP首部有哪些?
RFC2616定义的47种首部字段
通用首部(General Header Fields)9个
首部字段名 | 说明 |
---|---|
Cache-Control✨ | 控制缓存 |
Connection✨ | 控制代理不再转发的首部字段、管理持久链接 |
Transfor-Encoding✨ | 指定报文主体的传输编码方式 |
Date | 创建报文的日期 |
Via | 代理服务器相关信息 |
Warning | 错误通知 |
Upgrade | 升级为其他协议 |
Trailer | 记录了报文主体之后的首部字段 |
Pragma | 报文指令,HTTP/1.1之前的历史遗留字段 |
请求首部(Request Header Fields)19个
首部字段名 | 说明 |
---|---|
Accept | 客户端或代理能够处理的媒体类型✨ |
Accept-Encoding | 优先的内容编码(gzip、deflate……) |
Accept-Language | 优先的语言(中文、英文……) |
Accept-Charset | 优先的字符集(ISO-8859-1……) |
If-Match✨ | 比较实体标记(ETage),匹配一致则同意请求 |
If-None-Match✨ | 比较实体标记,匹配不一致则同意请求 |
If-Modified-Since✨ | 比较资源更新时间,如果当前在指定日期之后,则接受请求 |
If-Unmodified-Since✨ | 比较资源更新时间,与If-Modified-Since相反 |
Range✨ | 获取部分资源的范围。eg:bytes=5001-10000 |
If-Range | 资源未更新时发送实体byte的范围请求 |
Authorization✨ | Web的认证信息 |
Proxy-Authorization | 代理服务器要求Web认证信息 |
Host✨ | 请求资源所在的服务器 |
From | 用户的邮箱地址 |
User-Agent | 客户端程序信息 |
Max-Forwrads | 最大逐跳次数 |
TE | 传输编码的优先级 |
Referer | 请求中URI的原始获取方 |
Expect | 期待服务器的特定行为 |
响应首部(Response Header Fields)9个
首部字段名 | 说明 |
---|---|
Accept-Range | 是否接受字节范围请求 |
Age | 推算资源创建经过的时间 |
ETag✨ | 实体标记,资源的匹配信息 |
Location✨ | 令客户端重定向到指定URI |
Proxy-Authenticate | 代理服务器对客户端的认证信息 |
Retry-After | 下次请求服务器的时间,与503一起使用 |
Server✨ | HTTP服务器的安装信息 |
Vary | 代理服务器的缓存信息 |
WWW-Authenticate | 服务器对客户端的认证信息 |
实体首部(Entiy Header Fields)10个
实体首部字段是包含在请求报文和响应报文中实体部分所用的首部,用于补充内容的更新时间等与实体相关的信息
。
首部字段名 | 说明 |
---|---|
Allow✨ | 资源可支持的HTTP方法 |
Expires✨ | 实体主体过期的日期时间 |
Last-Modified✨ | 资源最后的修改日期时间 |
Content-Encoding | 实体主体使用的编码方式 |
Content-Language | 实体主体的自然语言 |
Content-Length | 实体主体的大小(单位:字节) |
Content-Location | 代替对应资源的URI |
Content-MD5 | 实体主体的报文摘要 |
Content-Range | 实体主体的位置范围 |
Content-Type | 实体主体的媒体类型 |
非HTTP/1.1的首部字段
Cookie、Set-Cookie为cookie服务,Content-Disposition来指示如何显示附加的文件……
HTTP状态码
状态码 | 说明 |
---|---|
200 Ok✨ | 客户端请求在服务器被正确处理 |
201 Created | 请求已经实现,并且有新资源已经依据请求的需要被建立 |
202 Accepted | 请求已接受,但还没执行,不保证完成请求 |
204 Not Content | 请求成功,但相应报文不包含实体的主体部分 |
206 Partial Content✨ | 进行范围请求 |
301 Moved Permanently | 永久重定向,资源被分配了新的URL |
302 Found✨ | 临时重定向,资源被临时分配了新的URL |
303 See Other | 资源存在着另一个URL,应使用GET获取资源 |
304 Not Modified✨ | 服务器允许访问资源,但请求未满足条件 |
307 Temporary Redirect | 临时重定向,和302含义相同 |
400 Bad Request✨ | 请求报文存在语法错误 |
401 Unauthorized✨ | 请求需要通过有HTTP认证信息 |
403 Forbidden✨ | 请求资源访问被服务器拒绝 |
404 Not Found✨ | 资源未找到 |
408 Request Timeout | 客户端请求超时 |
409 Confict | 请求资源可能引起冲突 |
500 Internal Sever Error✨ | 服务器在执行请求时发生了错误 |
503 Service Unavailable | 服务器正超负载或停机维护 |
HTTP的keep-alive是干什么的?
早期HTTP/1.0每次请求都要重新建立一次连接,为了减少资源消耗、缩短响应时间,就要重用连接,想要保持长连接,需要在请求头上加上Connection:keep-alive。
HTTP和HTTPS的区别?
https是安全版的http,http协议都是明文传输,https的加密传输可以最大程度保证通信安全。
HTTP/1.0和HTTP/1.1有什么区别?
HTTP/1.0有GET
、POST
、HEAD
三个请求方法,HTTP/1.1新增了PUT
、DELETE
、PATCH
、OPTIONS
、TRACE
、CONNECT
请求方法,并且支持了持久连接。
HTTP2相对于HTTP/1.X有什么优势?
- 多路复用,合并TCP请求✨
- 头部压缩,只发送差异数据,减少头部信息量
- 二进制分帧解析更高效
- 服务器主动推送
HTTPS的加密通信是怎么样的?
HTTPS使用了两种加密,对称加密和非对称加密。
- 对称加密:通讯双方使用同一**。性能好,但不安全。
- 非对称加密:通讯双方各有一个私钥,共享一个公钥。安全,但性能差。
解决方案(混合加密):
将对称加密的**通过非对称加密的公钥进行加密,并发送出去,通信双方在通过各自的私钥进行解密获得对称加密的**,然后双方就可以使用对称加密来沟通。
混合加密+数字证书保证安全性:
- 服务器把自己的公钥登录到AC(数字证书认证机构)。
- AC用自己的私钥部署数字签名并颁发公钥证书。
公钥证书=服务器的公开**+AC的数字签名。
- 客户端拿到服务器的公钥证书后,用AC公钥进行验证真实性。
AC的公钥,已经事先写进浏览器了。
- 客户端使用服务器公钥加密报文。
- 服务器使用自己的私钥进行解密。
HTTP缓存过程是怎样的?
- 客户端向服务器请求资源
- 服务器缓存资源,并通过响应头决定缓存策略
- 客户端根据响应头的缓存策略决定是否缓存(这里假设是),并将响应头与资源缓存下来
- 当客户端再次请求命中资源的时候,检查缓存策略,根据策略不同、过期时间等判断直接读取本地缓存还是服务器协商缓存。
强缓存和协商缓存?
强缓存(Cache-Control):只有首次请求和服务器通信,读取缓存不用发送请求。返回200
协商缓存(ETag/If-None-Match):总会与服务器交互,第一次是拿数据和ETag,之后凭ETag询问是否更新。返回304
常见的网络攻击方法和解决方案?
SQL注入
攻击手段:
某些服务器处理用户账号,是直接将账号字符串拼接到SQL语句中,如果黑客利用规则拼接类似1=1的判断语句,数据库中可能会产生异常行为。
解决方案:
在Java中使用prepareStatement类预编译SQL语句,把固定格式的SQL编译后放入数据库缓冲池中,之后传入的字符串都当作参数来处理,而不是SQL指令。
XSS(跨站脚本攻击)
攻击手段:
攻击者往Web页面插入恶意<script>
代码,当用户浏览页面时,嵌入其中的script恶意代码就会执行。
解决方案:
- 过滤
<script>
、<img>
、<a>
标签 - 对
<
、>
在输入的时候进行编码转换 - 限制字符串长度
- 如果使用React的JSX语法,渲染输入内容之前会进行转义
CSRF(跨站请求伪造)
攻击手段:
用户登录受信任的A网站,产生Cookie,在没有登出A的情况下,访问了危险的B网站,B要求访问第三方站点(A),并发送一个请求(request),然后B就带着之前的Cookie(伪装成用户的名义)去请求。
解决方案:
验证码