从浏览器输入地址到服务器响应的整个过程

从浏览器输入地址到服务器响应的过程可以大致分成以下几个部分:

1、DNS解析(分别从浏览器缓存,本地host文件,本地DNS服务器,根DNS服务器)
2、建立TCP(得知服务器的ip和端口后,用socket建立连接,通过三次握手连接)
3、用户发送请求和服务器响应请求
4、浏览器页面渲染
5、断开连接(四次挥手)

一、DNS解析

  首先要理解我们平时输入的URL各个字段的意思,比如https://tieba.baidu.com/index.ht

  服务协议:https 用://分离
  主机IP地址和端口号:tieba.baidu.com用/分离
  资源的相对路径:index.ht

  但是计算机是不认识tieba.baidu.com,无法通过这个直接找到服务器,而是先把tieba.baidu.com这个URL域名翻译成计算机能识别的ip(14.215.177.221)才能找打相应的服务器,而DNS的工作就是去找域名对应的ip(14.215.177.221)。

  当输入网址的时候就浏览器就已经在做DNS解析了,浏览器会从依次从以下几个位置查找:

 1)浏览器缓存:浏览器会按照一定的频率,缓存DNS记录

 2)操作系统缓存(本地host文件):如果浏览器缓存中找不到需要的DNS记录,就会去操作系统中找
 
 3)ISP的DNS服务器:ISP有专门的DNS服务器应对DNS查询请求

 4)如果本地DNS服务也没有的话,一般有两种方式去查找ip,一种是递归解析,一种是迭代解析

递归解析

  本地DNS服务器找不到的话就会去找根DNS服务器,根DNS服务器找不到就会去找下级的局部DNS服务器,找到后就会返回结果到本地DNS服务器,然后再发送给客户端

迭代解析

  与递归解析不同的是,与本地DNS服务器不会主动去查询域名,而是本地服务器把能解析该域名的局部DNS服务器都发送给客户端,让客户端自己查。

二、建立连接

  得到服务器的IP地址和端口号后,用socket进行连接,底层实现是采用三次握手,如下图所示
从浏览器输入地址到服务器响应的整个过程
***seq:占4个字节,用来标记数据段的顺序,TCP把连接中发送的所有数据字节都编上一个序号,第一个字节的编号由本地随机产生;给字节编上序号后,就给每一个报文段指派一个序号;***seq就是这个报文段中的第一个字节的数据编号。

确认号ack:占4个字节,期待收到对方下一个报文段的第一个数据字节的序号;***表示报文段携带数据的第一个字节的编号;而确认号指的是期望接收到下一个字节的编号;因此当前报文段最后一个字节的编号+1即为确认号。

确认ACK:占1位,仅当ACK=1时,确认号字段才有效。ACK=0时,确认号无效

同步SYN:连接建立时用于同步序号。当SYN=1,ACK=0时表示:这是一个连接请求报文段。若同意连接,则在响应报文段中使得SYN=1,ACK=1。因此,SYN=1表示这是一个连接请求,或连接接受报文。SYN这个标志位只有在TCP建产连接时才会被置1,握手完成后SYN标志位被置0。

终止FIN:用来释放一个连接。FIN=1表示:此报文段的发送方的数据已经发送完毕,并要求释放运输连接

PS:ACK、SYN和FIN这些大写的单词表示标志位,其值要么是1,要么是0;ack、seq小写的单词表示序号。
从浏览器输入地址到服务器响应的整个过程
 第一次握手:建立连接时,客户端发送syn包(syn=x)到服务器,并进入SYN_SENT状态,等待服务器确认;SYN:同步序列编号(Synchronize Sequence Numbers)。

 第二次握手:服务器收到syn包,必须确认客户的SYN(ack=x+1),同时自己也发送一个SYN包(syn=y),即SYN+ACK包,此时服务器进入SYN_RECV状态;

 第三次握手:客户端收到服务器的SYN+ACK包,向服务器发送确认包ACK(ack=y+1),此包发送完毕,客户端和服务器进入ESTABLISHED(TCP连接成功)状态,完成三次握手。

三、用户发送请求和服务器响应请求

 1)浏览器根据解析到的IP地址和端口号发起http的get请求。http请求包括header和body。header中包括请求的方式(get和post)、请求的协议 (http、https、ftp)、请求的地址ip、缓存cookie。body中有请求的内容。

 2)服务器接收到http请求之后,开始搜索html页面,并使用http返回响应报文

 3)若状态码为200显示响应成功,浏览器接收到返回的html页面之后,开始进行页面的渲染

四、浏览器页面渲染

 1)浏览器根据深度遍历的方式把 html 节点遍历成 dom 树

 2)将css解析成CSS DOM树

 3)将dom树和CSS DOM树构造成render树

 4)JS根据得到的render树 计算所有节点在屏幕中的位置,进行布局(回流)

 5)遍历render树并调用硬件API绘制所有节点(重绘)

补充: 构造render渲染树的过程

从浏览器输入地址到服务器响应的整个过程
 1、从DOM树的根节点开始遍历每个可见的节点。
 2、对于每个可见的节点,找到CSS树中的对应的规则,并且应用他们。
 3、根据每个可见的节点及其对应的样式,组合生成渲染树。

五、断开连接(四次挥手)

从浏览器输入地址到服务器响应的整个过程
 1)客户端进程发出连接释放报文,并且停止发送数据。释放数据报文首部,FIN=1,其***为seq=u(等于前面已经传送过来的数据的最后一个字节的序号加1),此时,客户端进入FIN-WAIT-1(终止等待1)状态。 TCP规定,FIN报文段即使不携带数据,也要消耗一个序号。
 2)服务器收到连接释放报文,发出确认报文,ACK=1,ack=u+1,并且带上自己的***seq=v,此时,服务端就进入了CLOSE-WAIT(关闭等待)状态。TCP服务器通知高层的应用进程,客户端向服务器的方向就释放了,这时候处于半关闭状态,即客户端已经没有数据要发送了,但是服务器若发送数据,客户端依然要接受。这个状态还要持续一段时间,也就是整个CLOSE-WAIT状态持续的时间。
 3)客户端收到服务器的确认请求后,此时,客户端就进入FIN-WAIT-2(终止等待2)状态,等待服务器发送连接释放报文(在这之前还需要接受服务器发送的最后的数据)。
 4)服务器将最后的数据发送完毕后,就向客户端发送连接释放报文,FIN=1,ack=u+1,由于在半关闭状态,服务器很可能又发送了一些数据,假定此时的***为seq=w,此时,服务器就进入了LAST-ACK(最后确认)状态,等待客户端的确认。
 5)客户端收到服务器的连接释放报文后,必须发出确认,ACK=1,ack=w+1,而自己的***是seq=u+1,此时,客户端就进入了TIME-WAIT(时间等待)状态。注意此时TCP连接还没有释放,必须经过2∗∗MSL(最长报文段寿命)的时间后,当客户端撤销相应的TCB后,才进入CLOSED状态。
 6)服务器只要收到了客户端发出的确认,立即进入CLOSED状态。同样,撤销TCB后,就结束了这次的TCP连接。可以看到,服务器结束TCP连接的时间要比客户端早一些。

六、三次握手、四次挥手常见面试题

【问题1】为什么连接的时候是三次握手,关闭的时候却是四次握手?

 答:因为当Server端收到Client端的SYN连接请求报文后,可以直接发送SYN+ACK报文。其中ACK报文是用来应答的,SYN报文是用来同步的。但是关闭连接时,当Server端收到FIN报文时,很可能并不会立即关闭SOCKET,所以只能先回复一个ACK报文,告诉Client端,“你发的FIN报文我收到了”。只有等到我Server端所有的报文都发送完了,我才能发送FIN报文,因此不能一起发送。故需要四步握手。

【问题2】为什么TIME_WAIT状态需要经过2MSL(最大报文段生存时间)才能返回到CLOSE状态?

 答:虽然按道理,四个报文都发送完毕,我们可以直接进入CLOSE状态了,但是我们必须假象网络是不可靠的,有可以最后一个ACK丢失。所以TIME_WAIT状态就是用来重发可能丢失的ACK报文。在Client发送出最后的ACK回复,但该ACK可能丢失。Server如果没有收到ACK,将不断重复发送FIN片段。所以Client不能立即关闭,它必须确认Server接收到了该ACK。Client会在发送出ACK之后进入到TIME_WAIT状态。Client会设置一个计时器,等待2MSL的时间。如果在该时间内再次收到FIN,那么Client会重发ACK并再次等待2MSL。所谓的2MSL是两倍的MSL(Maximum Segment Lifetime)。MSL指一个片段在网络中最大的存活时间,2MSL就是一个发送和一个回复所需的最大时间。如果直到2MSL,Client都没有再次收到FIN,那么Client推断ACK已经被成功接收,则结束TCP连接。

【问题3】为什么不能用两次握手进行连接?

 答:3次握手完成两个重要的功能,既要双方做好发送数据的准备工作(双方都知道彼此已准备好),也要允许双方就初始***进行协商,这个***在握手过程中被发送和确认。

 现在把三次握手改成仅需要两次握手,死锁是可能发生的。作为例子,考虑计算机S和C之间的通信,假定C给S发送一个连接请求分组,S收到了这个分组,并发 送了确认应答分组。按照两次握手的协定,S认为连接已经成功地建立了,可以开始发送数据分组。可是,C在S的应答分组在传输中被丢失的情况下,将不知道S 是否已准备好,不知道S建立什么样的***,C甚至怀疑S是否收到自己的连接请求分组。在这种情况下,C认为连接还未建立成功,将忽略S发来的任何数据分 组,只等待连接确认应答分组。而S在发出的分组超时后,重复发送同样的分组。这样就形成了死锁。

【问题4】如果已经建立了连接,但是客户端突然出现故障了怎么办?

 答:TCP还设有一个保活计时器,显然,客户端如果出现故障,服务器不能一直等下去,白白浪费资源。服务器每收到一次客户端的请求后都会重新复位这个计时器,时间通常是设置为2小时,若两小时还没有收到客户端的任何数据,服务器就会发送一个探测报文段,以后每隔75秒钟发送一次。若一连发送10个探测报文仍然没反应,服务器就认为客户端出了故障,接着就关闭连接。

参考链接
1、TCP的三次握手与四次挥手理解及面试题(很全面)
2、从浏览器输入地址到响应的整个过程
3、浏览器从输入URL到渲染完页面的整个过程