TCP、UDP、IP详解

一.计算机网络体系结构

TCP、UDP、IP详解
1.1 不同网络层对应的协议

TCP、UDP、IP详解
1.2 体系分层介绍
五层协议

应用层 :为特定应用程序提供数据传输服务;
Telnet: 远程登录。
FTP :文件传输协议。
SMTP: 简单邮件传送协议。
SNMP :简单网络管理协议。
传输层 :为进程提供通用数据传输服务。由于应用层协议很多,定义通用的传输层协议就可以支持不断增多的应用层协议。
T C P:传输控制协议 (面向流字符的协议 )。
U D P:用户数据报协议 。
网络层 :为主机提供数据传输服务。而传输层协议是为主机中的进程提供数据传输服务。网络层把传输层传递下来的报文段或者用户数据报封装成分组。
I P协议:网际协议。
I C M P协议:I n t e r n e t互联网控 制报文协议。
I G M P协议:I n t e r n e t组管理协议 。
数据链路层 :网络层针对的还是主机之间的数据传输服务,而主机之间可以有很多链路,链路层协议就是为同一链路的主机提供数据传输服务。数据链路层把网络层传下来的分组封装成帧。
物理层 :考虑的是怎样在传输媒体上传输数据比特流,而不是指具体的传输媒体。物理层的作用是尽可能屏蔽传输媒体和通信手段的差异,使数据链路层感觉不到这些差异。


OSI

表示层 :数据压缩、加密以及数据描述,这使得应用程序不必关心在各台主机中数据内部格式不同的问题。
会话层 :建立及管理会话。
prc协议:(远程方法调用协议)


TCP/IP

它只有四层,相当于五层协议中数据链路层和物理层合并为网络接口层。

TCP/IP 体系结构不严格遵循 OSI 分层概念,应用层可能会直接使用 IP 层或者网络接口层。

TCP、UDP、IP详解
1.3 数据封装
元数据进行网络传输,需要先进行逐层封装和逐层解析的过程,如下图:

TCP、UDP、IP详解
向下的过程中,需要添加下层协议所需要的首部或者尾部,而在向上的过程中不断拆开首部和尾部。

路由器只有下面三层协议,因为路由器位于网络核心中,不需要为进程或者应用程序提供服务,因此也就不需要传输层和应用层。

1.4 协议与上下层的关系简图

TCP、UDP、IP详解
二.IP协议
2.1 引言
IP协议在OSI七层协议中位于网络层,在物理层和链路层之上,本文的研究范围为网络层到应用层之间的上层协议,对下层协议暂不研究。所以就以IP层为切入点,
网络层是整个互联网的核心,使用 IP 协议,可以把异构的物理网络连接起来,使得在网络层看起来好像是一个统一的网络。
2.2 概述
​    I P是T C P / I P协议族中最为核心的协议。所有的 T C P、U D P、I C M P及I G M P数据都以I P数据 报格式传输 ;IP数据报传送 服务 具有不可靠性、无连接性。

不可靠(u n r e l i a b l e) :的意思是它不能保证 I P数据报能成功地到达目的地。 I P仅提供最好 的传输服务。如果发生某种错误时,如某个路由器暂时用完了缓冲区, I P有一个简单的错误 处理算法:丢弃该数据报,然后发送 I C M P消息报给信源端。任何要求的可靠性必须由上层来 提供(如T C P)
无连接(c o n n e c t i o n l e s s)这个术语的意思是 I P并不维护任何关于后续数据报的状态信息。 每个数据报的处理是相互独立的。这也说明, I P数据报可以不按发送顺序接收。如果一信源 向相同的信宿发送两个连续的数据报(先是 A,然后是B),每个数据报都是独立地进行路由 选择,可能选择不同的路线,因此 B可能在A到达之前先到达。
与 IP 协议配套使用的还有三个协议:
地址解析协议 ARP(Address Resolution Protocol)
网际控制报文协议 ICMP(Internet Control Message Protocol)
网际组管理协议 IGMP(Internet Group Management Protocol)
2.3 IP分类
I P地址长为32 bit,地址具有一定的结构,五类不同 的互联网地址格式下

TCP、UDP、IP详解
各类IP地址的范围

类型    范 围
A    0.0.0.0到127.255.255.255
B    128.0.0.0到191.255.255.255
C    192.0.0.0到223.255.255.255
D    224.0.0.0到239.255.255.255
E    240.0.0.0到247.255.255.255
有三类I P地址:

单播地址(目的为单个主机)
广播地址(目的端为给定网络上的所有主 机)
多播地址(目的端为同一组内的所有主机)
2.4 IP 数据报格式
ip地址长度为32bit,普通的I P首部长为2 0个字节。

TCP、UDP、IP详解

8位生存时间TTL
T T L(t i m e - t o - l i v e)生存时间字段设置了数据报可以经过的最多路由器数。它指定了数据 报的生存时间。T T L的初始值由源主机设置(通常为 3 2或6 4),一旦经过一个处理它的路由器, 它的值就减去 1。当该字段的值为 0时,数据报就被丢弃,并发送 I C M P报文通知源主机。
16位手部检验和
用于验证传送数据报和接受数据报的差异。首先把检验和字段置为 0。 对首部中每个 16 bit 进行二进制反码求和 ,结果存在检验和字段中 。收到数据报后再对首部进行计算,相同就把检验和字段置为 1,不同那么I P就丢弃收到的 数据报 。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。
总长度:占用16位二进制位,总长度字段是指整个IP数据报的长度(报头区+数据区)
2.5 IP路由选择
当一个IP数据包准备好了的时候,IP数据包(或者说是路由器)是如何将数据包送到目的地的呢?它是怎么选择一个合适的路径来"送货"的呢?

最特殊的情况是目的主机和主机直连,那么主机根本不用寻找路由,直接把数据传递过去就可以了。至于是怎么直接传递的,这就要靠ARP协议了,后面会讲到。

稍微一般一点的情况是,主机通过若干个路由器(router)和目的主机连接。那么路由器就要通过ip包的信息来为ip包寻找到一个合适的目标来进行传递,比如合适的主机,或者合适的路由。路由器或者主机将会用如下的方式来处理某一个IP数据包

如果IP数据包的TTL(生命周期)以到,则该IP数据包就被抛弃。
搜索路由表,优先搜索匹配主机,如果能找到和IP地址完全一致的目标主机,则将该包发向目标主机
搜索路由表,如果匹配主机失败,则匹配同子网的路由器,这需要“子网掩码(1.3.)”的协助。如果找到路由器,则将该包发向路由器。
搜索路由表,如果匹配同子网路由器失败,则匹配同网号(第一章有讲解)路由器,如果找到路由器,则将该包发向路由器。
搜索陆游表,如果以上都失败了,就搜索默认路由,如果默认路由存在,则发包
如果都失败了,就丢掉这个包。
这再一次证明了,ip包是不可靠的。因为它不保证送达。

2.6 子网寻址
IP地址的定义是网络号+主机号。但是现在所有的主机都要求子网编址,也就是说,把主机号在细分成子

网号+主机号。最终一个IP地址就成为 网络号码+子网号+主机号。

下面就是一个B类地址:    

TCP、UDP、IP详解

B类网络地址 (1 4 0 . 2 5 2),在剩下的16 bit中,8 bit用于子网号,8 bit用于主机号。这样就允许有

2 5 4个子网,每个子网可以有2 5 4台主机。 (8位一共有256种可能,由于全0或全1的主机号都是无效的, 所以就有254种可能)。

2.7 地址解析协议 ARP

网络层实现主机之间的通信,而链路层实现具体每段链路之间的通信。因此在通信过程中,IP 数据报的源地址和目的地址始终不变,而 MAC 地址随着链路的改变而改变。

TCP、UDP、IP详解
ARP 实现由 IP 地址得到 MAC 地址。

TCP、UDP、IP详解
每个主机都有一个 ARP 高速缓存,里面有本局域网上的各主机和路由器的 IP 地址到 MAC 地址的映射表。

如果主机 A 知道主机 B 的 IP 地址,但是 ARP 高速缓存中没有该 IP 地址到 MAC 地址的映射,此时主机 A 通过广播的方式发送 ARP 请求分组,主机 B 收到该请求后会发送 ARP 响应分组给主机 A 告知其 MAC 地址,随后主机 A 向其高速缓存中写入主机 B 的 IP 地址到 MAC 地址的映射。

TCP、UDP、IP详解
2.8 网际控制报文协议 ICMP
I C M P经常被认为是 I P层的一个组成部分。它传递差错报文以及其他需要注意的信息。 I C M P报文通常被I P层或更高层协议( T C P或U D P)使用。一些 I C M P报文把差错报文返回给 用户进程。
当传送IP数据包发生错误--比如主机不可达,路由不可达等等,ICMP协议将会把错误信息封包,然后传送回给主机。给主机一个处理错误的机会,这 也就是为什么说建立在IP层以上的协议是可能做到安全的原因。ICMP数据包由8bit的错误类型和8bit的代码和16bit的校验和组成。而前 16bit就组成了ICMP所要传递的信息。书上的图6-3清楚的给出了错误类型和代码的组合代表的意思。
尽管在大多数情况下,错误的包传送应该给出ICMP报文,但是在特殊情况下,是不产生ICMP错误报文的。如下 :(所有的这一切规定,都是为了防止产生ICMP报文的无限传播而定义的。 )
ICMP差错报文不会产生ICMP差错报文(出IMCP查询报文)(防止IMCP的无限产生和传送)
目的地址是广播地址或多播地址的IP数据报。
作为链路层广播的数据报。
不是IP分片的第一片。
源地址不是单个主机的数据报。这就是说,源地址不能为零地址、环回地址、广播地 址或多播地址。
ICMP协议大致分为两类,一种是查询报文,一种是差错报文。其中查询报文有以下几种用途 :
ping查询
网掩码查询(用于无盘工作站在初始化自身的时候初始化子网掩码)
时间戳查询(可以用来同步时间)。

TCP、UDP、IP详解

ICMP 报文分为差错报告报文和询问报文。

TCP、UDP、IP详解

1. Ping
Ping 是 ICMP 的一个重要应用,主要用来测试两台主机之间的连通性。

Ping 的原理是通过向目的主机发送 ICMP Echo 请求报文,目的主机收到之后会发送 Echo 回答报文。Ping 会根据时间和成功响应的次数估算出数据包往返时间以及丢包率。

2. Traceroute
Traceroute 是 ICMP 的另一个应用,用来跟踪一个分组从源点到终点的路径。

Traceroute 发送的 IP 数据报封装的是无法交付的 UDP 用户数据报,并由目的主机发送终点不可达差错报告报文。

源主机向目的主机发送一连串的 IP 数据报。第一个数据报 P1 的生存时间 TTL 设置为 1,当 P1 到达路径上的第一个路由器 R1 时,R1 收下它并把 TTL 减 1,此时 TTL 等于 0,R1 就把 P1 丢弃,并向源主机发送一个 ICMP 时间超过差错报告报文;
源主机接着发送第二个数据报 P2,并把 TTL 设置为 2。P2 先到达 R1,R1 收下后把 TTL 减 1 再转发给 R2,R2 收下后也把 TTL 减 1,由于此时 TTL 等于 0,R2 就丢弃 P2,并向源主机发送一个 ICMP 时间超过差错报文。
不断执行这样的步骤,直到最后一个数据报刚刚到达目的主机,主机不转发数据报,也不把 TTL 值减 1。但是因为数据报封装的是无法交付的 UDP,因此目的主机要向源主机发送 ICMP 终点不可达差错报告报文。
之后源主机知道了到达目的主机所经过的路由器 IP 地址以及到达每个路由器的往返时间。
三.UDP协议
3.1 概述
UDP是一个简单的面向数据报的运输层协议:进程的每个输出操作都正好产生一个 U D P 数据报,并组装成一份待发送的 I P数据报。 这与面向流字符的协议不同,如 T C P,应用 程序产生的全体数据与真正发送的单个 I P数据报可能没有什么联系。
用户数据报协议 UDP(User Datagram Protocol)是无连接的,尽最大可能交付,没有拥塞控制,面向报文(对于应用程序传下来的报文不合并也不拆分,只是添加 UDP 首部),支持一对一、一对多、多对一和多对多的交互通信。
注意: UDP是传输层协议,和TCP协议处于一个分层中,但是与TCP协议不同,UDP协议并不提供超时重传,出错重传等功能,也就是说其是不可靠的协议。

3.2 UDP首部
UDP的首部占8个字节如下图:

TCP、UDP、IP详解
在ip首部为20个字节,由于数据封装是逐层进行的所有UDP的数据报为下图:

TCP、UDP、IP详解
UDP端口号

由于很多软件需要用到UDP协议,所以UDP协议必须通过某个标志用以区分不同的程序所需要的数据包。端口号的功能就在于此,例如某一个UDP程序A在系统中注册了3000端口,那么,以后从外面传进来的目的端口号为3000的UDP包都会交给该程序。端口号理论上可以有2^16这么多。因为它的长度是16个bit
UDP检验和

U D P和T C P在首部中都有覆盖它们首部和数据的检验和。 U D P的检验和是可选的,而T C P 的检验和是必需的。 (伪首部的长度为12个字节,所以TCP的长度一定为20)

TCP、UDP、IP详解
UDP检验和覆盖UDP协议头和数据,这和IP的检验和是不同的,IP协议的检验和只是覆盖IP数据头,并不覆盖所有的数据。UDP和TCP都包含一个伪首部,这是为了计算检验和而摄制的。伪首部甚至还包含IP地址这样的IP协议里面都有的信息,目的是让UDP两次检查数据是否已经正确到达目的地。如果发送端没有打开检验和选项,而接收端计算检验和有差错,那么UDP数据将会被悄悄的丢掉(不保证送达),而不产生任何差错报文。

3.3 UDP长度
理论上,I P数据报的最大长度是64K(65535字节)(2的16次幂),这是由I P首部16比特总长度字段所 限制的。去除 2 0字节的IP首部和8个字节的U D P首部,U D P数据报中用户数据的最长长度为 65507字节。但是一般网络在传送的时候,一次一般传送不了那么长的协议(涉及到MTU的问题),就只好对数据分片,当然,这些是对UDP等上级协议透明的,UDP不需要关心IP协议层对数据如何分片 。

在一个以太网上,数据帧的最大长度是 1 5 0 0字节 , 其中1 4 7 字节留给数据,假定 I P首部为2 0字节, 而且U D P首部为8字节,所以每片UDP最大数据为1472个字节

TCP、UDP、IP详解
另外需要解释几个术语: I P数据报是指 I P层端到端的传输单元(在分片之前和重新组装 之后),分组是指在I P层和链路层之间传送的数据单元。一个分组可以是一个完整的 I P数据报, 也可以是I P数据报的一个分片。

3.4 UDP服务器设计
​    UDP协议的某些特性将会影响我们的服务器程序设计,大致总结如下:

关于客户IP和地址:服务器必须有根据客户IP地址和端口号判断数据包是否合法的能力(这似乎要求每一个服务器都要具备)
关于目的地址:服务器必须要有过滤广播地址的能力。
关于数据输入:通常服务器系统的每一个端口号都会和一块输入缓冲区对应,进来的输入根据先来后到的原则等待服务器的处理,所以难免会出现缓冲区溢出的问题,这种情况下,UDP数据包可能会被丢弃,而应用服务器程序本身并不知道这个问题。
服务器应该限制本地IP地址,就是说它应该可以把自己绑定到某一个网络接口的某一个端口上。
3.5 UDP的应用
​    三种 I P地址:单播地址、广播地址和多播地址 ,广播和多播仅应用于 U D P

单播, 广播,多播
概念:有时一个主机要向网上的所有其他主机发送帧, 这就是广播 ,多播 (multicast) 处于单播和广播之间:帧仅传送给属于多播组的 多个主机。

广播和多播仅应用于 U D P,它们对需将报文同时传往多个接收者的应用来说十分重要 ,T C P是一个面向连接的协议,它意味着分别运行于两主机(由 I P地址确定)内的两进程(由 端口号确定)间存在一条连接。

I P多播提供两类服务:

向多个目的地址传送数据。有许多向多个接收者传送信息的应用:例如交互式会议系 统和向多个接收者分发邮件或新闻。如果不采用多播,目前这些应用大多采用 T C P来完成 (向每个目的地址传送一个单独的数据复制)。然而,即使使用多播,某些应用可能继续采用 T C P来保证它的可靠性。

客户对服务器的请求。例如,无盘工作站需要确定启动引导服务器。目前,这项服务 是通过广播来提供的,但是使用多播可降低不提供这项服务主机的负 担。

四.TCP协议
4.1 引言
尽管TCP和UDP都使用相同的网络层(I P),TCP却向应用层提供与UDP完全不同的服务。 TCP提供一种面向连接的、可靠的字节流服务。 所以TCP要比UDP可靠的多,UDP是把数据直接发出去,而不管对方是不是在收信,就算是UDP无法送达,也不会产生ICMP差错报文(ICMP:2.8小结)。
4.2 TCP的服务
TCP保证可靠性的简单工作原理如下 :

应用数据被分割成T C P认为最适合发送的数据块。这和 U D P完全不同,应用程序产生的 数据报长度将保持不变。由 T C P传递给I P的信息单位称为报文段或段( s e g m e n t)(参见 图1 - 7)。在1 8 . 4节我们将看到T C P如何确定报文段的长度。
当T C P发出一个段后,它启动一个定时器,等待目的端确认收到这个报文段。如果不能 及时收到一个确认,将重发这个报文段。在第 2 1章我们将了解T C P协议中自适应的超时 及重传策略。
当T C P收到发自T C P连接另一端的数据,它将发送一个确认。这个确认不是立即发送, 通常将推迟几分之一秒,这将在 1 9 . 3节讨论。
T C P将保持它首部和数据的检验和。这是一个端到端的检验和,目的是检测数据在传输 过程中的任何变化。如果收到段的检验和有差错, T C P将丢弃这个报文段和不确认收到 此报文段(希望发端超时并重发)。
既然T C P报文段作为I P数据报来传输,而 I P数据报的到达可能会失序,因此 T C P报文段 的到达也可能会失序。如果必要, T C P将对收到的数据进行重新排序,将收到的数据以 正确的顺序交给应用层。
既然I P数据报会发生重复,T C P的接收端必须丢弃重复的数据。
T C P还能提供流量控制。 T C P连接的每一方都有固定大小的缓冲空间。 T C P的接收端只 允许另一端发送接收端缓冲区所能接纳的数据。这将防止较快主机致使较慢主机的缓冲 区溢出
从这段话中可以看到,TCP中保持可靠性的方式就是超时重发,这是有道理的,虽然TCP也可以用各种各样的ICMP报文来处理这些,但是这也不是可靠的,最可靠的方式就是只要不得到确认,就重新发送数据报,直到得到对方的确认为止。

4.3 TCP 首部格式

TCP、UDP、IP详解
序号 :用于对字节流进行编号,例如序号为 301,表示第一个字节的编号为 301,如果携带的数据长度为 100 字节,那么下一个报文段的序号应为 401。
确认号 :期望收到的下一个报文段的序号。例如 B 正确收到 A 发送来的一个报文段,序号为 501,携带的数据长度为 200 字节,因此 B 期望下一个报文段的序号为 701,B 发送给 A 的确认报文段中确认号就为 701。
数据偏移 :指的是数据部分距离报文段起始处的偏移量,实际上指的是首部的长度。
确认 ACK :当 ACK=1 时确认号字段有效,否则无效。TCP 规定,在连接建立后所有传送的报文段都必须把 ACK 置 1。
同步 SYN :在连接建立时用来同步序号。当 SYN=1,ACK=0 时表示这是一个连接请求报文段。若对方同意建立连接,则响应报文中 SYN=1,ACK=1。
终止 FIN :用来释放一个连接,当 FIN=1 时,表示此报文段的发送方的数据已发送完毕,并要求释放连接。
窗口 :窗口值作为接收方让发送方设置其发送窗口的依据。之所以要有这个限制,是因为接收方的数据缓存空间是有限的。
4.4 TCP 的三次握手

TCP、UDP、IP详解
假设 A 为客户端,B 为服务器端。

首先 B 处于 LISTEN(监听)状态,等待客户的连接请求。
A 向 B 发送连接请求报文,SYN=1,ACK=0,选择一个初始的序号 x。
B 收到连接请求报文,如果同意建立连接,则向 A 发送连接确认报文,SYN=1,ACK=1,确认号为 x+1,同时也选择一个初始的序号 y。
A 收到 B 的连接确认报文后,还要向 B 发出确认,确认号为 y+1,序号为 x+1。
B 收到 A 的确认后,连接建立。
三次握手的原因

第三次握手是为了防止失效的连接请求到达服务器,让服务器错误打开连接。

客户端发送的连接请求如果在网络中滞留,那么就会隔很长一段时间才能收到服务器端发回的连接确认。客户端等待一个超时重传时间之后,就会重新请求连接。但是这个滞留的连接请求最后还是会到达服务器,如果不进行三次握手,那么服务器就会打开两个连接。如果有第三次握手,客户端会忽略服务器之后发送的对滞留连接请求的连接确认,不进行第三次握手,因此就不会再次打开连接。

4.5 TCP 的四次挥手

TCP、UDP、IP详解
以下描述不讨论序号和确认号,因为序号和确认号的规则比较简单。并且不讨论 ACK,因为 ACK 在连接建立之后都为 1。

A 发送连接释放报文,FIN=1。
B 收到之后发出确认,此时 TCP 属于半关闭状态,B 能向 A 发送数据但是 A 不能向 B 发送数据。
当 B 不再需要连接时,发送连接释放报文,FIN=1。
A 收到后发出确认,进入 TIME-WAIT 状态,等待 2 MSL(最大报文存活时间)后释放连接。
B 收到 A 的确认后释放连接。
四次挥手的原因

客户端发送了 FIN 连接释放报文之后,服务器收到了这个报文,就进入了 CLOSE-WAIT 状态。这个状态是为了让服务器端发送还未传送完毕的数据,传送完毕之后,服务器会发送 FIN 连接释放报文。

TIME_WAIT

客户端接收到服务器端的 FIN 报文后进入此状态,此时并不是直接进入 CLOSED 状态,还需要等待一个时间计时器设置的时间 2MSL。这么做有两个理由:

确保最后一个确认报文能够到达。如果 B 没收到 A 发送来的确认报文,那么就会重新发送连接释放请求报文,A 等待一段时间就是为了处理这种情况的发生。
等待一段时间是为了让本连接持续时间内所产生的所有报文都从网络中消失,使得下一个新的连接不会出现旧的连接请求报文。
4.6TCP 可靠传输
TCP 使用超时重传来实现可靠传输:如果一个已经发送的报文段在超时时间内没有收到确认,那么就重传这个报文段。

一个报文段从发送再到接收到确认所经过的时间称为往返时间 RTT,加权平均往返时间 RTTs 计算如下:
RTTs=(1−a)∗(RTTs)+a∗RTT RTTs=(1-a)*(RTTs)+a*RTT
RTTs=(1−a)∗(RTTs)+a∗RTT

超时时间 RTO 应该略大于 RTTs,TCP 使用的超时时间计算如下:
RTO=RTTs+4∗RTTd RTO=RTTs+4*RTT d
RTO=RTTs+4∗RTTd

其中 RTT d为偏差。

4.7 TCP 滑动窗口
窗口是缓存的一部分,用来暂时存放字节流。发送方和接收方各有一个窗口,接收方通过 TCP 报文段中的窗口字段告诉发送方自己的窗口大小,发送方根据这个值和其它信息设置自己的窗口大小。

发送窗口内的字节都允许被发送,接收窗口内的字节都允许被接收。如果发送窗口左部的字节已经发送并且收到了确认,那么就将发送窗口向右滑动一定距离,直到左部第一个字节不是已发送并且已确认的状态;接收窗口的滑动类似,接收窗口左部字节已经发送确认并交付主机,就向右滑动接收窗口。

接收窗口只会对窗口内最后一个按序到达的字节进行确认,例如接收窗口已经收到的字节为 {31, 34, 35},其中 {31} 按序到达,而 {34, 35} 就不是,因此只对字节 31 进行确认。发送方得到一个字节的确认之后,就知道这个字节之前的所有字节都已经被接收。

TCP、UDP、IP详解
4.8 TCP 流量控制
流量控制是为了控制发送方发送速率,保证接收方来得及接收。

接收方发送的确认报文中的窗口字段可以用来控制发送方窗口大小,从而影响发送方的发送速率。将窗口字段设置为 0,则发送方不能发送数据。

4.9 TCP 拥塞控制
如果网络出现拥塞,分组将会丢失,此时发送方会继续重传,从而导致网络拥塞程度更高。因此当出现拥塞时,应当控制发送方的速率。这一点和流量控制很像,但是出发点不同。流量控制是为了让接收方能来得及接收,而拥塞控制是为了降低整个网络的拥塞程度。

TCP、UDP、IP详解
TCP 主要通过四个算法来进行拥塞控制:慢开始、拥塞避免、快重传、快恢复。

发送方需要维护一个叫做拥塞窗口(cwnd)的状态变量,注意拥塞窗口与发送方窗口的区别:拥塞窗口只是一个状态变量,实际决定发送方能发送多少数据的是发送方窗口。

为了便于讨论,做如下假设:

接收方有足够大的接收缓存,因此不会发生流量控制;
虽然 TCP 的窗口基于字节,但是这里设窗口的大小单位为报文段。

TCP、UDP、IP详解

1. 慢开始与拥塞避免
发送的最初执行慢开始,令 cwnd = 1,发送方只能发送 1 个报文段;当收到确认后,将 cwnd 加倍,因此之后发送方能够发送的报文段数量为:2、4、8 …

注意到慢开始每个轮次都将 cwnd 加倍,这样会让 cwnd 增长速度非常快,从而使得发送方发送的速度增长速度过快,网络拥塞的可能性也就更高。设置一个慢开始门限 ssthresh,当 cwnd >= ssthresh 时,进入拥塞避免,每个轮次只将 cwnd 加 1。

如果出现了超时,则令 ssthresh = cwnd / 2,然后重新执行慢开始。

2. 快重传与快恢复
在接收方,要求每次接收到报文段都应该对最后一个已收到的有序报文段进行确认。例如已经接收到 M1 和 M2,此时收到 M4,应当发送对 M2的确认。

在发送方,如果收到三个重复确认,那么可以知道下一个报文段丢失,此时执行快重传,立即重传下一个报文段。例如收到三个 M2,则 M3 丢失,立即重传 M3。

在这种情况下,只是丢失个别报文段,而不是网络拥塞。因此执行快恢复,令 ssthresh = cwnd / 2 ,cwnd = ssthresh,注意到此时直接进入拥塞避免。

慢开始和快恢复的快慢指的是 cwnd 的设定值,而不是 cwnd 的增长速率。慢开始 cwnd 设定为 1,而快恢复 cwnd 设定为 ssthresh。

TCP、UDP、IP详解
五.问题总结
1.TCP和UDP有什么不同?
首先TCP和UDP都是传输层协议,它们的网络层协议都是IP协议,而IP协议具有两个特点:无连接、不可靠,UDP**(用户数据报协议)保留IP协议的特点,常用于广播和多播,而TCP(传输控制协议 (面向流字符的协议))**通过三次握手机制,为客户端和服务器提供全双工服务,同时还提供了超时和重发机制,保证传输数据不被丢失。
2.TCP协议如何保证数据不被丢失?
网络层协议还有个ICMP协议,ICMP协议常常认为是IP协议的一部分,由于IP协议对上层运输层和下层物理链路层是透明的,当发送数据报被丢弃时,ICMP会把错误信息反馈给TCP,而UDP不会得到任何返回信息,TCP解析后会进行数据重传。由于IP发送数据报可能会分片发送,TCP协议还有对数据进行重排在给应用增层。
3.为什么ICMP会把数据报异返回给TCP而不是UDP?
TCP的首部长度为20个字节,而UDP的首部长度为8字节,多的12个字节中有4个字节保存的是32位的ICMP信息,而ICMP数据包由8bit的错误类型和8bit的代码和16bit的校验和组成。
4.TCP和UDP每次传输的数据大小?
UDP是无连接的,发送一次数据报链接就断开了,因为32位IP是由4位(版本)+4位(头长度)+8位(服务类型)+16位(总长度:报头区+数据区)组成的所以最大传输数据为2的16次幂64K,UDP首部8位IP首部20位,所以UDP理论最大传输数据为64K-1bit-20bit-8bit(事实上受物理网络的限制,要比这个数值小很多) 。
TCP提供全双工服务,由于物理网络层一般要限制每次发送数据帧的最大长度,IP发送数据会分片发送,MTU(网络传输最大报文包)最大值为1500bit,所以TCP数据报最大为1500-20-20=1460bit(IP首部个TCP首部都是20bit),理想状态下**MSS(网络传输数据最大值 )**等于MTU,当然如果对于非本地的IP,这个MSS可能就只有536字节,而且,如果中间的传输网络的MSS更佳的小的话,这个值还会变得更小。