『网络』浅谈UDP协议
UDP概述
Internet协议集支持一个无连接的传输协议,该协议称为用户数据报协议(UDP,User Datagram Protocol)。是OSI参考模型中一种无连接的传输层协议。UDP为应用程序提供了一种无须建立连接就可发送封装的IP数据报的方法。
UDP首部
- UDP头大小为8个字节。
- 16位UDP长度标识的是整个数据报(UDP头+数据)的最大长度。所以整个数据包的最大为65535字节。也就是说sendto最大能发的数据为64K - 8K = 56K。如果要发送的数据超过56K,则会报错。所以,如果需要传输大于56K的数据,用户需要在应用层将数据分割成一个个小段进行传输。但是UDP的传输并不保证数据报的有序到达,因此还需要用户在应用层进行包序管理。
-
16位校验和提供了额外的可靠性。检验和用来检测用户数据报在传输中是否有错,有错就丢弃。
-
UDP的校验和需要计算UDP首部加数据荷载部分,但也需要加上UDP伪头部。伪头部+UDP头部+数据一起计算校验和。
-
校验和计算
将伪首部加到UDP上。
将检验和字段置0。
把所有位划分为16位的字,即以16位的字为单位。
把所有的16位的字相加,如果遇到进位,将高于16位的进位部分加到最低位上。例如:0xF158 + 0x3A40 = 0x1 2B98。将1加到最低位,得到结果0x2B99。
将所有16位的字相加得到的结果应该是一个16位的数,将该数取反得到的就是检验和。 -
UDP校验和原理
发送端,进行校验和的计算。并将得到的检验和写入校验和字段。
接收端在收到UDP数据报以后,从IP首部获知IP地址信息构造UDP伪首部,再进行校验和计算(包含校验和字段)。校验和字段的值是检验和字段以外剩下部分的1的补码和。因此,包括校验和字段在内的所有数据之和的结果为“16位全部为1”时,才会被认为所受到的数据是正确的。
- 另外,UDP中也有可能不用校验和。此时,校验和字段中填入0。这种情况下,由于不进行校验和计算,协议处理的开销就会降低,从而可以提高数据转发的速度。然后,如果UDP首部的端口号或是IP首部的IP地址遇到损坏,那么可能会对其他通信造成不好的影响。因此,在互联网中比较推荐使用检验和检查。
UDP的特点
- 无连接:知道对端的IP和端口号就可以直接进行传输,不需要建立连接。
- 不可靠:没有确认机制,没有重传机制;如果因为网络故障该段无法发到对端,UDP协议也不会给应用层返回任何错误信息。
- 面向数据报:不能够灵活的控制读写数据的次数和数量。
面向数据报
- UDP提供整条数据向应用层交付(不会出现半条数据,因为头部中有报文长度标识)。也正是因为数据报长度在协议头中有标识,因此UDP不会产生粘包问题。
- 应用层交给UDP多长的报文,UDP原样发送,既不会拆分,也不会合并。
- 比如说用UDP传输100个字节的数据,如果发送端调用一次sendto,发送100个字节,那么接受端也必须调用对应的一次recvfrom,接收100个字节;而不能循环调用10次recvfrom,每次接收10个字节。
UDP的缓冲区
- sendto()会把数据放到send buf(缓冲区),通知OS来取,OS在适当时候来取数据,并发到网络。这意味着,存入数据和发送数据是异步的,如果存入数据太快,缓冲区会满。
-
OS不停的从网络上接收数据,存到recv buf中,recv()从recv buf中取数据,如果不及时取走,缓冲区也可能会满。
注意:recv buf不能保证收到的UDP包的顺序和发送UDP包的顺序一致。
缓冲区满了的处理方式:
- send buf满:
- recv buf满:如果接收缓冲区满了,再到达的UDP数据就会被丢弃。
UDP的socket既能读也能写,全双工。
UDP使用注意事项
我们注意到,UDP协议头中有一个16位的最大长度。也就是说一个UDP能传输的数据最大长度是64K(包含UDP首部)。
然而64K在当今的互联网环境下,是一个非常小的数字。
如果我们需要传输的数据超过64K,就需要在应用层手动分包,多次发送,并在接收端手动拼装。
基于UDP的应用层协议
- NFS:网络文件系统。
- TFTP:简单文件传输协议。
- DHCP:动态主机配置协议。
- BOOTP:启动协议(用于无盘设备启动)。
- DNS:域名解析协议。
- 自己写UDP程序时自定义的应用层协议。
UDP实现可靠传输
参考TCP的可靠性机制,在应用层实现下述逻辑:
- 引入***,保证数据顺序。
- 引入确认应答,确保对端收到了数据。
- 引入超时重传,如果隔一时间没有应答,就重发数据。等等。