1、引言
UDP是一个简单的面向数据报的运输层协议:进程的每个输出操作都正好产生一个UDP数据报,并组装成一份待发送的IP数据报。UDP数据报封装成一份IP数据报的格式如图11-1所示。

说明:
(1)UDP不提供可靠性:它把应用程序传给IP层的数据发送出去,但是并不保证它们能到达目的地。
(2)应用程序必须关心IP数据报的长度。如果它超过网络的MTU,就要对IP数据报进行分片。如果需要,源端到目的端之间的每个网络都要进行分片,并不只是发送端主机连接第一个网络才这样做(路径MTU与网络MTU的概念可以参考:《TCP/IP详解卷1:协议》第2章 链路层-读书笔记)。
2、UDP首部
UDP首部的各字段如图11-2所示。

说明:
(1)端口号表示发送进程和接收进程。TCP端口号与UDP端口号是相互独立的。如果TCP和UDP同时提供某种知名服务,两个协议通常选择相同的端口号,只是为了方便,而不是协议本身的要求。
(2)UDP长度字段指的是UDP首部和UDP数据的字节长度。该字段的最小值为8字节(发送一份0字节的UDP数据报是可以的)。这个UDP长度是有冗余的。
(3)UDP数据报长度是全长减去IP首部的长度。
3、UDP检验和
UDP检验和覆盖UDP首部和UDP数据。而IP首部的检验和,只覆盖IP的首部,并不覆盖IP数据报中的任何数据。UDP和TCP在首部中都有覆盖它们首部和数据的检验和。UDP的检验和是可选的,而TCP的检验和是必需的。UDP检验和的基本计算方法IP首部检验和计算方法相似(16 bit字的二进制反码和),但它们之间存在不同的地方:
(1)UDP数据报的长度可以为奇数字节,但检验和算法是把若干个16 bit字相加。解决方法是必要时在最后增加填充字节0,这只是为了检验和的计算,可能增加的填充字节不被传送。
(2)UDP数据报和TCP段都包含一个12字节长的伪首部,它是为了计算检验和而设置的。伪首部包含IP首部一些字段,目的是让UDP两次检查数据是否已经正确到达目的地。UDP数据报中的伪首部格式如图11-3所示。

说明:
(1)UDP数据报的长度在检验和计算过程中出现两次。
(2)如果检验和的计算结果为0,则存入的值为全1(65535),这在二进制反码计算中是等效的。如果传送的检验和为0,说明发送端没有计算检验和。
(3)如果发送端没有计算检验和而接收端检测到检验和有差错,UDP数据报就要被丢弃。不产生任何差错报文(当IP层检测到IP首部检验和有差错时也这样做)。
(4)UDP检验和是一个端到端的检验和。它由发送端计算,然后由接收端验证。其目的是为了发现UDP首部和数据在发送端到接收端之间发生的任何改动。
(5)尽管UDP检验和是可选的,但是它们应该总是在用。
(6)UDP检验和(事实上,TCP/IP协议簇中所有的检验和)是简单的16 bit和。它们检测不出交换两个16 bit的差错。
4、IP分片
物理、网络层一般要限制每次发送数据帧的最大长度。任何时候IP层接收到一份要发送的IP数据报时,它要判断向本地哪个接口发送数据(选路),并查询该接口获得其MTU。IP把MTU与数据报长度进行比较,如果需要则进行分片。
说明:
(1)分片可以发生在原始发送端主机上,也可以发生在中间路由器上。
(2)把一份IP数据报分片以后,只有到达目的地才进行重新组装。重新组装由目的端的IP层来完成,目的是使分片和重新组装过程对运输层(TCP和UDP)是透明的。
注意:其他网络协议可能要求在下一站就进行进行重新组装,而不是在最终的目的地。
(3)已经分片过的数据报有可能会再次进行分片(可能不止一次)。
IP首部中包含的数据为分片和重新组装提供了足够的信息。

IP分片过程:
(1)对于发送端发送的每份IP数据报,标识字段都包含一个唯一值,该值在数据报分片时被复制到每个片中。
(2)标志字段用其中一个比特来表示“更多的片”。除了最后一片外,其他每个组成数据报的片都要把该比特置1。
(3)片偏移字段指的是该片偏移原始数据报开始处的位置。
说明:
(1)当数据报被分片后,每个片的总长度值要改为该片的长度值。
(2)标志字段中有一个比特称作“不分片”位。如果将这一比特置1,IP将不对数据报进行分片。相反把数据报丢弃并发送一个ICMP差错报文给起始端。
(3)当IP数据报被分片后,每一片都成为一个分组,具有自己的IP首部,并在选择路由时与其他分组独立。当数据报的这些片到达目的端时有可能会失序,但在IP首部中有足够的信息让接收端能正确组装这些数据报片。
(4)在分片时,除最后一片外,其他每一片中的数据部分(除IP首部外的其余部分)必须是8字节的整数倍。
(5)任何运输层首部只出现在第1片数据中。
5、ICMP不可达差错(需要分片)
发生ICMP不可达差错的另一种情况是(前面讲过端口不一致也会导致ICMP不可达差错),当路由器收到一份需要分片的数据报,而在IP首部又设置了不分片(DF)的标志比特。
如果某个程序需要判断到达目的端的路途中最小MTU是多少(路径MTU发现机制),那么这个差错就可以被该程序使用。报文格式如图11-9所示:

6、最大UDP数据报长度
理论上,IP数据报的最大长度是65535字节(IP首部16比特总长度字段)。去除20字节的IP首部和8字节的UDP首部,UDP数据报中用户数据的最大长度为65507字节。但实际大多数实现所提供的长度比这个最大值小。
(1)应用程序可能会受到其程序接口的限制
socket API提供了一个可供应用程序调用的函数,以设置接收和发送缓存的长度。这个长度与应用程序可以读写的最大UDP数据报的长度直接相关,现在的大部分系统都默认提供可读写大于8192字节的UDP数据报。
(2)限制来自于TCP/IP的内核实现。
可能存在一些实现特性(或差错),使IP数据报长度小于65535字节。
数据报截断:
IP能够发送或接收特定长度的数据报并不意味着接收应用程序可以读取该长度的数据。UDP编程接口允许应用程序指定每次返回的最大字节数。如果接收到的数据报长度大于应用程序所能处理的长度,发生的情况取决于编程接口和实现。例如:Berkeley版socket API对数据报进行截断,并丢弃任何多余的数据。
7、ICMP源站抑制差错
当一个系统(路由器或主机)接收数据报的速度比其处理速度快时,可能产生这个差错。
注意:“可能”产生这个差错。即使一个系统已经没有缓存并丢弃数据报,也不要求它一定要发送源站抑制报文。

8、UDP服务器的设计
对于服务器来说,它启动后处于休眠状态,等待客户请求的到来。对于UDP来说,当客户数据报到达时,服务器苏醒过来,数据报中可能包含来自客户的某种形式的请求消息。
(1)客户IP地址及端口号
IP首部包含源端和目的端IP地址,UDP首部包含了源端和目的端的UDP端口号。当一个应用程序接收到UDP数据报时,操作系统必须告诉它是谁发送了这份消息,即源IP地址和端口号。这个特性允许一个交互UDP服务器对多个客户进行处理。给每个发送请求的客户发回应答。
(2)目的IP地址
一些应用程序需要知道数据报是发送给谁的,即目的IP地址。这要求操作系统从接收到的UDP数据报中将目的IP地址交给应用程序。
(3)UDP输入队列
大多数UDP服务器是交互服务器。这意味着,单个服务器进程对单个UDP端口上(服务器上的名知端口)的所有客户请求进行处理。
通常程序所使用的每个UDP端口都与一个有限大小的输入队列相联系。来自不同客户的差不多同时到达的请求将由UDP自动排队。接收到的UDP数据报以其接收顺序交给应用程序
排队溢出造成内核中的UDP模块丢弃数据报的可能性是存在的。
1)应用程序并不知道其输入队列何时溢出。只是由UDP对超出数据报进行丢弃处理。
2)没有发回任何信息告诉客户其数据报被丢弃。
(4)限制本地IP地址
大多数UDP服务器在创建UDP端点时都使其本地IP地址具有通配符(wildcard)的特点。表明进入的UDP数据报如果其目的地为服务器端口,那么在任何本地接口均可接收到它。
另一方面,当服务器创建端点时,它可以把其中一个主机本地IP地址包括广播地址指定为端点的本地IP地址。只有当目的IP地址与指定的地址相匹配时,进入的UDP数据报才能被送到这个端点。
(5)限制远端IP地址
大多数系统都允许UDP端点对远端地址进行限制,即端点将只能接收特定IP地址和端口号的UDP数据报。
(6)每个端口有多个接收者
大多数系统在某一时刻只允许一个程序端点与某个本地IP地址及UDP端口号相关联。当目的地为该IP地址及端口号的UDP数据报到达主机时,就复制一份传给该端点。
然而,在一个支持多播的系统上,多个端点可以使用同一个IP地址和UDP端口号。
当UDP数据报到达的目的IP地址为广播地址或多播地址,而且在目的IP地址和端口号处有多个端点时,就向每个端点传送一份数据报的复制。如果UDP数据报到达的是一个单播地址,那么只向其中一个端点传送一份数据报的复制。选择哪个端点传送数据取决于各个不同的系统实现。
小结:
(1)UDP是一个简单协议,它向用户进程提供的服务位于IP层之上,包括端口号和可选的检验和。ICMP不可达差错,是新的路径MTU发现功能中的一部分。
(2)对于UDP和ARP之间的接口,大多数的ARP实现在等待ARP应答时只保留最近传送给目的端的数据报。
(3)当系统接收IP数据报的速率超过这些数据报被处理的速率时,系统可能发送ICMP源站抑制差错报文。使用UDP时很容易产生这样的ICMP差错。