UDP 和 TCP 之间最大的区别:
TCP 是一个面向连接的协议,TCP 在 IP 报文的基础上,增加了诸如重传、确认、有序传输、拥塞控制等能力,通信的双方是在一个确定的上下文中工作的。
UDP 是一个面向报文的协议,UDP 没有这样一个确定的上下文,它是一个不可靠的通信协议,没有重传和确认,没有有序控制,也没有拥塞控制。(在 IP 报文的基础上,UDP 增加的能力有限)
既然如此,为什么还要使用 UDP 协议呢?
因为 UDP 比较简单,适合的场景还是比较多的,我们常见的 DNS 服务,SNMP 服务都是基于 UDP 协议的,这些场景对时延、丢包都不是特别敏感。另外多人通信的场景,如聊天室、多人游戏等,也都会使用到 UDP 协议。
UDP编程
recvfrom 和 sendto 是 UDP 用来接收和发送报文的两个主要函数:
#include <sys/socket.h> ssize_t recvfrom(int sockfd, void *buff, size_t nbytes, int flags, struct sockaddr *from, socklen_t *addrlen); ssize_t sendto(int sockfd, const void *buff, size_t nbytes, int flags, const struct sockaddr *to, socklen_t addrlen);recvfrom 函数:
sockfd参数:本地创建的套接字描述符。
buff参数:指向本地的缓存。
nbytes参数:表示最大接收数据字节。
flags参数:和I/O相关,暂时还用不到,设置为 0。
flags参数:和I/O相关,暂时还用不到,设置为 0。
from参数:对端发送方的地址和端口等信息。 (这和 TCP 非常不一样,TCP 是通过 accept 函数拿到的描述字信息来决定对端的信息。另外 UDP 报文每次接收都会获取对端的信息,也就是说报文和报文之间是没有上下文的。)
addrlen参数:from指向的结构体的字节大小。
返回值:实际接收的字节数。
sendto函数:
sockfd参数:本地创建的套接字描述符。
buff参数:指向发送的缓存。
nbytes参数:表示发送数据字节。
flags参数:和I/O相关,暂时还用不到,设置为 0。
flags参数:和I/O相关,暂时还用不到,设置为 0。
from参数:发送的对端地址和端口等信息。
addrlen参数:from指向的结构体的字节大小。
返回值:实际发送的字节数。
A 连接上: 接收→发送→接收→发送→…
B 连接上: 接收→发送→接收→发送→ …
UDP 的每次发送和接收都是一个独立的上下文,类似这样的过程:
接收 A→发送 A→接收 B→发送 B →接收 C→发送 C→ …
UDP 服务端例子
#include "lib/common.h" static int count; static void recvfrom_int(int signo) { printf("\nreceived %d datagrams\n", count); exit(0); } int main(int argc, char **argv) { int socket_fd; socket_fd = socket(AF_INET, SOCK_DGRAM, 0); struct sockaddr_in server_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_addr.s_addr = htonl(INADDR_ANY); server_addr.sin_port = htons(SERV_PORT); bind(socket_fd, (struct sockaddr *) &server_addr, sizeof(server_addr)); socklen_t client_len; char message[MAXLINE]; count = 0; signal(SIGINT, recvfrom_int); struct sockaddr_in client_addr; client_len = sizeof(client_addr); for (;;) { int n = recvfrom(socket_fd, message, MAXLINE, 0, (struct sockaddr *) &client_addr, &client_len); message[n] = 0; printf("received %d bytes: %s\n", n, message); char send_line[MAXLINE]; sprintf(send_line, "Hi, %s", message); sendto(socket_fd, send_line, strlen(send_line), 0, (struct sockaddr *) &client_addr, client_len); count++; } }12~13 行:首先创建一个套接字,注意这里的套接字类型是“SOCK_DGRAM”,表示的是 UDP 数据报。
15~21 行:与TCP服务器端类似,绑定数据报套接字到本地的一个端口上。
27 行: 为该服务器创建了一个信号处理函数,以便在响应“Ctrl+C”退出时,打印出收到的报文总数。
31~42 行:是该服务器端的主体,通过调用 recvfrom 函数获取客户端发送的报文,之后我们对收到的报文进行重新改造,加上“Hi”的前缀,再通过 sendto 函数发送给客户端对端。
UDP 客户端例子
#include "lib/common.h" # define MAXLINE 4096 int main(int argc, char **argv) { if (argc != 2) { error(1, 0, "usage: udpclient <IPaddress>"); } int socket_fd; socket_fd = socket(AF_INET, SOCK_DGRAM, 0); struct sockaddr_in server_addr; bzero(&server_addr, sizeof(server_addr)); server_addr.sin_family = AF_INET; server_addr.sin_port = htons(SERV_PORT); inet_pton(AF_INET, argv[1], &server_addr.sin_addr); socklen_t server_len = sizeof(server_addr); struct sockaddr *reply_addr; reply_addr = malloc(server_len); char send_line[MAXLINE], recv_line[MAXLINE + 1]; socklen_t len; int n; while (fgets(send_line, MAXLINE, stdin) != NULL) { int i = strlen(send_line); if (send_line[i - 1] == '\n') { send_line[i - 1] = 0; } printf("now sending %s\n", send_line); size_t rt = sendto(socket_fd, send_line, strlen(send_line), 0, (struct sockaddr *) &server_addr, server_len); if (rt < 0) { error(1, errno, "send failed "); } printf("send bytes: %zu \n", rt); len = 0; n = recvfrom(socket_fd, recv_line, MAXLINE, 0, reply_addr, &len); if (n < 0) error(1, errno, "recvfrom failed"); recv_line[n] = 0; fputs(recv_line, stdout); fputs("\n", stdout); } exit(0); }10~11 行:创建一个类型为“SOCK_DGRAM”的套接字。
13~17 行:初始化目标服务器的地址和端口。
28~51 行:程序主体,从标准输入中读取的字符进行处理后,调用 sendto 函数发送给目标服务器端,然后再次调用 recvfrom 函数接收目标服务器发送过来的新报文,并将其打印到标准输出上。
场景一:只运行客户端
如果我们只运行客户端,程序会一直阻塞在 recvfrom 上。
$ ./udpclient 127.0.0.1 1 now sending g1 send bytes: 2 <阻塞在这里>如果不开启服务端,TCP 客户端的 connect 函数会直接返回“Connection refused”报错信息。而在 UDP 程序里,则会一直阻塞在这里。
场景二:先开启服务端,再开启客户端
$./udpserver received 2 bytes: g1 received 2 bytes: g2
$./udpclient 127.0.0.1 g1 now sending g1 send bytes: 2 Hi, g1 g2 now sending g2 send bytes: 2 Hi, g2在客户端一次输入 g1、g2,服务器端在屏幕上打印出收到的字符,并且可以看到,客户端也收到了服务端的回应:“Hi,g1”和“Hi,g2”。
场景三: 开启服务端,再一次开启两个客户端
$./udpserver received 2 bytes: g1 received 2 bytes: g2 received 2 bytes: g3 received 2 bytes: g4
$./udpclient 127.0.0.1 now sending g1 send bytes: 2 Hi, g1 g3 now sending g3 send bytes: 2 Hi, g3
$./udpclient 127.0.0.1 now sending g2 send bytes: 2 Hi, g2 g4 now sending g4 send bytes: 2 Hi, g4两个客户端发送的报文,依次都被服务端收到,并且客户端也可以收到服务端处理之后的报
如果此时把服务器端进程杀死,就可以看到信号函数在进程退出之前,打印出服务器端接收到的报文个数。
$ ./udpserver received 2 bytes: g1 received 2 bytes: g2 received 2 bytes: g3 received 2 bytes: g4 ^C received 4 datagrams之后,再重启服务器端进程,并使用客户端 1 和客户端 2 继续发送新的报文,可以看到和 TCP 非常不同的结果。
服务器端重启后可以继续收到客户端的报文,这在 TCP 里是不可以的,TCP 断连之后必须重新连接才可以发送报文信息。但是 UDP 报文的“无连接”的特点,可以在 UDP 服务器重启之后,继续进行报文的发送,这就是 UDP 报文“无上下文”的最好说明。
$ ./udpserver received 2 bytes: g1 received 2 bytes: g2 received 2 bytes: g3 received 2 bytes: g4 ^C received 4 datagrams $ ./udpserver received 2 bytes: g5 received 2 bytes: g6
$./udpclient 127.0.0.1 now sending g1 send bytes: 2 Hi, g1 g3 now sending g3 send bytes: 2 Hi, g3 g5 now sending g5 send bytes: 2 Hi, g5
$./udpclient 127.0.0.1 now sending g2 send bytes: 2 Hi, g2 g4 now sending g4 send bytes: 2 Hi, g4 g6 now sending g6 send bytes: 2 Hi, g6
注:UDP没有发送缓冲区这个概念,因为发往UDP发送缓冲区的包只要超过一定阈值(值很小)就可以发往对端。所以我们一般认为UDP是没有发送缓冲区的。
思考
1. recvfrom 一直处于阻塞状态中,这是非常不合理的,你觉得这种情形应该怎么处理呢?
一直阻塞会导致程序无法正常退出,可以使用接收超时、IO多路复用的超时机制。
2. 既然 UDP 是请求 - 应答模式的,那么请求中的 UDP 报文最大可以是多大呢?
IP和UDP头中都有16bit的长度字段,用UDP协议发送时,用sendto函数最大能发送数据的长度为:65535- IP头(20) - UDP头(8)=65507字节。由于IP有最大MTU,因此,
UDP 包的大小应该是 1500 - IP头(20) - UDP头(8) = 1472(Bytes)
TCP 包的大小应该是 1500 - IP头(20) - TCP头(20) = 1460 (Bytes)