从一个例子开始

客户端在 UDP 套接字上调用 connect 函数,之后将标准输入的字符串发送到服务器端,并从服务器端接收处理后的报文。
#include "lib/common.h"
# define    MAXLINE     4096

int main(int argc, char **argv) {
    if (argc != 2) {
        error(1, 0, "usage: udpclient1 <IPaddress>");
    }

    int socket_fd;
    socket_fd = socket(AF_INET, SOCK_DGRAM, 0);

    struct sockaddr_in server_addr;
    bzero(&server_addr, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(SERV_PORT);
    inet_pton(AF_INET, argv[1], &server_addr.sin_addr);

    socklen_t server_len = sizeof(server_addr);
    if (connect(socket_fd, (struct sockaddr *) &server_addr, server_len)) {
        error(1, errno, "connect failed");
    }

    struct sockaddr *reply_addr;
    reply_addr = malloc(server_len);

    char send_line[MAXLINE], recv_line[MAXLINE + 1];
    socklen_t len;
    int n;

    while (fgets(send_line, MAXLINE, stdin) != NULL) {
        int i = strlen(send_line);
        if (send_line[i - 1] == '\n') {
            send_line[i - 1] = 0;
        }

        printf("now sending %s\n", send_line);
        size_t rt = sendto(socket_fd, send_line, strlen(send_line), 0, (struct sockaddr *) &server_addr, server_len);
        if (rt < 0) {
            error(1, errno, "sendto failed");
        }
        printf("send bytes: %zu \n", rt);
        
        len = 0;
        recv_line[0] = 0;
        n = recvfrom(socket_fd, recv_line, MAXLINE, 0, reply_addr, &len);
        if (n < 0)
            error(1, errno, "recvfrom failed");
        recv_line[n] = 0;
        fputs(recv_line, stdout);
        fputs("\n", stdout);
    }

    exit(0);
}
9-10 行:  创建了一个 UDP 套接字;
12-16 行:创建了一个 IPv4 地址,绑定到指定端口和IP;
20-22 行:调用 connect 将 UDP 套接字和 IPv4 地址进行了“绑定”(这里 connect 函数的名称有点让人误解,其实可能更好的选择是叫做 setpeername);
31-55 行:读取标准输入字符串后,调用 sendto 发送给对端;之后调用 recvfrom 等待对端的响应,并把对端响应信息打印到标准输出。

在没有开启服务端的情况下,运行一下这个程序:
$ ./udpconnectclient 127.0.0.1
g1
now sending g1
send bytes: 2
recvfrom failed: Connection refused (111)
会不会觉得很奇怪?不是说好 UDP 是“无连接”的协议吗?不是说好 UDP 客户端只会阻塞在 recvfrom 这样的调用上吗?

UDP connect 的作用

UDP connect 函数的调用,并不会引起和服务端的网络交互,也就是说,并不会触发所谓的“握手”报文发送和应答。
意义:为了让应用程序能够接收“异步错误”的信息
  • 不调用 connect 操作的UDP客户端程序:在服务器端不开启的情况下,客户端程序是不会报错的,程序只会阻塞在 recvfrom 上,等待返回(或者超时)
  • 调用 connect 操作的UDP客户端程序:将 UDP 套接字建立了“上下文”,该套接字和 服务器端的地址和端口 产生了联系,正是这种绑定关系 给了操作系统内核必要的信息,能够将操作系统内核收到的信息 和对应的套接字进行关联
当调用 sendto 或者 send 操作函数时,应用程序报文被发送,应用程序返回,操作系统内核接管了该报文,之后开始尝试 往对应的地址和端口发送。因为对应的地址和端口不可达,一个 ICMP 报文会返回给操作系统内核,该 ICMP 报文含有目的地址和端口等信息。
  • 如果不进行 connect 操作,没法建立(UDP套接字 —— 目的地址+端口)之间的映射关系,操作系统内核就没有办法把 ICMP不可达的信息 和 UDP 套接字 进行关联,也就没有办法将 ICMP 信息通知给应用程序。
  • 如果进行了 connect 操作,帮助操作系统内核建立了(UDP套接字 —— 目的地址+端口)之间的映射关系,当收到一个 ICMP 不可达报文时,操作系统内核可以从映射表中 找出是哪个UDP套接字 拥有该目的地址和端口,当在该套接字上再次调用 recvfrom 或 recv 方法时,就可以收到操作系统内核返回的 “Connection Refused” 的信息。

收发函数

在对 UDP 进行 connect 之后,关于收发函数的使用,很多书籍是这样推荐的:
  • 使用 send 或 write 函数来发送,如果使用 sendto 需要把相关的 to 地址信息置零;
  • 使用 recv 或 read 函数来接收,如果使用 recvfrom 需要把对应的 from 地址信息置零。
注:不同的 UNIX 实现对此表现出来的行为不尽相同。考虑到兼容性,也推荐这些常规做法。

服务器端 connect 的例子

一般来说,服务器端不会主动发起 connect 操作,因为一旦如此,服务器端就只能响应一个客户端了。不过,有时候也不排除这样的情形,一旦一个客户端和服务器端发送 UDP 报文之后,该服务器端就要服务于这个唯一的客户端。

服务端:
#include "lib/common.h"

static int count;

static void recvfrom_int(int signo) {
    printf("\nreceived %d datagrams\n", count);
    exit(0);
}

int main(int argc, char **argv) {
    int socket_fd;
    socket_fd = socket(AF_INET, SOCK_DGRAM, 0);

    struct sockaddr_in server_addr;
    bzero(&server_addr, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
    server_addr.sin_port = htons(SERV_PORT);

    bind(socket_fd, (struct sockaddr *) &server_addr, sizeof(server_addr));

    socklen_t client_len;
    char message[MAXLINE];
    message[0] = 0;
    count = 0;

    signal(SIGINT, recvfrom_int);

    struct sockaddr_in client_addr;
    client_len = sizeof(client_addr);

    int n = recvfrom(socket_fd, message, MAXLINE, 0, (struct sockaddr *) &client_addr, &client_len);
    if (n < 0) {
        error(1, errno, "recvfrom failed");
    }
    message[n] = 0;
    printf("received %d bytes: %s\n", n, message);

    if (connect(socket_fd, (struct sockaddr *) &client_addr, client_len)) {
        error(1, errno, "connect failed");
    }

    while (strncmp(message, "goodbye", 7) != 0) {
        char send_line[MAXLINE];
        sprintf(send_line, "Hi, %s", message);

        size_t rt = send(socket_fd, send_line, strlen(send_line), 0);
        if (rt < 0) {
            error(1, errno, "send failed ");
        }
        printf("send bytes: %zu \n", rt);

        size_t rc = recv(socket_fd, message, MAXLINE, 0);
        if (rc < 0) {
            error(1, errno, "recv failed");
        }
        
        count++;
    }

    exit(0);
}
11-12 行: 创建 UDP 套接字;
14-18 行: 创建 IPv4 地址,绑定到 ANY 和对应端口;
20 行:      绑定 UDP 套接字和 IPv4 地址;
27 行:      为该程序注册一个信号处理函数,以响应 Ctrl+C 信号量操作;
32-37 行:调用 recvfrom 等待客户端报文到达,并将客户端信息保持到 client_addr 中;
39-41 行:调用 connect 操作,将 UDP 套接字和客户端 client_addr 进行绑定;
43-59 行:对接收的信息进行重新处理,加上”Hi“前缀后发送给客户端,并持续不断地从客户端接收报文,该过程一直持续,直到客户端发送“goodbye”报文为止。

客户端:
#include "lib/common.h"
# define    MAXLINE     4096

int main(int argc, char **argv) {
    if (argc != 2) {
        error(1, 0, "usage: udpclient3 <IPaddress>");
    }

    int socket_fd;
    socket_fd = socket(AF_INET, SOCK_DGRAM, 0);

    struct sockaddr_in server_addr;
    bzero(&server_addr, sizeof(server_addr));
    server_addr.sin_family = AF_INET;
    server_addr.sin_port = htons(SERV_PORT);
    inet_pton(AF_INET, argv[1], &server_addr.sin_addr);

    socklen_t server_len = sizeof(server_addr);

    if (connect(socket_fd, (struct sockaddr *) &server_addr, server_len)) {
        error(1, errno, "connect failed");
    }

    char send_line[MAXLINE], recv_line[MAXLINE + 1];
    int n;

    while (fgets(send_line, MAXLINE, stdin) != NULL) {
        int i = strlen(send_line);
        if (send_line[i - 1] == '\n') {
            send_line[i - 1] = 0;
        }

        printf("now sending %s\n", send_line);
        size_t rt = send(socket_fd, send_line, strlen(send_line), 0);
        if (rt < 0) {
            error(1, errno, "send failed ");
        }
        printf("send bytes: %zu \n", rt);

        recv_line[0] = 0;
        n = recv(socket_fd, recv_line, MAXLINE, 0);
        if (n < 0)
            error(1, errno, "recv failed");
        recv_line[n] = 0;
        fputs(recv_line, stdout);
        fputs("\n", stdout);
    }

    exit(0);
}
9-10 行:  创建了一个 UDP 套接字;
12-16 行:创建了一个 IPv4 地址,绑定到指定端口和 IP;
20-22 行:调用 connect 将 UDP 套接字和 IPv4 地址进行了“绑定”;
27-46 行:读取标准输入字符串后,调用 send 发送给对端;之后调用 recv 等待对端的响应,并把对端响应信息打印到标准输出。

先启动服务器端程序,然后依次开启两个客户端,分别是客户端 1、客户端 2,并且让客户端 1 先发送 UDP 报文。
$ ./udpconnectserver
received 2 bytes: g1
send bytes: 6
 ./udpconnectclient2 127.0.0.1
g1
now sending g1
send bytes: 2
Hi, g1
./udpconnectclient2 127.0.0.1
g2
now sending g2
send bytes: 2
recv failed: Connection refused (111)
客户端 1 先发送报文,服务端随之通过 connect 和客户端 1 进行了“绑定”。这样,客户端 2 从操作系统内核得到了 ICMP 的错误,该错误在 recv 函数中返回,显示了“Connection refused”的错误信息。

性能考虑

一般来说,客户端通过 connect 绑定服务端的地址和端口,对 UDP 而言,可以有一定程度的性能提升
每次发送报文需要的过程:
  • 如果不使用 connect 方式:连接套接字 → 发送报文 → 断开套接字 → 连接套接字 → 发送报文 → 断开套接字  → ………
  • 如果使用 connect 方式:    连接套接字 → 发送报文 → 发送报文 → …… → 最后断开套接字
连接套接字是需要一定开销的,比如需要查找路由表信息。

总结

之所以对 UDP 使用 connect,绑定本地地址和端口,是为了让程序可以 快速获取异步错误信息的通知,同时也可以获得一定性能上的提升。

思考题

1. 可以对一个 UDP 套接字进行多次 connect 操作吗? 
可以
2. 如果想使用多播或广播,我们应该怎么去使用 connect 呢?