深入理解Linux网络（四）：TCP接收阻塞

🕗 发布于 2024-07-21 15:16 网络 linux tcp/ip

TCP socket 接收函数 recv 发出 recvfrom 系统调用。
进⼊系统调⽤后，⽤户进程就进⼊到了内核态，通过执⾏⼀系列的内核协议层函数，然后到 socket 对象的接收队列中查看是否有数据，没有的话就把⾃⼰添加到 socket 对应的等待队列⾥。最后让出CPU，操作系统会选择下⼀个就绪状态的进程来执⾏。
在这里插入图片描述
假如我们没有使⽤ O_NONBLOCK 标记，等待接收的过程会阻塞进程，但是我们先探究阻塞的过程。

//file: net/socket.c
SYSCALL_DEFINE6(recvfrom, int, fd, void __user *, ubuf, size_t,
 size, unsigned int, flags, struct sockaddr __user *, addr,
 int __user *, addr_len)
{
 struct socket *sock;
 //根据⽤户传⼊的 fd 找到 socket 对象
 sock = sockfd_lookup_light(fd, &err, &fput_needed);
 ......
 err = sock_recvmsg(sock, &msg, size, flags);
 ......
}

sock_recvmsg -> __sock_recvmsg -> __sock_recvmsg_nosec

static inline int __sock_recvmsg_nosec(struct kiocb *iocb, struct socket *sock,
 struct msghdr *msg, size_t size, int flags)
{
 ......
 return sock->ops->recvmsg(iocb, sock, msg, size, flags);
}

在之前的 socket 对象图中，从图中看到 recvmsg 指向的是 inet_recvmsg 方法。
在这里插入图片描述

//file: net/ipv4/af_inet.c
int inet_recvmsg(struct kiocb *iocb, struct socket *sock,
struct msghdr *msg, size_t size, int flags)
{
 ...
 err = sk->sk_prot->recvmsg(iocb, sk, msg, size, flags & MSG_DONTWAIT,
 flags & ~MSG_DONTWAIT, &addr_len);

这里又出现了一个 recvmsg 函数指针，不过这个是socket 对象中的 recvmsg 方法，对应 TCP 协议的 tcp_recvmsg 方法。

//file: net/ipv4/tcp.c
int tcp_recvmsg(struct kiocb *iocb, struct sock *sk, struct msghdr *msg,
 size_t len, int nonblock, int flags, int *addr_len)
{
 int copied = 0;
 ...
 do {
  //遍历接收队列接收数据
  skb_queue_walk(&sk->sk_receive_queue, skb) {
  ...
 }
 ...
 }
 if (copied >= target) {
  release_sock(sk);
  lock_sock(sk);
  } else //没有收到⾜够数据，启⽤ sk_wait_data 阻塞当前进程
  sk_wait_data(sk, &timeo);
}

可以看到，消息量不够，一样也会阻塞。
在这里插入图片描述
如果没有收到数据，或者收到不⾜够多，则调⽤ sk_wait_data 把当前进程阻塞掉。

//file: net/core/sock.c
int sk_wait_data(struct sock *sk, long *timeo)
{
 //当前进程(current)关联到所定义的等待队列项上
 DEFINE_WAIT(wait);
 // 调⽤ sk_sleep 获取 sock 对象下的 wait
 // 并准备挂起，将进程状态设置为可打断 INTERRUPTIBLE
 prepare_to_wait(sk_sleep(sk), &wait, TASK_INTERRUPTIBLE);
 set_bit(SOCK_ASYNC_WAITDATA, &sk->sk_socket->flags);
 // 通过调⽤schedule_timeout让出CPU，然后进⾏睡眠
 rc = sk_wait_event(sk, timeo, !skb_queue_empty(&sk->sk_receive_queue));
 ...

sk_wait_data 阻塞进程的实现：
在这里插入图片描述
做完排队工作后，给所在进程改个状态位即可。
⾸先在 DEFINE_WAIT 宏下，定义了⼀个等待队列项 wait。在这个新的等待队列项上，注册了回调函数 autoremove_wake_function，并把当前进程描述符 current 关联到其 .private 成员上。

//file: include/linux/wait.h
#define DEFINE_WAIT(name) DEFINE_WAIT_FUNC(name, autoremove_wake_function)
#define DEFINE_WAIT_FUNC(name, function) \
 wait_queue_t name = { \
 .private = current, \
 .func = function, \
 .task_list = LIST_HEAD_INIT((name).task_list), \
 }

紧接着在 sk_wait_data 中调⽤ sk_sleep 获取 sock 对象下的等待队列列表头 wait_queue_head_t。
sk_sleep 源代码如下：

//file: include/net/sock.h
static inline wait_queue_head_t *sk_sleep(struct sock *sk)
{
 BUILD_BUG_ON(offsetof(struct socket_wq, wait) != 0);
 return &rcu_dereference_raw(sk->sk_wq)->wait;
}

接着调⽤ prepare_to_wait 来把新定义的等待队列项 wait 插⼊到 sock 对象的等待队下。

//file: kernel/wait.c
void prepare_to_wait(wait_queue_head_t *q, wait_queue_t *wait, int state)
{
 unsigned long flags;
 wait->flags &= ~WQ_FLAG_EXCLUSIVE;
 spin_lock_irqsave(&q->lock, flags);
 if (list_empty(&wait->task_list))
 __add_wait_queue(q, wait);
 set_current_state(state);
 spin_unlock_irqrestore(&q->lock, flags);
}

这样后⾯当内核收完数据产⽣就绪时间的时候，就可以查找 socket 等待队列上的等待项，进⽽就可以找到回调函数和在等待该 socket 就绪事件的进程了。
最后再调⽤ sk_wait_event 让出 CPU，进程将进⼊睡眠状态，这会导致⼀次进程上下⽂的开销。

原文地址：https://blog.csdn.net/m0_55334946/article/details/140563035

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：PCIE中的CFGBVS（Configuration Bank Voltage Select）和VCCO_0（IO电源电压）之间的关系
下一篇：[M差分] lcxx. 访问消失节点的最少时间(差分+贪心+读题+思维)

Qt文件目录操作
QCoreApplication 是为无 GUI 应用程序提供事件循环的类，是所有应用程序类的基类，其子类 QGuiApplication 为有 GUI 界面的应用程序提供流控制和主要设定，QGuiA
阅读更多2024-11-16
从0开始深度学习（30）——语言模型和数据集
在上一节中，我们将文本数据映射为词元，并制作了词表。这一节我们将介绍语言模型和语言数据集。
阅读更多2024-11-16
git常用命令+搭vscode使用
4.或者基于分支git checkout origin/ 在本地master中重新拉取远程上的某个分支；然后从当前创建新的分支后推到远程（实现基于某个分支创建新分支）git fetch + git m
阅读更多2024-11-16
【阅读记录-章节2】Build a Large Language Model (From Scratch)
文本转换为数值向量（嵌入）嵌入是LLMs（大规模语言模型）处理文本数据的关键。因为LLMs不能直接处理原始文本数据，所以需要将文本转换为数值表示，这些数值表示就是嵌入。嵌入将离散数据（例如词语或图像）
阅读更多2024-11-16
Vue 3 条件渲染与列表渲染完整指南
本文详细介绍了 Vue 3 中的v-ifv-show和v-for指令的使用方法、适用场景、常见优化技巧和注意事项。在实际开发中，合理使用这些指令不仅可以提高代码的可读性，还能提升应用性能。掌握这些条件
阅读更多2024-11-16
接口文档的编写
（Application Programming Interface）即应用程序接口。可以认为 API 是一个软件组件或是一个 Web 服务与外界进行的交互的接口。目的是提供应用程序与开发人员基于某软
阅读更多2024-11-16
thinkphp增删查改例子
以上示例演示了如何使用ThinkPHP进行数据库的增删查改操作。您可以根据自己的需求对示例进行修改和扩展。
阅读更多2024-11-16
openai 论文Scaling Laws for Neural Language Models学习
最佳性能取决于作为幂律的总计算量 (参见等式(1.3)). 我们为方程提供了一些基本的理论动因(1.5)、对学习曲线拟合及其对训练时间的影响的分析，以及对每个 token 的结果的细分。传输性能随
阅读更多2024-11-16
0x00基础算法 -- 0x05 排序
离散化，中位数，第k大数，归排--逆序对
阅读更多2024-11-16
C#里实现日期比较
例如，刻度值为 3124137600000000L 表示星期五，0100 年 1 月 12 日 12：00：00 午夜。值 DateTime 类型表示日期和时间，其值范围从 00：00：00 （午夜）
阅读更多2024-11-16

深入理解Linux网络（四）：TCP接收阻塞

相关文章