C++17Linux：信号未解锁单独线程中被阻止的网络套接字调用

发布于02月25日

我有一个多线程应用程序，其中主线程产生多个(3+)线程，每个线程执行不同的任务.其中一个线程应该运行一个简单的TCP服务器，该服务器一次只接受一个连接并从该连接接收数据.

应用程序捕获并处理SIGTERM，以便协调线程之间的正确清理.在接收到这个信号时，它只是将一个全局共享kill标志(类型std::atomicstd::bool)设置为true.

现在，在最初的设计中，主线程执行服务器职责.当它接收到SIGTERM时，它所在的Accept()或recv()调用将返回EINTR，应用程序可以检测到这一点并知道是时候加入其他线程了.

我试图重新工作，这有一个衍生的线程作为服务器.虽然服务器功能确实可以正常工作，但信号处理却不能.当应用程序接收到SIGTERM时，kill标志被设置，但服务器线程继续阻塞accept()或recv()，这取决于它是否已经连接了客户端.

在调查这个问题后，我了解到:

可以将信号发送到进程中的任何可用线程
每个线程可以有自己的信号掩码来阻止某些信号的接收

从我遇到的问题中也可以明显看出，除非在accept()/recv()上阻塞的特定线程捕获到信号，否则该线程将继续被阻塞，因为阻塞函数不会返回EINTR.

问题:

为什么每次我测试原始设计(其中主线程是服务器)都能正常工作？我已经测试过几百次了.我可以想象，在某个时刻，其他线程中的一个会收到该信号，而主线程会继续阻塞.为什么这种情况从来没有发生过？
你有什么建议来纠正这个问题？我希望继续让服务器在派生的线程中运行，而不是在主线程中运行.以下是我读到的一些解决方案:

A.生成一个单独的信号捕获器线程，并阻止所有其他线程中的信号.我不确定这对我的情况有什么帮助，因为如果服务器线程在syscall上被阻塞，并屏蔽了所有信号，就没有办法向它发出信号来唤醒并开始清理.我读过有关条件变量的文章，但我同样不明白这将如何解锁被阻止的系统调用.

B.切换到使用非阻塞套接字，并使用SELECT()/Poll()/EPOLL()编写服务器.我可以看到这是可行的，尽管对于一次只能处理一个客户端的服务器来说，这似乎有点过头.然而，如果这是最好的解决方案，我愿意这样做.但这是否意味着所有派生的线程都被有效地禁止使用阻塞syscall？另一个尚未写入的线程应该执行一些串行I/O.是否也需要使用这些多路复用函数写入这些I/O？

有没有办法让2a在我的情况下起作用，或者2b是我唯一的解决方案？

限制:这个项目使用的是C++17，我的团队不允许使用我们(相当标准的)Linux系统和C++标准库之外的任何库.Boost和其他第三方代码不是我们的 Select .我们还直接使用了p线程，而不是通过C++STL，但我认为这不应该影响这种情况.

我还没有try 实施任何解决方案，因为我正在研究哪一个方案最适合我的情况.

C++17Linux：信号未解锁单独线程中被阻止的网络套接字调用

推荐答案

背景

最初的设计

新的设计选项

指定的信号捕获线程

通过信号通知其他线程

通过I/O通知其他线程

总体建议

Linux相关问答推荐

IntelliJ(PyCharm)不再识别Linux中的AltGr快捷键

如何更改文件的上次访问/修改/更改日期？

当 skylake 有 fsgsbase 时，为什么使用 __builtin_ia32_wrfsbase64 会收到非法指令？

nohup 是否可以跨管道工作？

如何指定链接时使用的库版本？

每次来宾重新启动后 Vagrant 执行脚本或命令(vagrant up)

使用 awk 或 sed 删除特定字符

从 Linux 到 Windows 交叉编译 C++ 应用程序的手册？

diff 命令仅获取不同行的数量

如何像 Nautilus 那样从命令行挂载？

使用 linux 命令行 (bash) 从网络摄像头拍照

Monit 守护程序 - 连接到 monit 守护程序时出错

如何将路径名中的..转换为 bash 脚本中的绝对名称？

我可以打开一个套接字并将其传递给 Linux 中的另一个进程吗

在 Linux / Mono 上运行 ServiceStack 的最佳方式是什么？

/dev/random 非常慢？

后缀 - status=bounced(未知用户myuser)

如何将初始输入通过管道传输到随后将是交互式的进程中？

在 Docker 容器中运行的 JVM 的驻留集大小 (RSS) 和 Java 总提交内存 (NMT) 之间的差异

如何制作和应用SVN补丁？