在新的 linux 内核中，上下文切换要慢得多

发布于08月25日

我们希望将服务器上的操作系统从Ubuntu10.04 LTS升级到Ubuntu12.04 LTS.不幸的是，从2.6内核到3.2内核，运行已成为可运行线程的延迟似乎显著增加.事实上，我们得到的延迟数字令人难以置信.

让我更具体地谈谈这次考试.我们有一个运行两个线程的程序.第一个线程获取当前时间(使用RDTSC以滴答为单位)，然后每秒向条件变量发送一次信号.第二个线程等待条件变量，并在发出信号时将其唤醒.然后获取当前时间(使用RDTSC以滴答为单位).第二个线程中的时间与第一个线程中的时间之差将被计算并显示在控制台上.在此之后，第二个线程再次等待条件变量.大约一秒钟后，第一个线程将再次发出信号.

因此，简而言之，我们得到每秒thread to thread communication via condition variable次的延迟测量结果.

在内核2.6.32中，这个延迟大约为2.8-3.5us，这是合理的.在内核3.2.0中，这个延迟已经增加到大约40-100us.我已经排除了两台主机在硬件上的任何差异.它们在相同的硬件上运行(双插槽X5687{Westmile EP}处理器在3.6 GHz下运行，超读、speedstep和所有C状态都关闭).测试应用程序更改线程的关联性，使其在同一套接字的独立物理内核上运行(即，第一个线程在内核0上运行，第二个线程在内核1上运行)，因此内核上的线程不会反弹，套接字之间也不会反弹/通信.

这两台主机之间唯一的区别是，一台运行的是内核为2.6.32-28(快速上下文切换框)的Ubuntu10.04 LTS，另一台运行的是内核为3.2.0-23(慢速上下文切换框)的最新Ubuntu12.04 LTS.所有BIOS设置和硬件都是相同的.

内核中是否有任何变化可以解释线程运行所需时间的这种荒谬的减慢？

Update:

g++ -O3 -o test_latency test_latency.cpp -lpthread

运行(假设您至少有一个双核机箱):

./test_latency 0 1 # Thread 1 on Core 0 and Thread 2 on Core 1

Update 2:

在新的 linux 内核中，上下文切换要慢得多

推荐答案

Linux相关问答推荐

在程序集x86_64中跳转后调用ret时出现分段故障

Bash：将带有新行的字符串转换为带有逗号、内联的唯一值的字符串

Linux内核模块构建过程中，许可信息添加了前缀

Linux BlueZ 5.65 hcitool 结合服务 UUID 和制造数据广告

我可以在不调用 shell 的情况下使用 popen() 吗？在 C++ 中

为什么 liburing 写入性能低于预期？

仅在 Linux 上出现 AWS RDS `flush tables` 错误的 mysqldump

所有进程的Linux环境变量

如何使用 Bash 读取文件中的倒数第二行？

argv的编码是什么？

在 cron 作业(job)中执行 PHP 脚本

我如何从 Ubuntu 上的源代码自己构建 python？

grep 时间命令输出

在 linux 上查看文件大小

如何在字符串中查找子字符串(或如何 grep 变量)？

从 FTP 服务器下载所有文件

如何在 Linux 上查找不包含文本的文本文件？

PostgreSQL psql 终端命令

构建窗口管理器

在linux中根据内容拆分文件