C++ 将变量或参数打包到 struct 联合中是否会带来意想不到的性能损失

发布于12月11日

这不是询问 struct 填充/填充， struct 填充/填充指的是出于对齐目的而插入到 struct 中的任何未命名字节.

我有这个功能:

#include <stdint.h>
uint8_t get_index(const uint8_t xs, const uint8_t zs, const uint8_t ys, const uint8_t l) {
    return (xs >> l & 1) | (zs >> l & 2) | (ys >> l & 4);
}

令我惊讶的是，尽管由于发出了多个and和sar指令而启用了优化，但仍有GCC does not seem to use any SWAR for this条指令.

但我认为我可以像这样简单地实现Swar:

#include <stdint.h>
union Arg {
    uint8_t b[3];
    uint32_t u;
};
uint8_t get_index(union Arg arg, const uint8_t l) {
    static const union Arg mask = {.b = {1, 2, 4}};
    /*  Using this instead of an integer constant makes the behavior not depend on endianness.
        This will be optimized into the appropriate integer constant anyway. */

    arg.u = arg.u >> l & mask.u;
    return arg.b[0] | arg.b[1] | arg.b[2];
}

正如预期的那样，程序集实际上更短:Version 1 Version 2 Version 3(都是一样的)

为什么GCC没有把前者优化为后者？有什么特别的原因吗？或者这只是一次错过的优化？
单个字节参数的访问方式是否与struct/union中的字节不同？如果是，原因是什么？我的直觉告诉我，它们不应该是这样的，因为无论哪种方式，它们都位于当前堆栈帧中的已知位置.
有什么理由这样做会比单独通过它们更慢呢？

我已经看过了:Passing many variables vs. passing struct，但这个问题更多地集中在比CPU字长大得多的大型 struct 上，而我的对象只有4个字节.这些也没有解决访问字内的各个字节的问题.

#include <stdint.h> uint8_t sum(const uint8_t a, const uint8_t b, const uint8_t c) { return a+b+c; } struct triple { uint8_t x,y,z; }; uint8_t sum_2(struct triple s) { return s.x + s.y + s.z; }

C++ 将变量或参数打包到 struct 联合中是否会带来意想不到的性能损失

推荐答案

C++相关问答推荐

Pure Win32 C(++)-除了替换控件的窗口程序之外，还有其他方法可以在输入时禁用按钮吗？

为什么C语言允许你使用var =(struct NAME){

为什么可以在typedef之前使用typedef d struct 体？

如何在C客户端应用程序的ClientHello消息中添加自定义扩展？

二进制计算器与gmp

如何在c++中包装返回空*的函数

为什么我不能只在内存地址中添加一个int来寻址任何数组？

轮询libusb_pollfd struct 列表的正确方式是什么？

为什么memcpy进入缓冲区和指向缓冲区的指针工作相同？

FRIDA-服务器成为端口扫描的目标？

通过描述符查找文件路径时出现问题

理解bzip2的BZ2_解压缩函数中的状态重新分配

从不兼容的指针类型返回&&警告，但我看不出原因

我可以创建适用于不同endian的 colored颜色 struct 吗？

unions 的原子成员是个好主意吗？

在C中，为什么这个带有递增整数的main函数从不因溢出而崩溃？

C 错误：对 int 数组使用 typedef 时出现不兼容的指针类型问题

如何找出C中分配在堆上的数组的大小？

在 C/C++ 中原子按位与字节的最佳方法？

C语言程序流程解释