当前位置：文江博客话题详情

c 中的短短整数？

发布于 2024-11-24 02:04:29 字数 597 浏览 1 评论 0原文

我正试图从我的记忆中挤出尽可能多的东西。我有一个 4.9999995e13 整数矩阵，但它们只需要为 true 或 false - 基本上我只需要为每个整数分配一位存储空间。

我知道 C 中没有单个位类型（也许有人可以向我解释为什么），而且我也知道如果存在 short Short int ，它将是 1 个字节，与 char 相同。然而，C 中的所有逻辑运算都返回整数（以及一些其他函数）。

所以我的问题是：

是否有某种方法可以使 short Short int 存在？
如果我改用 char ，性能是否会因为必须转换为 int 而降低？
我还缺少另一种方式吗？

以防万一它是相关的，我正在使用 GCC for C99 进行编译。

编辑我刚刚在这个维基百科页面上看到有是 _Bool 类型，这实际上是标准的吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

無心 2024-12-01 02:04:29

_Bool 类型是最新版本的 C 中的标准类型，但这仍然不是您想要的，因为 _Bool 仍然占用至少一个字节（与 _Bool 一样）代码>字符，根据定义）。

不，如果您想要那么多布尔位，您需要将它们打包到位字段或位数组。 C 中的位域没有标准数据类型，因此您还必须编写自己的宏或函数来获取特定偏移处的位。我还希望您能够在具有充足 RAM 的 64 位计算机上运行此程序，否则您将很快耗尽内存。

回复收藏 0 原文

挽袖吟 2024-12-01 02:04:29

您拥有大约 50 太比特的数据。您想将它们一次性全部放入 RAM 中吗？为了保存一位信息而使用多于一位的 RAM 是完全疯狂的，即使这样，你的计算机也必须有这个星球上最大的超级计算机的大小。忘记位打包的性能。你将不得不担心完全不同的事情。

回复收藏 0 原文

始终不够 2024-12-01 02:04:29

你想要的是一个位图（或者维基百科所说的位数组）。

并且不存在 short Short int 这样的东西，它只是一个 char，它是 C 中最小的整数存储类。

使用这种方法时可能会产生一些性能开销，但不是因为隐式转换为整数，而是因为操作位图比直接操作数组成员更棘手。

一个小例子可能有助于说明：

使用普通整数矩阵：

int mat[8*8]; // assuming row major order
int is_element_set(int x, int y) { 
  return mat[y*8 + x];
}

使用位图：

unsigned char mat[8]; // assuming CHAR_BIT == 8
int is_element_set(int x, int y) { 
  return mat[y] & (1 << x);
}

What you want is a bitmap (or bit array as Wikipedia calls it).

And there is no such thing as a short short int, that's just a char which is the smallest integer storage class in C.

There might be some performance overhead when using this approach, but not because of implicit casts to ints, but rather because manipulating a bitmap is more tricky than directly manipulating array members.

A small example might help to illustrate:

Using a normal integer matrix:

int mat[8*8]; // assuming row major order
int is_element_set(int x, int y) { 
  return mat[y*8 + x];
}

With a bitmap:

unsigned char mat[8]; // assuming CHAR_BIT == 8
int is_element_set(int x, int y) { 
  return mat[y] & (1 << x);
}

回复收藏 0 原文

玉环 2024-12-01 02:04:29

5e13 大约需要 5.6 TB 的存储空间，您只需要表示您的位字段。可能有更好的方法来处理您的问题。

回复收藏 0 原文

日记撕了你也走了 2024-12-01 02:04:29

也许您可以使用 ANSI C 中可用的位字段结构的一些明智实现。

像这样：

typedef struct node_t_
{
    char bit0 : 1;
    char bit1 : 1;
    char bit2 : 1;
    char bit3 : 1;
    char bit4 : 1;
    char bit5 : 1;
    char bit6 : 1;
    char bit7 : 1;
} node_t;

然后，您可以创建一些快速函数（可能是宏）来获取和设置此矩阵中的元素。不过，我还没有实施过这样的事情。

Maybe you could use some wise implementation of the bit field structs available in ANSI C.

Something like this:

typedef struct node_t_
{
    char bit0 : 1;
    char bit1 : 1;
    char bit2 : 1;
    char bit3 : 1;
    char bit4 : 1;
    char bit5 : 1;
    char bit6 : 1;
    char bit7 : 1;
} node_t;

Then, you could make some fast functions (maybe macros) to get and set elements in this matrix. I haven't ever implemented something like this, though.

回复收藏 0 原文

星軌x 2024-12-01 02:04:29

C99 stdbool.h 允许使用 bool。然而这里你的问题是 4.9999995e13/8 或多或少会给出 6.2500e+12 （$10^9$ 是 Gbyte，$10^12$ 是 Tbyte），所以你需要超过 6 TB 的实际 + 虚拟内存（要幸运的）。这表明您还做错了其他事情。您需要将问题“扩展”为可以使用更少内存处理的子问题。

回复收藏 0 原文

迷迭香的记忆 2024-12-01 02:04:29

正如其他人所建议的，您可能应该使用位字段。

此外，如果您只是使用真/假值，并且其中一个值比另一个值不太常见，请考虑使用隐式编码。您可以使用地图数据结构轻松完成此任务。当您使用图形时，如果您的图形非常稀疏，这将为您节省大量内存。如果将此与上面的位打包技术结合起来，您甚至可以将其全部放入 RAM 中。不过，必须非常聪明地处理索引。

如果您不关心处理过程中的性能损失（即，如果您更担心存储它而不是处理它），您可以做的另一件事是通过压缩运行结构块中的算法。有一个用于 bzip2 的 C 库，它可能会为您节省 90% 或更多的费用。缺点是这会花费（非常！）很长的时间。您可能会从动态马尔可夫压缩 (DMC) 等按位压缩器中获得类似的性能，而且速度要快得多。

回复收藏 0 原文