位掩码的大小是否有实际限制？

发布于 2024-07-06 10:23:24 字数 419 浏览 14 评论 0原文

有一种常见的方法可以使用位掩码在一个变量中存储多个值。例如，如果用户对某个项目具有读取、写入和执行权限，则可以通过以下方式将其转换为单个数字：读取 = 4 (2^2)、写入 = 2 (2^1)、执行 = 1 (2^0) 然后将它们加在一起得到 7。

我在几个 Web 应用程序中使用这种技术，我通常将变量存储到一个字段中，并为其指定 MEDIUMINT 类型或其他类型，具体取决于关于不同值的数量。

我感兴趣的是，您可以像这样存储的值的数量是否存在实际限制？例如，如果数字超过 64，则不能再使用（64 位）整数。如果是这种情况，你会用什么？它会如何影响您的程序逻辑（即：您仍然可以使用按位比较）吗？

我知道，一旦您开始获得非常大的值集，不同的方法将是最佳解决方案，但我对此方法的边界感兴趣。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

东北女汉子 2024-07-13 10:23:24

我突然想到，我会编写一个 set_bit 和 get_bit 函数，它们可以采用字节数组和数组中的位偏移量，并使用一些位-摆弄以设置/获取数组中的适当位。像这样的东西（用C语言，但希望你能明白）：

// sets the n-th bit in |bytes|. num_bytes is the number of bytes in the array
// result is 0 on success, non-zero on failure (offset out-of-bounds)
int set_bit(char* bytes, unsigned long num_bytes, unsigned long offset)
{
  // make sure offset is valid
  if(offset < 0 || offset > (num_bytes<<3)-1) { return -1; }

  //set the right bit
  bytes[offset >> 3] |= (1 << (offset & 0x7));

  return 0; //success 
}

//gets the n-th bit in |bytes|. num_bytes is the number of bytes in the array
// returns (-1) on error, 0 if bit is "off", positive number if "on"
int get_bit(char* bytes, unsigned long num_bytes, unsigned long offset)
{
  // make sure offset is valid
  if(offset < 0 || offset > (num_bytes<<3)-1) { return -1; }

  //get the right bit
  return (bytes[offset >> 3] & (1 << (offset & 0x7));
}

Off the top of my head, I'd write a set_bit and get_bit function that could take an array of bytes and a bit offset in the array, and use some bit-twiddling to set/get the appropriate bit in the array. Something like this (in C, but hopefully you get the idea):

// sets the n-th bit in |bytes|. num_bytes is the number of bytes in the array
// result is 0 on success, non-zero on failure (offset out-of-bounds)
int set_bit(char* bytes, unsigned long num_bytes, unsigned long offset)
{
  // make sure offset is valid
  if(offset < 0 || offset > (num_bytes<<3)-1) { return -1; }

  //set the right bit
  bytes[offset >> 3] |= (1 << (offset & 0x7));

  return 0; //success 
}

//gets the n-th bit in |bytes|. num_bytes is the number of bytes in the array
// returns (-1) on error, 0 if bit is "off", positive number if "on"
int get_bit(char* bytes, unsigned long num_bytes, unsigned long offset)
{
  // make sure offset is valid
  if(offset < 0 || offset > (num_bytes<<3)-1) { return -1; }

  //get the right bit
  return (bytes[offset >> 3] & (1 << (offset & 0x7));
}

回复收藏 0 原文

关于从前 2024-07-13 10:23:24

我在文件系统代码中使用了位掩码，其中位掩码比机器字大很多倍。把它想象成一个“布尔数组”；

（如果您想知道，请在闪存中记录掩码）

许多编译器都知道如何为您执行此操作。添加一点面向对象的代码，使类型能够合理地运行，然后你的代码开始看起来像它的意图，而不是一些位敲击。

我的2分钱。

回复收藏 0 原文

另类 2024-07-13 10:23:24

对于 64 位整数，最多可以存储 2^64-1 的值，64 只是 2^6。所以是的，有一个限制，但如果您需要超过 64 个标志，我很想知道它们都在做什么:)

您需要考虑多少个状态？如果有 64 个潜在状态，它们可以存在的组合数量就是 64 位整数的完整大小。

如果您需要担心 128 个标志，那么一对位向量就足够了 (2^64 * 2)。

补充：在Programming Pearls中，有一个关于使用长度为10^7的位数组的扩展讨论，以整数实现（用于保存使用的800个数字） - 它非常快，并且非常适合该任务在那一章中描述。

回复收藏 0 原文

高跟鞋的旋律 2024-07-13 10:23:24

有些语言（我相信 perl 确实如此，不确定）允许对字符串进行按位算术。为您提供更大的有效范围。（（strlen * 8bit chars）组合）

但是，我不会使用单个值来叠加多个/类型/数据。 3 位整数的基本 r/w/x 三元组可能是“实际”上限，不是出于空间效率原因，而是出于实际开发原因。

（ PHP 使用这个系统来控制它的错误消息，我已经发现，当你必须定义 php 常量不常驻的值并且你必须手动生成整数时，它有点过分了，并且老实说，如果 chmod 不支持 'ugo+rwx' 样式语法，我永远不想使用它，因为我永远记不起幻数）

当你必须破解打开常量表来调试代码时，你知道你已经走得太远了。

回复收藏 0 原文

瞳孔里扚悲伤 2024-07-13 10:23:24

老线程，但值得一提的是，有些情况需要臃肿的位掩码，例如分子指纹，它们通常生成为 1024 位数组，我们将其打包在 32 个 bigint 字段中（SQL Server 不支持 UInt32）。按位操作工作得很好 - 直到您的表开始增长并且您意识到单独的函数调用的缓慢性。如果不是 T-SQL 禁止使用具有两个二进制操作数的按位运算符，二进制数据类型将会起作用。

回复收藏 0 原文