当前位置：文江博客话题详情

处理大量整数的最佳方法

发布于 2024-08-20 20:55:03 字数 81 浏览 3 评论 0原文

我有一个大约 10-100k 整数的数组，需要存储（尽可能压缩），并以最快的方式检索回完整数组。使用 c# 这样的语言处理此类事情的最佳方法是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

难以启齿的温柔 2024-08-27 20:55:03

这取决于“尽可能压缩”的意思。

您可以使用 BinaryWriter 将整数写入流，或使用 BitConverter.GetBytes 将每个 int 作为四个字节复制到一个大数组中。两者都会存储每个 int 而不需要任何额外的元数据。

如果您希望它比这更压缩，BinaryWriter 有一个 Write7BitEncodedInt 方法，可以用更少的字节写入小值的整数。将数据打包到字节数组后，您还可以使用 GZipStream 类尝试进一步压缩数据。

一般来说，你想要的越小，处理时间就越长。为了获得您想要的速度和大小之间的平衡，您只需进行一些测试。

回复收藏 0 原文

猫瑾少女 2024-08-27 20:55:03

根据此 int 数组中值的性质，行程编码可能是另一种选择。也就是说，如果数组中的连续单元格都具有相同的值，则只需存储该序列中该值的第一次出现以及此后重复出现的次数。这对于“稀疏”数据可能特别有效。

回复收藏 0 原文

段念尘 2024-08-27 20:55:03

100,000 个整数并没有那么大，为什么需要压缩这么多呢？

回复收藏 0 原文

不打扰别人 2024-08-27 20:55:03

回答您的具体问题

选择足够大且仅足以存储您的数据的数据类型，例如 uint32_t 或 int64_t。注意：它必须是固定长度。
将数据以二进制形式连续写入到文件中。
将数据直接读回到您的数组类型的内存中。

问题以最优化的方式解决。如果您想要磁盘压缩，请通过压缩库运行数据。当您尝试使用数据时，将数据压缩在内存中通常是不允许的（一般解决方案使用其他技术）。如果您需要了解为什么这是禁忌的信息，请注明。

大型数据集计算的一般答案

专门的数学库处理这些问题（例如，octave 或 matlab），特别是处理超出您计算机所能想象的数量的问题。

这些库具有执行引擎和特定语言，但您通常可以通过编程方式与它们交互。

回复收藏 0 原文

~没有更多了~

关于作者

不疑不惑不回忆

暂无简介

0 文章

0 评论

22 人气

关注发私信

謌踐踏愛綪

文章 0 评论 0

关注

开始看清了

文章 0 评论 0

关注

高速公鹿

文章 0 评论 0

关注

alipaysp_PLnULTzf66

文章 0 评论 0

关注

热情消退

文章 0 评论 0

关注

白色月光

文章 0 评论 0

友情链接

文江博客

处理大量整数的最佳方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签