当前位置：文江博客话题详情

compression malloc c size

如何确定 malloc 缓冲区的实际使用情况

发布于 2024-12-16 22:12:56 字数 208 浏览 0 评论 0原文

我有一些压缩的二进制数据和一个 API 调用来解压缩它，这需要预先分配的目标缓冲区。没有任何方法可以通过 API 告诉我解压数据的大小。因此，我可以分配一个超大的缓冲区来解压缩，但我想然后调整大小（或将其复制到）正确大小的内存缓冲区。那么，我如何（实际上可以）确定超大缓冲区中解压后的二进制数据的实际大小？

（我不控制数据的压缩，因此我事先不知道预期的大小，并且无法为文件编写标头。）

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

影子是时光的心 2024-12-23 22:12:56

正如其他人所说，如果您的 API 不提供，就没有好方法来做到这一点。

我几乎不想提出这个建议，因为担心您会接受这个建议，并且您的应用程序的一些关键任务部分依赖于它，但是......

启发式方法是用一些“有毒”模式填充您的缓冲区在解压进去之前。然后，解压后，扫描缓冲区以查找第一次出现的有毒模式。

这是一种启发式方法，因为完全可以想象，解压缩的数据可能恰好出现了您的有毒模式。除非您对数据有确切的领域知识，并且可以专门选择您知道不存在的模式。

即便如此，充其量也是一个不完美的解决方案。

回复收藏 0 原文

趁年轻赶紧闹 2024-12-23 22:12:56

通常此信息是在压缩时提供的（例如，查看 7-zips LZMA SDK）。

根据您现在提供的信息，无法知道解压数据的实际大小（或实际使用的部分的大小）。

回复收藏 0 原文

眼泪都笑了 2024-12-23 22:12:56

如果解压步骤没有以某种方式将解压后的大小作为返回值或“out”参数提供给您，则您不能这样做。

无法确定缓冲区中写入了多少数据（在调试器/valgrind 类型检查之外）。

回复收藏 0 原文

猫腻 2024-12-23 22:12:56

解决这个问题的一个复杂方法是解压缩两次到一个过大的缓冲区中。

在这两种情况下，您都需要一个“随机模式”。从末尾开始，计算与该模式相对应的字节数，并检测解压序列的结尾处的不同之处。

或者是吗？也许，偶然地，解压缩序列的最后一个字节之一对应于该确切位置处的随机字节。所以最终解压后的大小可能会比检测到的要大。如果您的模式确实是随机的，则它不应超过几个字节。

您需要用一种不同的随机模式再次填充缓冲区。确保在每个位置，新的随机模式与旧的随机模式具有不同的值。为了更快的速度，您不必填充完整的缓冲区：您可以将新模式限制为第一个检测到的结束之前的几个字节和之后的一些字节。 32 个字节就足够了，因为这么多字节不可能偶然对应于第一个生成的随机模式。

再次解压。再次检测模式不同的地方。取第一端检测和第二端检测之间的两个值中的较大者。这是你解压后的大小。

回复收藏 0 原文

若言繁花未落 2024-12-23 22:12:56

你应该检查 free 对于你的编译器/操作系统是如何工作的
并做同样的事情。
free 不获取分配数据的大小，但它以某种方式知道要释放多少数据；）
通常大小存储在分配的缓冲区之前，但不知道之前到底有多少字节，具体取决于操作系统/架构/编译器

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文