自定义文件格式的高效查找方法

发布于 2024-09-06 21:55:22 字数 127 浏览 13 评论 0原文

我一直想知道在不同的文件格式中实现搜索的方式是什么，以及构建包含大量数据的文件以实现高效搜索的好方法是什么。我考虑过的一些方法是拥有相同大小的数据包，这允许快速跳过，因为您知道每个数据块是什么样的，而且每当加载文件时进行预索引也是一个想法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

满身野味 2024-09-13 21:55:22

这完全取决于数据的类型以及您想要寻求的内容。

如果您尝试按记录索引进行查找，那么可以肯定的是：固定大小的字段使生活更轻松，但浪费了空间。如果您尝试通过其他方式进行搜索，那么保留 key:location 的索引效果很好。如果您希望能够按顺序构建文件，您可以将索引放在末尾，但保留文件的前四个字节（在幻数或其他内容之后）来表示索引本身的位置（假设您可以重写前四个字节）。

如果您希望能够对可变长度块执行某种二进制切割，那么拥有一种相当有效的方法来检测块的开头会有所帮助 - 正如亚历山大提到的那样，拥有下一个/上一个指针也是如此。

基本上，这都是关于元数据的，真的 - 但正确类型的元数据将取决于数据的类型以及首先进行搜索的用例。

回复收藏 0 原文