解组散列数据的技术选择

发布于 2024-08-23 05:42:45 字数 645 浏览 5 评论 0原文

似乎有相当多的民间传说知识在有限的圈子里流传，关于哈希构造与数据编组-解组相结合的陷阱。我正在寻找这些花絮的可引用参考文献。

例如，有人曾经向我指出图书馆 aterm 并提到作者已经清楚地考虑到了这一点，并且磁盘上的表示是自下而上的（节点的子节点在数据流中位于节点本身之前）。当您需要重新共享每个节点（内存中可能存在相同的节点）时，这确实是正确的做法。这种重新共享过程需要自下而上地完成，因此解组本身也可能是自下而上的，这样就可以在一次过程中完成所有操作。

我正在描述我们自己遇到的困难以及我们找到的解决方案。我将不胜感激任何对上述民俗知识的引用。显然有些人以前遇到过这些问题（aterm 库只是一个例子）。但我没有找到任何书面内容。就连我所掌握的关于 aterm 的一点点信息也都是道听途说。我并不担心它不可靠（你无法弥补），但“个人交流”和“看看它在源代码中是如何完成的”在引用中被认为是糟糕的形式。

仅关于散列consing我就有足够的参考资料。我只对干扰编程其他方面（例如编组或分发）的参考感兴趣。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

明月松间行 2024-08-30 05:42:45

好吧，这并没有多大用处，但是 Andrew Kennedy 写了一个函数式珍珠，简称为“Pickling Combinators”，它出现在《函数式编程杂志》(Journal of Function Program) (2004)，14:6:727-739 中。对结构共享以及如何在 pickles 中处理它进行了广泛的讨论，但没有直接讨论这个问题如何与该语言的实现中的哈希构造相关。但这篇文章确实讨论了内存中和 pickle 中的结构共享，所以我希望它总比没有好。

Martin Elsman 于 2005 年在函数式编程趋势中发表了一篇后续论文；标题是具有共享的类型专用序列化。本文主要讨论 unpickler（反序列化器）的哈希处理，而不是实现中的哈希处理，但它可能还是有价值的。

JFP 论文是专有的，但似乎有一个安德鲁网页上的预印本。
Elsman 的论文似乎可以通过 Google Scholar 获取，网址为 http://tinyurl.com/yd5tw2b。

（在前世，我参与了一个创建人们可以阅读和编辑的 ASCII pickle 的项目。我愚蠢地未能发布它，但我保留了兴趣。）