10个集合求交集,集合中元素海量数据。

发布于 2022-09-01 17:05:54 字数 88 浏览 15 评论 0

RT,集合中没有重复元素,集合中元素为海量。可以分内存能够容纳10个集合和内存最多能够容纳两个集合考虑,或者思路请指明内存限制。
如有描述不当请指出。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

友欢 2022-09-08 17:05:54

不管有没有限制,这题基本思路就是建立一个倒排索引表。

内存没限制的话,全放进去就完了,过最后一个集合的时候,把倒排表里10个集合都存在的捞出来。

内存有限制的话,先根据哈希值分组,保证每个组都能在内存里存下。一般来说 好的哈希算法是可以把数据均匀分组的。实在不行就参考数据库上BTree,用外存。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文