10个集合求交集,集合中元素海量数据。
RT,集合中没有重复元素,集合中元素为海量。可以分内存能够容纳10个集合和内存最多能够容纳两个集合考虑,或者思路请指明内存限制。
如有描述不当请指出。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
RT,集合中没有重复元素,集合中元素为海量。可以分内存能够容纳10个集合和内存最多能够容纳两个集合考虑,或者思路请指明内存限制。
如有描述不当请指出。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
不管有没有限制,这题基本思路就是建立一个倒排索引表。
内存没限制的话,全放进去就完了,过最后一个集合的时候,把倒排表里10个集合都存在的捞出来。
内存有限制的话,先根据哈希值分组,保证每个组都能在内存里存下。一般来说 好的哈希算法是可以把数据均匀分组的。实在不行就参考数据库上BTree,用外存。