当前位置：文江博客话题详情

在 C 中创建集合的良好平均速度/内存效率方法？：

发布于 2024-12-02 08:14:38 字数 448 浏览 1 评论 0原文

假设我正在将非空字符串 (char[]/char*s) 流式传输到我的程序中。我想创建一组。也就是说，对于集合 S 中的任何元素 a，a 在 S 中都是唯一的。

我曾想过以几种方式解决这个问题，但遇到了问题。

如果我知道要读取的项目数量 n，我可以创建一个哈希表，所有元素都以 null 开头，大小相同，如果发生冲突，请勿将其插入该表中。插入完成后，我将迭代哈希表的数组，计算非空值和大小，然后创建该大小的数组，然后将所有值复制到其中。

我可以只使用单个数组并在添加元素之前调整其大小，使用搜索算法检查元素在调整大小/添加之前是否已存在。

我意识到第二种方法可行，但由于元素可能未排序，因此由于搜索算法和调整大小的选择，对于大输入也可能需要很长时间。

任何意见将不胜感激。如果您需要更多信息，请随时在下面的评论框中提问。图书馆会很有帮助！（谷歌搜索“Sets in C”和类似的东西并没有多大帮助。）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小清晰的声音 2024-12-09 08:14:38

即使您不知道要插入的元素数量的大小，哈希表也可以工作...您只需定义哈希表以使用“桶”（即，每个位置实际上是一个链接的散列到相同值的元素列表），并且您将搜索每个“桶”以确保每个元素尚未插入到散列表中。避免搜索大“桶”的关键是良好的哈希算法。

如果您可以定义对象的弱排序，您还可以使用二叉搜索树。然后，如果 !(A < B) 和 !(B < A)，则可以假设 A == B，因此您不会将该对象的任何其他迭代插入到树中，这将再次定义一个集合。

虽然我知道您使用的是 C，但请考虑以下事实：在 C++ STL 中，std::set 使用 RB 树（红黑树，一种平衡二叉搜索树），并且 < code>std::unordered_set 使用哈希表。

使用数组是一个坏主意......调整大小操作将花费很长时间，而插入树可以在 O(log N) 时间内完成，而对于哈希表，摊销 O(1) 时间。

回复收藏 0 原文

~没有更多了~

关于作者

紧拥背影

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

在 C 中创建集合的良好平均速度/内存效率方法？：

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

在 C 中创建集合的良好平均速度/内存效率方法？：

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。