当前位置：文江博客话题详情

独特字数

发布于 2024-11-02 20:27:08 字数 326 浏览 5 评论 0原文

这是一个通用问题，（可能）适用于任何高级编程语言。情况是这样的：

假设我有一个字符串数组。比如说，我设法将一个短篇小说中的 500 000 个字符串放入一个数组中（假设您没有输入格式选项）。因此，很可能存在任意数量的重复项。

我想获取这个字符串数组并创建另一个数组，其中包含该数组的唯一子集（？）（即：没有重复项）。在这种情况下，输入和输出都必须是数组，因此这可能会限制您的各种选项。

从性能角度来看，实现这一目标的最快方法是什么？我目前正在使用线性搜索来检查某个单词是否已经存在，但由于它是线性搜索，我觉得可能有更快的方法，特别是如果我有不合理数量的字符串需要处理。就像一本更大的小说！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

枯寂 2024-11-09 20:27:08

使用哈希集可能是最明智的做法 - 复杂性应该是 O(N)。

注意：大多数高级编程语言都包含从数组中删除重复项的函数的实现，例如 PHP。

回复收藏 0 原文

一个人练习一个人 2024-11-09 20:27:08

如果您要在其中放入无数的单词，有向非循环单词图是最合适的我所知道的高效数据结构。

但从概念上讲，它是一个非常简单的数据结构。

回复收藏 0 原文

~没有更多了~

关于作者

垂暮老矣

暂无简介

0 文章

0 评论

24 人气

关注发私信

胡图图

文章 0 评论 0

关注

zt006

文章 0 评论 0

关注

z祗昰~

文章 0 评论 0

关注

冰葑

文章 0 评论 0

关注

野の

文章 0 评论 0

关注

天空

文章 0 评论 0

友情链接

文江博客

独特字数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

独特字数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。