当前位置：文江博客话题详情

c++ compare words

C++需要将一个字符串与 200.000 个单词进行比较

发布于 2024-08-23 15:19:17 字数 242 浏览 7 评论 0原文

在我的 C++ 程序中...

用户输入程序字符串“foo”。

我需要比较这个字符串与我的字符串，在txt文件中写入：这个字符串是名词！（或形容词...）

我有几个 TXT 文件 - 一个包含名词的文件，第二个包含形容词的文件...但每个文件大约有 200.000 个单词。

如何有效地将这个字符串“foo”与我的文件中的字符串进行比较？

我需要使用什么？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（6）

浮世清欢 2024-08-30 15:19:17

为此使用 TRIE 数据结构。您应该需要一些内存来构建数据结构。但你的目标将是最有效的。

回复收藏 0 原文

唐婉 2024-08-30 15:19:17

将您的单词放入 std::set 容器中并对其进行查找。这为访问提供了 O(log n) 时间，这对于您正在做的事情来说可能足够了。

您还可以使用 std::map，其中键是单词，值是类（例如“名词”）。

回复收藏 0 原文

◇流星雨 2024-08-30 15:19:17

我建议对您的文件使用 sqlite。

您可以为每个键值创建一个 CRC，并将键和值 (int) 存储到表中。为关键字段创建索引。

当你想要进行查找时，你可以获取单词的 CRC，然后在表中进行查找。

回复收藏 0 原文

你不是我要的菜∠ 2024-08-30 15:19:17

如果您有的话，基数树将为字符串提供比“常规”特里树更好的内存使用许多具有共同词根/前缀的字符串（字典可能就是这种情况，即具有多种形式的单词 - 尽管这可能取决于语言）。

回复收藏 0 原文

不乱于心 2024-08-30 15:19:17

您只需要确认它是否匹配任何内容吗？

如果是这样，请使用 Trie。

回复收藏 0 原文

蓝戈者 2024-08-30 15:19:17

您可以将外部文件索引存储为 btree 或链式哈希表，它将提供非常快的查找时间和最少的查找次数来定位数据。

回复收藏 0 原文

~没有更多了~

关于作者

浅黛梨妆こ

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

给自己一个微笑

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

我是自愿种绣球花的

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文