python:使用通配符快速字典单词查找*

发布于 2024-12-08 11:40:15 字数 293 浏览 1 评论 0原文

给定一个被分成单词列表的文本,我想查找单词词典中的每个单词,该词典也是从文本文件和 split('\n') 中读取的

我不需要检查每个单词是否包含在字典中(这非常慢),我需要选择基于通配符*的元素列表(“*”位于末尾,即不需要置换项解决方案)。例如,解决方案应该选择以“dep”开头的所有字典元素,而不遍历整个字典列表。

在这种情况下,性能至关重要。我想到了 Btree...但是

  1. 在 Python 中快速实现的最佳包和数据类型是什么?
  2. 请提供代码示例

Given a text, which is split into a list of words, I want to lookup each of the words in an dictionary of words, which too is read from a text-file and split('\n').

Rather than checking if each word is contained in the dictionary (which is gruesomely slow) I need to select a list of elements based on wildcards* ('*' is at the end i.e. no permuterm solution required). For instance, the solution should select all dictionary elements starting with 'dep', without traversing the entire dictionary list.

Performance is of the essence in this case. I though of a Btree...but

  1. What would be the best package and data-type for a fast implementation in Python.
  2. Please provide code examples

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

瞳孔里扚悲伤 2024-12-15 11:40:15

使用 dawg,就空间浪费而言,它比 Trie 更有效。有一些 Python 实现,但首先请查看此处

Use a dawg, which is more efficient than a Trie in terms of space waste. There are a few python implementations, but for a start take a look here.

桃扇骨 2024-12-15 11:40:15

你想要尝试一下。使用 PyTrie 包。

You want a trie. Use the PyTrie package.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文