在 python 中搜索一个很长的文本文件中的单词的简单方法是什么?
我想使用一个文本文件创建一个非常简单的拼写检查器,其中包含约 80000 个常用单词的按字母顺序排列的列表。
使用 python 搜索文件并找出它是否包含单词的简单但有效的方法是什么?
我应该将单词列表文件解析为集合、列表、字典、元组吗?
有没有一种简单的方法可以利用我的单词列表已经按字母顺序排列的事实?
我宁愿保持相对简单。我不需要更正的拼写建议或其他花哨的功能。我只是想知道这个词是否拼写错误。
I want to create a very simple spell checker using a text file with an alphabetized list of about 80000 common words.
What's a simple but efficient way to search the file and find out if it contains a word using python?
Should I parse the word list file into a set, list, dictionary, tuple?
Is there an easy way to take advantage of the fact that my word list is already alphabetized?
I'd prefer to keep it relatively simple. I don't want corrected spelling recommendations or other fancy features. I just want to know if the word is miss-spelled.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
由于 80000 个单词很容易适合内存,因此最好使用
set
:这不会利用文件已排序的事实,但无论如何它是最有效的方法。要查找单词
w
,您可以使用其摊销 O(1)。
Since 80000 words will easily fit in memory, you are best off using a
set
:This won't take advantage of the fact that your file is already sorted, but it is the most efficient way anyway. To look up a word
w
, you can usewhich is amortised O(1).
将您的字典单词放入具有恒定查找时间的集合中。
Put your dict words in a set which has a constant lookup time.