当前位置：文江博客话题详情

在 python 中搜索一个很长的文本文件中的单词的简单方法是什么？

发布于 2024-11-04 23:35:03 字数 239 浏览 4 评论 0原文

我想使用一个文本文件创建一个非常简单的拼写检查器，其中包含约 80000 个常用单词的按字母顺序排列的列表。

使用 python 搜索文件并找出它是否包含单词的简单但有效的方法是什么？

我应该将单词列表文件解析为集合、列表、字典、元组吗？

有没有一种简单的方法可以利用我的单词列表已经按字母顺序排列的事实？

我宁愿保持相对简单。我不需要更正的拼写建议或其他花哨的功能。我只是想知道这个词是否拼写错误。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

盗心人 2024-11-11 23:35:03

由于 80000 个单词很容易适合内存，因此最好使用 set：

words = set(line.strip() for line in open("words"))

这不会利用文件已排序的事实，但无论如何它是最有效的方法。要查找单词 w，您可以使用

w in words

其摊销 O(1)。

Since 80000 words will easily fit in memory, you are best off using a set:

words = set(line.strip() for line in open("words"))

This won't take advantage of the fact that your file is already sorted, but it is the most efficient way anyway. To look up a word w, you can use

w in words

which is amortised O(1).

回复收藏 0 原文

梦在夏天 2024-11-11 23:35:03

将您的字典单词放入具有恒定查找时间的集合中。

myDict = set([<actual list of words here>])
for word in file:
    if word not in myDict:
        handleBadWord(word)

Put your dict words in a set which has a constant lookup time.

myDict = set([<actual list of words here>])
for word in file:
    if word not in myDict:
        handleBadWord(word)

回复收藏 0 原文

~没有更多了~

关于作者

垂暮老矣

暂无简介

0 文章

0 评论

24 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

在 python 中搜索一个很长的文本文件中的单词的简单方法是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

在 python 中搜索一个很长的文本文件中的单词的简单方法是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。