存储文档中找到的单词以及其出现次数的计数器的最佳数据结构是什么？

发布于 2024-10-14 16:16:09 字数 168 浏览 5 评论 0原文

假设我有一个文档语料库，我想逐一阅读并将它们存储在数据结构中。该结构可能是某物的列表。该类将定义一个文档。在该类中，我必须使用数据结构来存储每个文档的内容，那应该是什么？另外，如果我想计算单词的出现次数并检索每个文档中最常见的单词，我是否必须使用允许我及时执行此操作的数据结构<依次检查所有内容需要 O(n) 时间？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

清风夜微凉 2024-10-21 16:16:09

使用关联数组，也称为映射或字典，因为不同的编程语言对相同的数据使用不同的术语结构。

每个输入键都是一个单词，计数器是输入的值。例如

{
  'on' -> 15,
  'and' -> 43,
  'I' -> 157,
  'confluence' -> 1,
  'dear' -> 2
}

Use an associative array, also called map or dictionary since different programming languages use different terms for the same data structure.

Every entry key would be a word and the counter would be the value of the entry. For example

{
  'on' -> 15,
  'and' -> 43,
  'I' -> 157,
  'confluence' -> 1,
  'dear' -> 2
}

回复收藏 0 原文

~没有更多了~

关于作者

亢潮

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

存储文档中找到的单词以及其出现次数的计数器的最佳数据结构是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

存储文档中找到的单词以及其出现次数的计数器的最佳数据结构是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。