当前位置：文江博客话题详情

计算子串的数量

发布于 2024-11-15 21:57:38 字数 45 浏览 3 评论 0原文

我想问是否有一种算法可以在 O(n) 时间内统计字符串中子串离散出现的次数。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

池予 2024-11-22 21:57:38

[编辑 2013 年 11 月 17 日：计算叶节点。谢谢 Vinicius Pinto！]

您可以在线性时间内在文本上构建后缀树。然后，在后缀树中搜索你的子字符串；当找到它时，计算匹配节点下方的叶节点数。对于长度为 m 的子字符串出现 k 次，这是 O(m + k)（添加 n 项用于构建后缀树）。或者，您可以使用深度优先遍历来预先计算树中每个节点的后代数量——这将给出 O(m) 查询。

对于大型文本，后缀数组在实践中通常比后缀树更快，尽管搜索单个长度为 m 的字符串从 O(m) 下降到 O(m log m)。在这种情况下，特定子字符串的所有出现都将作为后缀数组中的连续块出现，因此该块的宽度就是出现的次数。

回复收藏 0 原文

胡大本事 2024-11-22 21:57:38

您可以使用KMP 算法< /a> 并修改它以增加计数器而不是返回。

另一种可能性是 Rabin-Karp 算法，但是这依赖于哈希，所以你要么接受误报的可能性，同时保持复杂性为线性，或者接受二次复杂性的可能性，同时保持结果 100% 正确。

回复收藏 0 原文

~没有更多了~

关于作者

不美如何

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

计算子串的数量

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

达拉崩吧

PANGOO

kkgtx

WordPress小学生

酷炫老祖宗

硪扪都還晓

友情链接

计算子串的数量

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

达拉崩吧

PANGOO

kkgtx

WordPress小学生

酷炫老祖宗

硪扪都還晓

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。