查找后缀树中关键字的所有索引
这是输入文本“mississippi”的后缀树的可视化图表。在此示例中,我要搜索的关键字是“si”。我想我明白如何
- 从根节点#1开始
- 获取“si”的第一个索引,第一条边是“s”,所以我们向下移动到节点#2,
- 节点#2的第二条边是“i”,所以我们检索节点#7,该节点将索引存储到文本中。
但现在对于第二次出现的“si”...我是否继续在子树#7 中搜索下一次出现?对我来说真的没有意义。
或者,树是否必须以不同的方式组装才能支持多个索引?
This is a visual graph of a suffix tree for the input text "mississippi". In this example, my keyword that I'm searching for is "si". I think I understand how to get the first index of "si"
- start at root node #1
- first edge is "s", so we travel down to node #2
- second edge of node #2 is "i", so we retrieve node #7, and this node stores the index into the text.
But now for the second occurrence of "si"... do I just continue searching down the subtree #7 for the next occurrence? Doesn't really make sense to me.
Or, does the tree have to be assembled in a different way in order to support multiple indexes?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论