当前位置：文江博客话题详情

树匹配算法？

发布于 2024-09-08 11:37:25 字数 913 浏览 1 评论 0原文

我正在开发 tree 库，所需功能的一部分是能够在节点中搜索与模式匹配的子节点。

“模式”是一种规范（或标准），它列出了要匹配的子树中的结构以及节点的属性。

例如，假设一棵树代表有关特定鸟类物种的数据。进一步假设这样一棵树的节点具有以下属性：

位置
性别
翼展
重量
brood_size

给定一个父节点，我想用简单的英语发出搜索：

“给我所有的雄鸟这只鸟的后代，居住在 XXX城市且有体重> 100克。任何被发现的此类鸟都应该有至少 2 个兄弟和 1 个姐妹，并且本身必须至少有一个孩子”

只是澄清一下，我不希望能够使用正如我上面所做的那样，我只使用“简单英语查询”来说明我想要在树上执行的匹配类型，我完全希望使用符号进行匹配（而不是纯文本）。

< /note >

我正在考虑使用正则表达式类型模式匹配来匹配树，一种方法是使用每个节点的字符串表示，因此我可以使用普通的正则表达式。 - 但这可能效率很低，因为会有很多重复的数据 - 即子节点的字符串表示将是其父表示的超集，而父表示将是其父表示字符串的超集，依此类推，递归地，在树上 - 对于中等大小的树来说，这很容易变得笨拙 - 必须有更好的方法。

有谁知道一种算法可以让我根据模式选择节点中的节点（子树）？

虽然我要求一个通用算法，但我正在用 Python 实现它。任何进一步说明这种算法的片段（如果确实可以编写的话）都将非常有用。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

记忆里有你的影子 2024-09-15 11:37:25

编写带有通配符的 Lisp Sexpression 来描述树匹配有什么问题？括号将节点分组。从左到右的元素与根元素匹配，后跟子元素。子树匹配使用嵌套的 S 表达式来描述子树。

以下将匹配具有任意根节点的树，第一个子节点是叶 A，第三个子节点是以 X 为根的子树，第一个子节点为 1，第三个子节点为 A：

(?root A ? (X 1 A))

这个想法不是我独有的；自 20 世纪 60 年代初以来，Lisp 开发人员就一直在编写此类模式。

这是一个仅可追溯到 20 年前的 LISP 模式匹配器（作为您想要的示例）：
http://norvig.com/paip/patmatch.lisp

但是，自己编写代码非常漂亮简单的。这通常被布置为学习 LISP 的人的家庭作业。

What's wrong with writing a Lisp Sexpression with wildcards to describe the tree match? Parentheses group a node. Elements from left to right match the root followed by the children. Subtree matches use nested Sexpressions to describe the subtree.

The following would match a tree with arbitrary root node, first child being a leaf A, third child being a subtree rooted with X, first child 1 and third child A: