当前位置：文江博客话题详情

SQL 中的分层标记

发布于 2024-07-08 10:31:54 字数 539 浏览 6 评论 0原文

我有一个 PHP Web 应用程序，它使用 MySQL 数据库进行对象标记，其中我使用了作为这个问题。

我想实现一个标签层次结构，其中每个标签都可以有一个唯一的父标签。然后，对父标签 T 的搜索将匹配 T 的所有后代（即 T、父标签是 T（T 的子代）、T 的孙子等）。

最简单的方法似乎是在标签表中添加一个 ParentID 字段，其中包含标签的父标签的 ID，如果标签没有父标签，则添加一些幻数。然而，搜索后代需要重复对数据库进行全面搜索，以找到每个“一代”中的标签，这是我想避免的。

一种（大概）更快但不太标准化的方法是拥有一个包含每个标签的所有子代，甚至每个标签的所有后代的表。然而，这存在数据库中数据不一致的风险（例如，一个标签是多个父标签的子标签）。

有没有一种好方法可以让查询快速找到后代，同时尽可能保持数据标准化？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你与昨日 2024-07-15 10:31:54

我使用两列来实现它。我在这里稍微简化了它，因为我必须将标签名称保留在单独的字段/表中，因为我必须将其本地化为不同的语言：

标签
路径

查看这些行，例如：

tag            path
---            ----
database       database/
mysql          database/mysql/
mysql4         database/mysql/mysql4/
mysql4-1       database/mysql/mysql4-1/
oracle         database/oracle/
sqlserver      database/sqlserver/
sqlserver2005  database/sqlserver/sqlserver2005/
sqlserver2005  database/sqlserver/sqlserver2008/

等。

使用 like 运算符，您可以轻松获取所有需要的标记行：

SELECT * FROM tags WHERE path LIKE 'database/%'

有一些实现细节，例如当您在层次结构中移动节点时，您也必须更改所有子节点等，但这并不难。

还要确保路径的长度足够长 - 在我的例子中，我没有使用路径的标签名称，而是使用另一个字段来确保路径不会太长。

I implemented it using two columns. I simplify it here a little, because I had to keep the tag name in a separate field/table because I had to localize it for different languages:

tag
path

Look at these rows for example:

tag            path
---            ----
database       database/
mysql          database/mysql/
mysql4         database/mysql/mysql4/
mysql4-1       database/mysql/mysql4-1/
oracle         database/oracle/
sqlserver      database/sqlserver/
sqlserver2005  database/sqlserver/sqlserver2005/
sqlserver2005  database/sqlserver/sqlserver2008/

etc.

Using the like operator on the path field you can easily get all needed tag rows:

SELECT * FROM tags WHERE path LIKE 'database/%'

There are some implementation details like when you move a node in the hierarchy you have to change all children too etc., but it's not hard.

Also make sure that the length of your path is long enough - in my case I used not the tag name for the path, but another field to make sure that I don't get too long paths.

回复收藏 0 原文

诗化ㄋ丶相逢 2024-07-15 10:31:54

Ali 的回答包含Joe Celko 为聪明人编写的 SQL 中的树和层次结构，这证实了我的怀疑 - 没有一个简单的数据库结构可以提供世界上最好的。最适合我的目的似乎是本书中详细介绍的“频繁插入树”，它类似于阿里链接的“嵌套集模型”，但具有非连续索引。这允许 O(1) 插入（a非结构化 BASIC 行编号），并在需要时偶尔进行索引重组。

回复收藏 0 原文

撕心裂肺的伤痛 2024-07-15 10:31:54

这里有几种方法

回复收藏 0 原文

奢欲 2024-07-15 10:31:54

您可以构建 Kimball 所说的层次结构辅助表。

假设您的层次结构如下所示：A -> 乙| B-> C | C-> D

你会将记录插入到一个看起来像这样的表中，

ParentID, ChildID, Depth, Highest Flag, Lowest Flag
A, A, 0, Y, N
A, B, 1, N, N
A, C, 2, N, N
A, D, 3, N, Y
B, B, 0, N, N
B, C, 1, N, N
B, D, 2, N, Y
C, C, 0, N, N
C, D, 1, N, Y
D, D, 0. N, Y

我想我的想法是正确的......无论如何。关键是您仍然正确存储层次结构，您只需从正确的表构建此表即可。这个表的查询就像 Banshee 一样。假设您想知道 B 以下的所有第一级是什么。

WHERE parentID = 'B' and Depth = 1

You could build what Kimball calls a Hierarchy Helper Table.

Say you hierarchy looks like this: A -> B | B -> C | C -> D

you'd insert records into a table that looks like this

ParentID, ChildID, Depth, Highest Flag, Lowest Flag
A, A, 0, Y, N
A, B, 1, N, N
A, C, 2, N, N
A, D, 3, N, Y
B, B, 0, N, N
B, C, 1, N, N
B, D, 2, N, Y
C, C, 0, N, N
C, D, 1, N, Y
D, D, 0. N, Y

I think I have that correct.... anyways. The point is you still store you hierarchy correctly, you just build this table FROM your proper table. THIS table queries like a Banshee. Say you want to know what all the first level below B are.