如何构建像 stackoverflow 这样的标签系统

发布于 2024-10-03 02:05:16 字数 293 浏览 5 评论 0原文

我正在实现一个类似于 StackOverflow 标签系统的标签系统，但我只是想知道如何获取相关标签并定义标签之间的关系权重，例如任何标签页面中的“相关标签”列表，如下所示 https://stackoverflow.com/questions/tagged/php 他们通过两个或多个标签之间的共现来定义关系权重

我该怎么做在 PHP/MySQl 中定义标签“X”最相关的标签，并在用户添加越来越多的帖子/问题时保持所有权重最新？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笙痞 2024-10-10 02:05:16

您可能想研究一下统计数据：

给定一个标签 X，
检查所有其他标签 Y
，计算 Y 和 X 同时出现的频率
除以 Y 出现的频率
？？？
利润！！！

至于第 5 步的更多信息：此信息变化非常缓慢，因此您可以真正缓存这些内容，并仅在有时间时重新创建它。

你最终想要的是一个关系，

conditional_probability(X, Y, P)

它告诉你在给定 X 的情况下，(P) 标签 Y 的可能性有多大。P 是在步骤 4 中计算的。

You probably want to look into statistics for this:

given a tag X
check all other tags Y
count how often Y and X show up at the same time
divide by how often Y shows up
???
Profit!!!

As for more information on step 5: This information only changes very slowly, so you can really cache this stuff and only recreate it when you have time.

What you want in the end is a relation