过期页面排名算法

发布于 2024-12-05 19:40:27 字数 312 浏览 2 评论 0原文

我正在寻找一种算法，可以进行某种页面排名，但随着页面变旧，其价值会降低。

我见过的所有算法都做相反的事情（给旧的领域更多的价值）。

帮助找到这样的算法将不胜感激。

编辑：看看我最初的问题，我觉得我有点不清楚我在问什么，而且这个问题比我最初想象的要复杂。基本上我想要的是某种排名算法，如果网站 A 在网站 B 发布帖子后立即链接到网站 B，那么网站 B 的页面会获得额外的页面排名（也许分数是一个更好的词），但如果网站 A 有在帖子发布后很长一段时间内链接到网站 B，它对页面排名的增加很少。

希望这是有道理的。对于最初的问题是错误的表示歉意。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

染柒℉ 2024-12-12 19:40:27

您可以使用偏向页面排名，如 Haveliwala 在文章。

这个想法很简单，不使用常规随机分量：[1/n,1/n,....,1/n]，而是使用有偏差的随机分量，当您采用随机游走，不是以 1/n 的概率进入每个页面，而是以 f(doc) 的概率进入每个页面，其中 f(doc) 对于较新的页面更高，而 Sigma( f(doc)) = 1 [对于所有文档集合，因此您的随机组件将是 [f(doc1),f(doc2),...,f(docn)]

请注意，对于每个文档，必须是 f(doc )>0，否则无法保证收敛[Perron-Frobenius 定理不适用]。

另一种可能性是计算常规页面排名，并将其与不同的函数 g:Collection->R 相乘，该函数为每个页面提供数值，并且页面越新也就是说，该文档的分数越高。

编辑：

作为对原始问题编辑的回应：

另一种可能性是在生成网络图时，添加附加信息w:E->[0,1]，意思是：为每条边添加一个权重函数，表明它的重要性也就是说，如果链接是在原始编辑后不久创建的，则 w(e) 将更接近 1，如果晚得多，则分数将更接近 0。

在创建计算 pagerank 的矩阵时，输入 矩阵[v1][v2] <- w((v1,v2))，而不是指示图中存在边的简单二进制值。

一旦有了这个矩阵，就可以正常计算PageRank。