当前位置：文江博客话题详情

PageRank 与 SVD

发布于 2024-08-14 04:06:24 字数 504 浏览 13 评论 0原文

Pagerank 作用于一系列页面的节点图以及它们各自向内和向外形成的有向边链接。因此，特定页面的排名大致是节点图中本地引起的影响。

另一方面，SVD 适用于整个值矩阵，并且没有方向性 - a站点 A 和站点 B 之间的链接只会在正确的矩阵元素上注册为 1。这是一个全球系统，因此排名具有全球效应。

考虑到网络衍生矩阵的极度稀疏性，我认为 SVD 在这里表现不佳，因为它需要完整的数据集，并且具有大量的内存要求。

这是真的吗？ Pagerank 超越 SVD 很大程度上是因为它是基于节点图的算法吗？除了单词被提及的次数之外，Pagerank 如何从页面推断语义相关性？或者这是在 Pagerank 对页面进行排名后执行的第二步？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

揽月 2024-08-21 04:06:24

这里有两个问题：哪个度量很容易计算，哪个可以产生我们正在寻找的信息？我不知道这两个问题的答案，但我也许可以给出部分答案。

首先，相关性。用网络理论中的术语来说，这两个量都是中心性度量。 PageRank 计算特征向量中心性（的变体），而 SVD 显然导致了超链接诱导主题搜索 (HITS) 算法。我从这份讲义来自 Peter Dodds（佛蒙特大学）。它们衡量不同的事物，但我不清楚哪一个与衡量网页的重要性最相关。

其次，计算成本。从数学上讲，PageRank 是（修改后的）邻接矩阵的主要特征向量（如维基百科页面上所解释的），而 HITS 给出了邻接矩阵的主要奇异向量。两者都是由网页的全局网络及其之间的链接定义的，并且两者都可以通过仅考虑本地节点图来计算。所以乍一看，我认为计算成本大致相等。

总之，我不知道为什么PageRank比SVD更好；我什至不清楚它是否比 SVD 更好。

回复收藏 0 原文

许一世地老天荒 2024-08-21 04:06:24

请注意，PageRank 使用传送的随机游走矩阵。隐形传输对于避免随机游走矩阵的（低度）局部特征向量非常重要。我认为 PageRank 比 HITS 更好，因为随机游走矩阵（度归一化邻接矩阵）会抑制大度节点和循环的影响，而 HITS 则大度节点可以生成局部向量。

回复收藏 0 原文

~没有更多了~

关于作者

撑一把青伞

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

PageRank 与 SVD

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

PageRank 与 SVD

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。