按逻辑类别对博客进行聚类和排名

发布于 2024-08-07 18:36:32 字数 281 浏览 2 评论 0原文

什么样的算法适合对逻辑社区(科技、娱乐等)中的博客进行聚类和排名?

对博客文章进行聚类和排名的算法会更好。

接受的答案是算法、伪代码、java 代码或特定算法解释的链接。

更新: 所以,看来我想要基于 部分聚类 类别的东西,主要是,关于文本特征。

What kind of algorithm would be good to cluster and rank blogs in logical communities (tech, entertainment, etc...)?

An algorithm to cluster and rank blog posts would be even better.

Answers accepted are algorithms, pseudo-code, java code or links to explanations on particular algorithms.

Update:
So, it seems I would like something in the category of Partional Clustering based, mostly, on textual features.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

笑看君怀她人 2024-08-14 18:36:32

首先,您必须通过定义以下内容来更好地定义您的问题:

  1. 每个博客的特征向量(描述符)
  2. 用于评估描述符之间“距离”的度量。

完成此操作后,您就有大量聚类算法可供选择,例如kmeans 等。

First you have to define your problem better by defining a:

  1. Feature vector (a descriptor) for each blog
  2. A metric to evaluate the "distance" between descriptors.

Once you've done that, you have a truckload of clustering algorithms to choose from, such as kmeans, etc.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文