当前位置：文江博客话题详情

从消息中获取情报的算法选择

发布于 2024-10-05 20:22:57 字数 241 浏览 9 评论 0原文

我想做的是找到一种算法，通过将人们发送的消息与同行发送的消息进行比较，我可以实现该算法来为人们生成“智能”建议。

例如，人员 A 向人员 B 发送一条谈论 Obj1 的消息。如果 C 向 D 发送有关 Obj1 的消息，它会注意到他们正在谈论相同的事情，并可能建议 A 与 C 交谈。

我已经实现了收集统计数据以捕获人们共同提及的内容，但没有这样做知道使用哪种算法来分析这一点。

有什么建议吗？（我希望这有足够的意义）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

极度宠爱 2024-10-12 20:22:58

看看聚类算法

和k-means 或
k-最近邻快速入门

您有多少数据？越多越好。
解决这个问题有很多方法。例如，您可以认为所有用户在某种程度上都彼此相似，您想要做的是为每个用户找到最相似的用户。向量空间、余弦相似度将为您提供快速结果。
提供一些有关您想要实现的目标的更多信息。

回复收藏 0 原文

风透绣罗衣 2024-10-12 20:22:58

这正是 Twitter 正在努力解决的问题。如果你解决了这个问题，你最终可能会在那里找到一份工作；）

认真地回来，人们可以使用一些粗略的措施（即基于启发式的）来做这样的事情，但它有一个很大的错误百分比。正如德尔南在评论中所说。

NLP 是一个肯定的选择。请注意，使用 NLP 也有一些错误百分比，但它比您使用的任何启发式方法都要准确得多。如果您使用 python，我建议您使用这个工具包，我偶尔会使用它 - NLP。

对于其他语言，我确信有一些软件包可以在这方面为您提供帮助。

更新1：如果你有办法让用户标记他们的消息（就像 stackoverflow 那样），那么你可以在不使用 NLP 的情况下解决这个问题。然后，您可以简单地取两条消息的标签的交集，看看是否有任何共同点和共同点。为常见项目推荐一些顶级项目。

但是您还必须处理其他问题 - 使标签成为强制性的，另外您需要确保用户实际上输入了正确的标签等...但是，这大大简化了您的问题。

更新2：由于问题已更新 - 因为您只有一些您感兴趣的特定关键字/短语。这简化了它。您需要获取每条消息，将其拆分为单词，然后词干< /a> 每个词。词干提取后，将此集合与您拥有的关键字集相交。你会得到一套（S1）。对第二条消息执行相同的操作，您将得到一组（S2）。与 S1、S2 相交。如果您发现某些东西很常见，宾果游戏！某些主题在 message1 和 message2 之间是共同的。其他什么也没有。

回复收藏 0 原文

~没有更多了~

关于作者

污味仙女

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

从消息中获取情报的算法选择

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

从消息中获取情报的算法选择

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。