当前位置：文江博客话题详情

Lucene：通过添加IR信息来输出详细数据

发布于 2024-10-18 21:06:42 字数 245 浏览 10 评论 0原文

我需要处理数据库，以便将 td-idf 权重等元信息添加到文档术语中。

接下来，我需要创建具有相似性度量的文档对，例如 td-idf 余弦相似度等......

我计划使用 Apache Lucene 来完成此任务。实际上，我对检索或运行查询不感兴趣，而是对数据进行索引并对其进行详细说明，以便生成具有上述文档对和相似度分数的输出文件。下一步是将这些结果传递给 Weka 分类器。

我可以用 Lucene 轻松做到这一点吗？谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

却一份温柔 2024-10-25 21:06:42

尝试将 Apache Mahout 与 Apache Lucene 和 Solr 集成。将“Mahout”替换为“Weka”。祝你好运。

回复收藏 0 原文

~没有更多了~

关于作者

仄言

暂无简介

文章

28 人气

关注发私信

lylex099819

文章 0 评论 0

关注

yg

文章 0 评论 0

关注

mb_PT8LkUS5

文章 0 评论 0

关注

埋情葬爱

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

奢望

文章 0 评论 0

友情链接

文江博客

Lucene：通过添加IR信息来输出详细数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

lylex099819

yg

mb_PT8LkUS5

埋情葬爱

佚名

奢望

友情链接

Lucene：通过添加IR信息来输出详细数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

lylex099819

yg

mb_PT8LkUS5

埋情葬爱

佚名

奢望

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。