当前位置：文江博客话题详情

卢塞恩。如何构建术语-文档矩阵

发布于 2024-10-13 03:58:04 字数 263 浏览 6 评论 0原文

我需要构建该矩阵，但我找不到计算每个单元格标准化 tf-idf 的方法。我要执行的标准化是除 tf-idf 的余弦标准化（使用 DefaultSimilarity ）每 1/sqrt（列中的 sumOfSquaredtf-idf）。

有谁知道执行此操作的方法吗？
提前致谢
安东尼奥

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

多谢你的绝情让我学会死心 2024-10-20 03:58:04

Sujit Pal 的博客。或者，您可以构建一个每个字段都有术语向量的 Lucene 索引，迭代术语以获取 idf，然后迭代术语的文档以获取 tf。

回复收藏 0 原文

~没有更多了~

关于作者

煮酒

暂无简介

文章

25 人气

关注发私信

kaipeng

文章 0 评论 0

关注

吐个泡泡

文章 0 评论 0

关注

沧桑㈠

文章 0 评论 0

关注

御宅男

文章 0 评论 0

关注

泪眸﹌

文章 0 评论 0

关注

波浪屿的海角声

文章 0 评论 0

友情链接

文江博客

卢塞恩。如何构建术语-文档矩阵

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

kaipeng

吐个泡泡

沧桑㈠

御宅男

泪眸﹌

波浪屿的海角声

友情链接

卢塞恩。如何构建术语-文档矩阵

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

kaipeng

吐个泡泡

沧桑㈠

御宅男

泪眸﹌

波浪屿的海角声

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。