如果将存储的文档传递给 MoreLikeThisHandler,mlt.mindf=1 是否会排除传入的文档?

发布于 2024-11-08 17:03:13 字数 143 浏览 4 评论 0原文

在 Solr 中,我使用 MoreLikeThis 处理程序。我传入索引中已存在的文档的唯一 ID,以便查找相关文档。指定 mlt.mindf=1 是否包含前面提到的文档?如果我想确保它存在于除我传入的文档之外的至少一个文档中,是否应该设置 mlt.mindf=2 的值?

In Solr, I am using the MoreLikeThis handler. I am passing in the unique id of a document that already exists in the index in order to find related documents. Does specifying mlt.mindf=1 include the previously mentioned document? If I want to be sure it exists in at least one document other than the one I pass in, should I set the value of mlt.mindf=2 instead?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

最近可好 2024-11-15 17:03:13

这是你正在做的一个有趣的项目:D

并且你正确。如果您想确保至少有一个其他文档具有相同的术语,则应将该值设置为 2。

提示:

  • 如果您自动查找相关文档,即关系(术语)不是由用户指定的,请确保搜索关键字,通过过滤掉相关文档不需要的单词(使用任何可用的过滤器来执行此操作)。

  • 您还可以建议一些单词(可能是 5,6,..)并使用 javascript 制作类似 奇迹轮

玩得开心 :)

That's a fun project your'e doing :D

And your'e correct. You should set the value to 2 if you want to make sure that there is at-least one other document with the same term.

Tip:

  • If you're automatically finding related documents,i.e, the relation(term) is not specified by a user, make sure you search for good keywords to find related documents by filtering out unwanted words(use any of the available filters to do this).

  • You could also suggest some words(maybe 5,6,..) and use javascript to make something like the Wonder-wheel.

Have fun :)

真心难拥有 2024-11-15 17:03:13

mindf 指定最小文档频率,即必须包含某个术语才能被计数的文档的最小数量。

有关详细信息,请参阅 MoreLikeThis

mindf specifies the minimum document frequency, that is, the minimum number of documents that must include a term for that term to be counted.

For more info, see MoreLikeThis

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文