扩展/改变 Zend_Search_Lucene 的搜索方式

发布于 2024-09-01 10:27:10 字数 609 浏览 10 评论 0原文

我目前正在使用 Zend_Search_Lucene 来索引和搜索当前大约 1000 个左右的文档。我想做的是改变引擎对文档的点击率的评分方式，而不是当前的默认值。

Zend_Search_Lucene 根据文档内的命中次数频率进行评分，因此具有 10 个单词 PHP 匹配的文档将比仅具有 3 个 PHP 匹配的文档得分更高。我想做的是传递一些关键词，并根据这些关键词的点击率进行评分。例如，

我传递了 5 个关键字，PHP、MySQL、Javascript、HTML 和 CSS 我根据索引进行搜索。一份文档有 3 个与这些关键词的匹配，一份文档有全部 4 个匹配，这 4 个匹配得分最高。文件中这些词出现的次数与我无关。

现在我已经快速浏览了 Zend_Search_Lucene_Search_Similarity 但我必须承认我不确定（或者不太聪明）知道如何使用它来实现我所追求的目标。

我想要使用 Lucene 做的事情是否可行，或者是否有更好的解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

合久必婚 2024-09-08 10:27:10

对于我在 Zend_Search_Lucene_Search_Similarity 手册的部分，我首先扩展默认的相似性类来覆盖 tf（术语频率）方法，这样它就不会改变分数：

class MySimilarity extends Zend_Search_Lucene_Search_Similarity {    
    public function tf($freq) {
        return 1.0; // overriding default sqrt($freq);
    }
}

这样匹配的数量应该不予考虑。你认为这就足够了吗？

然后，在索引之前将其设置为默认相似度算法：

Zend_Search_Lucene_Search_Similarity::setDefault(new MySimilarity());

For what I've understood in the Zend_Search_Lucene_Search_Similarity section of the manual, I'd start by extending the default similarity class to override the tf (term frequency) method so that it doesn't alter the score:

class MySimilarity extends Zend_Search_Lucene_Search_Similarity {    
    public function tf($freq) {
        return 1.0; // overriding default sqrt($freq);
    }
}

This way the number of matches shouldn't be taken into account. Do you think this would be enough?

Then, set it to be the default similarity algorithm before indexing:

Zend_Search_Lucene_Search_Similarity::setDefault(new MySimilarity());

回复收藏 0 原文

~没有更多了~

关于作者

甜宝宝

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

扩展/改变 Zend_Search_Lucene 的搜索方式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

扩展/改变 Zend_Search_Lucene 的搜索方式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。