Zend_Search_Lucene 的性能和瓶颈?

发布于 2024-07-25 20:15:43 字数 110 浏览 1 评论 0原文

我已经使用 nutch 一段时间了,直到最近我才知道这个度假村。

它的性能如何?它可以支持的文件大小限制是多少?

另外,如何删除或更新索引而不是每次修改时都重新索引?

I've been using nutch for a while,untile recently that I know about this resort.

How is its performance,and what's the file size limit it can support?

Besides,how to delete or update an index instead of re-index each time there is a modification?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

勿忘初心 2024-08-01 20:15:43

Zend_Search_Lucene 是 Apache Lucene 格式的纯 PHP 实现。 当前(从 ZF 1.6 开始)支持的 Lucene 索引格式版本为 1.4 - 2.3。 有关 Lucene 的更多信息,请访问 http://lucene.apache.org/java/docs/。

就索引大小限制而言,32位平台上索引大小限制为2GB,据我所知,64位平台上没有限制。

性能在很大程度上取决于您构建索引的方式。 请务必检查 处理性能的手册

此外,Luke(Lucene 索引的诊断工具)在性能优化和故障排除方面非常方便。

PS 关于更新,Lucene索引文件格式不支持文档更新。 应删除文档并将其重新添加到索引中以有效更新它们。 对于 Java 实现也是如此。

Zend_Search_Lucene is a pure PHP implementation of the Apache Lucene format. The currently (starting from ZF 1.6) supported Lucene index format versions are 1.4 - 2.3. For more information on Lucene, visit http://lucene.apache.org/java/docs/.

As far as index size limits are concerned, the index size is limited by 2GB for 32-bit platforms, and as far as I know, not limited on 64-bit platforms.

Performance is largely variant based to how you build your indexes. Make sure to check the section of the manual that deals with performance.

Also, Luke (a diagnostic tool for Lucene indexes) comes in really handy in performance optimization and troubleshooting.

P.S. With regards to updating, the Lucene index file format doesn't support document updating. Documents should be removed and re-added to the index to effectively update them. This is true for the Java implementation as well.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文