Lucene 2.2 阿拉伯语分析器

发布于 2024-09-03 20:42:37 字数 59 浏览 2 评论 0原文

是否可以修改 Lucene 2.2 以添加阿拉伯分析器,如果有人已经这样做了,我在哪里可以获得源/jar

Is it possible to modify Lucene 2.2 to add Arabic analyzer and if anyone have done this already where can I get source/jar

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

云仙小弟 2024-09-10 20:42:37

之前有人问我如何在 lucene 2.4 上获得阿拉伯语和波斯语支持

​​,因此这些内容被非正式地向后移植到这里: http:// /people.apache.org/~rmuir/

http ://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar
http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch
http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

这个这意味着您只需升级到 2.4.1,这可能比升级到 2.9 或 3.0 更容易。

希望这有帮助

someone asked me before how to get arabic and persian support on lucene 2.4

so these were unofficially backported here: http://people.apache.org/~rmuir/

http://people.apache.org/~rmuir/lucene-analyzers-2.4.1_with_arabic_and_farsi.jar
http://people.apache.org/~rmuir/arabicFarsiLucene241_contrib.patch
http://people.apache.org/~rmuir/arabicFarsiLucene241_core.patch

this would mean you only have to upgrade to 2.4.1, which might be easier than upgrading to 2.9 or 3.0.

hope this helps

百变从容 2024-09-10 20:42:37

Lucene 3.0.1 有 阿拉伯语分析器。它位于 contrib 包中。

您可以升级到 Lucene 3.0.1 以开箱即用。您可能无法像 Lucene 2.2 那样使用它,因为 TokenStream API 在此版本中已更改。但是,如果您不想迁移到最新的 Lucene 版本,则将更改向后移植到 2.2 应该不会很困难。

Lucene 3.0.1 has Arabic Analyzer. It is in the contrib package.

You can upgrade to Lucene 3.0.1 to get this working out of the box. You probably will not be able to use this as it is for Lucene 2.2 since TokenStream APIs have changed in this release. But, back-porting changes to 2.2 shouldn't be very difficult, in case you don't wish to migrate to latest Lucene release.

够钟 2024-09-10 20:42:37

或者,您可以尝试使用 lucene-hunspell 作为分析器。目前它可以与 Lucene trunk 一起使用 - 我不知道它是否可以与 Lucene 3.0.1 一起使用。这是Robert Muir 的解释 和字典列表,包括阿拉伯语。我相信你也可以向后移植这个。沙希坎特的建议似乎更容易实施,而这个建议的质量可能会更好。

Alternatively, you can try using lucene-hunspell for an analyzer. This is currently working with the Lucene trunk - I do not know whether it works with Lucene 3.0.1. Here is Robert Muir's explanation and a list of dictionaries, including Arabic. I believe you could also back-port this. Shashikant's suggestion seems easier to implement, while this one may be better quality.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文