Sphinx 能否很好地处理亚洲语言的内容?
我正在考虑使用 Sphinx 作为我网站的搜索引擎。但由于我有很多韩语内容,并且可能会跟进其他语言(例如中文和泰语),我想知道 Sphinx 能够如何处理此类内容。
I'm thinking about using Sphinx as a search engine for my site. But since I have a lot of Korean content, and other languages like Chinese and Thai may follow, I wonder how well Sphinx can handle this type of content.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我正在使用 Sphinx 搜索 CJK 字符(中文、日文和韩文),您需要做的就是在您的 索引中添加以下行 strong> 配置文件的块。
I am using Sphinx to search CJK charcters (Chinese, Japanese, and Korean), what you need to do is to add the following lines in your index block of your configuration file.
Sphinx 适用于 UTF-8 字符(我相信包括韩语),但您必须包含 UTF-8 字符代码列表以在您的 sphinx 配置文件中建立索引。
这就是我的 charset_table 变量在 sphinx 配置中的样子,用于添加欧洲语言的各种字符:
Sphinx works well for UTF-8 characters (which includes Korean I believe), but you'll have to include a list of UTF-8 characters codes to index in your sphinx config file.
This is how my charset_table variable looks like in sphinx config, to add all kinds of characters from European languages:
在 Thinking sphinx 3 中:-
在
config
文件夹中创建一个thinking_sphinx.yml
文件,并将这些行设置为:-请参阅 Unicode 字符集表 了解更多信息。
In thinking sphinx 3:-
Create a
thinking_sphinx.yml
file insideconfig
folder and put these lines as :-See Unicode Character Set Tables for more.