当前位置：文江博客话题详情

MySql 全文搜索是否可以合理地处理非拉丁语言（希伯来语、阿拉伯语、日语...）

发布于 2024-08-02 21:43:52 字数 191 浏览 10 评论 0原文

MySql 全文搜索对于非拉丁语言是否可以正常工作？（希伯来语、阿拉伯语、日语...）

添加：做了一些测试...希伯来语有一些问题。示例：מוסמנזון 这个名字与 מושמנזון 发音相同，但搜索找不到另一个，因为这是希伯来语中常见的拼写错误，看来我必须进行一些数据操作才能使其完美工作。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

月光色 2024-08-09 21:43:52

虽然MySQL对希伯来语的支持是有限的，但你的问题更多的是人们使用不正确的拼写的问题，然后从这个角度来看是MySQL服务器的功能障碍。当您在 Google 中拼错某个单词时，它会向您显示一条建议，您可以单击该建议来搜索该术语。

也许您可以构建一些具有相同行为的程序，例如您可以创建一个包含 2 个字段的表，一个包含常见拼写错误的单词，另一个包含正确的拼写。然后，您可以构建一个程序来查找拼写错误的单词并显示建议。

回复收藏 0 原文

停滞 2024-08-09 21:43:52

只要您的排序规则设置正确，它效果很好。

当然，Unicode 可以解决大部分问题。但这并不能很好地将拉丁字符翻译为它们（例如，在荷兰语排序规则中 aa 将被识别为 å）。

回复收藏 0 原文

心是晴朗的。 2024-08-09 21:43:52

是 MySQL 全文搜索非常适合阿拉伯语。只需在需要时确保以下内容：

COLLATION = utf8_unicode_ci & 字符集 = utf8。（数据库、表和列）。
3个字母及以上的索引词。这对于阿拉伯语来说非常重要，ft_min_word_len = 3（请参阅显示类似“ft_%”的变量；）
检查 MySQL 的版本（5.5 或5.6) 和引擎（InnoDb 或 MyIsam）

回复收藏 0 原文

妳是的陽光 2024-08-09 21:43:52

是的，但是，请查看停用词是什么。

回复收藏 0 原文

花海 2024-08-09 21:43:52

日语 和中文 使用它们自己的空白符号，MySQL 无法理解。

确保要索引的文本中的单词用 ASCII 分隔符（空格、逗号等）分隔。任何超出 ASCII 范围的内容都可能不起作用。

此外，您可能需要修复 ft_min_word_len：默认情况下，MySQL 不会索引短于 4 个字符的单词，并且大多数 >日语和中文单词。

在西里尔语中，音译错误非常常见。

此序列中的所有字母：АВЕКМНОРСТуХ / ABEKMHOPCTyX 在大多数字体中都无法区分。

其中最糟糕的是西里尔文 С/ 拉丁文 C：这两个符号都位于键盘上的一个键上，在大多数字体中完全没有区别，但它们有不同的功能代码。

MySQL 也不会捕获它。

回复收藏 0 原文

~没有更多了~

关于作者

怪我鬧

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

MySql 全文搜索是否可以合理地处理非拉丁语言（希伯来语、阿拉伯语、日语...）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

MySql 全文搜索是否可以合理地处理非拉丁语言（希伯来语、阿拉伯语、日语...）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

爱人如己

萧瑟寒风

云雾

倒带

浮世清欢

撩起发的微风

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。