Elastic 中文分词问题

发布于 2022-09-13 01:28:36 字数 272 浏览 21 评论 0

项目中会对各种附件:WordExcelPdf 等做 Elastic 存储并使用中文分词插件(目前使用 ik),但很多专业领域的分词或简历中的 人名公司 等默认分词插件里是没的,请问是否有实时的解决方案,例如:当存入一个新附件时能将其内容中的信息按照规则进行分词、而不是要编辑中文分词插件的配置然后重启 Elastic

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

回忆那么伤 2022-09-20 01:28:36

使用Tomcat或Nginx作为外部Web服务器,将词典文件通过Web服务器共享。然后在IK分词器配置文件中,配置远程扩展字典。这样当需要更新词库时,直接编辑文件即可,ES那边就可以实时更新。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文