Elastic 中文分词问题
项目中会对各种附件:Word
、Excel
、Pdf
等做 Elastic
存储并使用中文分词插件(目前使用 ik
),但很多专业领域的分词或简历中的 人名
、公司
等默认分词插件里是没的,请问是否有实时的解决方案,例如:当存入一个新附件时能将其内容中的信息按照规则进行分词、而不是要编辑中文分词插件的配置然后重启 Elastic
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
使用Tomcat或Nginx作为外部Web服务器,将词典文件通过Web服务器共享。然后在IK分词器配置文件中,配置远程扩展字典。这样当需要更新词库时,直接编辑文件即可,ES那边就可以实时更新。