当前位置：文江博客话题详情

Apache Lucene IKAnalyzer mmseg4j Apache Solr

solr索引时分词，如果更新词库了怎么办？？

发布于 2021-11-27 16:05:56 字数 493 浏览 797 评论 5

最近在用solr做一个项目，不断开发不断完善，但同事提出一个问题，以前没考虑过，想了想好像确实有问题。

问题描述：

目前索引的时候分词器采用的是max-word（当然与算法无关），目前我的词库有30万词，假如：以后我的词库增加了，那么检索的时候是没有问题的，但原来已经索引的数据，怎么办呢？原来索引的时候有些词没有，被分成了单字，现在更新词库有了，那怎么办呢？？？？同事提出这样，想了想确实有问题。不知道是我用的方式不对，还是哪里理解有问题。请大家帮忙解答下，谢谢！！！

@红薯 @滔哥

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

好听的两个字的网名 2021-12-01 05:27:38

没办法，要么重新索引，要么用一元分词

乞讨 2021-12-01 05:02:08

如何解决的？

狼亦尘 2021-12-01 01:31:45

如果是用es的话，有scan and scroll

清风夜微凉 2021-12-01 00:33:17

数据量小当然没有问题啊，一旦数据量比较大就要全部重新索引，那样就会比较麻烦了。

偏爱自由 2021-11-30 06:53:51

重建索引吧，能有多难呢。

~没有更多了~

关于作者

暂无简介

文章

评论

462 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文