Solr dataimport 跳过我的 data-config.xml 中的实体
我的 data-config.xml 在文档标签下定义了 3 个不同的实体(我们称它们为 foo、bar 和 baz)。当我发出基本的完全导入 localhost:8983/solr/dataimport?command=full-import 时,3 个实体中只有 2 个被索引(foo 和 bar 在我的索引中,但 baz 从未创建)。但是,如果我随后发出命令通过 localhost:8983/solr/dataimport?command=full-import&entity=baz&clean=false 导入 baz,它会很好地添加 baz 文档,然后索引将具有所有 3 种类型。
有谁知道为什么一个实体在一般数据导入中被跳过,但如果我特别指出它仍然可以正常工作?是否有我可以检查的错误/警告日志? /solr/logs/ 中没有显示任何不好的内容,但这些似乎只是请求日志。
My data-config.xml defines 3 different entities under the document tag (lets call them foo, bar and baz). When I issue a basic full import localhost:8983/solr/dataimport?command=full-import, only 2 of the 3 entities get indexed (foo and bar are in my index but baz never makes it). However, if I then issue a command to just import baz via localhost:8983/solr/dataimport?command=full-import&entity=baz&clean=false it adds baz documents just fine and the index then has all 3 types.
Does anyone have any thoughts on why one entity gets skipped in the general data import but then still works okay if I specifically call it out? Is there an error/warning log I can check? Nothing bad shows up in /solr/logs/ but those just appear to be request logs.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
好吧,我知道发生了什么事。我的 data-config.xml 中的每个实体都有一个名为“id”的字段,但我也有id 在 schema.xml 中设置。因此 baz 的 solr 文档被 foo 的文档覆盖,因为它们都有相同的数字 id。我切换了 schema.xml,以便每个实体都有一个完全唯一的 id,问题解决了。
Okay, I figured out what was happening. Each entity in my data-config.xml had a field called "id" but I also had <uniqueKey>id</uniqueKey> set in schema.xml. So solr documents for baz were getting overwritten by documents from foo because they both had the same numeric id. I switched my schema.xml so that each entity had a completely unique id, problem solved.
文件 data-config.xml 不是有效的 XML。检查一下。
The file data-config.xml will not be valid XML. Check it.