Solr 和自定义更新处理程序
我有一个关于 Solr 以及实现自定义更新处理程序的可能性的问题
基本上,情况是这样的:
- FIELD-A:我的主字段
- FIELD-B和FIELD-C:2个复制字段,源位于A中
FIELD-A具有其值之后存储后,我需要将此值复制到 FIELD-B 和 C 中,然后进行处理(假设提取子字符串)并在索引时间之前存储在 FIELD-B 和 C 中。我没有使用DIH。
编辑:我正在通过nutch推送我的数据(忘了提及)
据我所知,copyfields在索引后触发(但我对此不太确定)。
我已经通读了 wiki 页面,但我仍然不明白很多事情:
1)customupdateprocessor是conditionalcopyfield的替代品,还是它们必须同时存在于我的solr中?
2)创建我的条件复制字段 jar 文件后,如何在我的架构中声明它?
3)我如何修改我的 solrconfig.xml 才能使用我的更新程序?
4)如果我选择了错误的方式,任何建议都会受到赞赏,如果提供一些示例或记录良好的链接会更好
我读了很多(谷歌搜索和nabble上的lucene ml)但是没有太多关于此的文档。我只需要为我的两个复制字段创建一个自定义更新程序,
提前感谢大家!
I have a question about Solr and the possibility to implement a customized update handler
Basically, the scenario is this:
- FIELD-A : my main field
- FIELD-B and FIELD-C : 2 copyfield with source in A
After FIELD-A has its value stored, i need this valued to be copied in FIELD-B and C, then processed (let's say extract a substring) and stored in FIELD-B and C before indexing time. I'm not using DIH.
edit: i'm pushing my data via nutch (forgot to mention that)
As far as i've understood, copyfields triggers after indexing (but i'm not so sure about this).
I've already read throu the wiki page and still i don't understand a lot of things:
1) customupdateprocessor is an alternative to conditionalcopyfield or do they have to exist both in my solr?
2) after creating my conditionalcopyfield jar file, how do i declare it in my schema?
3) how do i have to modify my solrconfig.xml to use my updater?
4) if i'm choosing the wrong way, any suggestion is appreciated, better if some examples or well documented links are provided
I read a lot (googling and lucene ml on nabble) but there's not so much documentation about this. I just need to create a custom updater for my two copyfields,
Thanks all in advance!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
它并不复杂。以下是我遇到的一个很棒的链接,用于编写自定义 solr 更新处理程序。
我在我的 solr 中测试了它,它工作得很好!
Its not really complicated.. Following is an excellent link I came across to write a custom solr update handler.
I tested it in my solr and it just works fine!
如果您正在使用 SOLR 4 或计划使用它,http://wiki.apache.org/solr/ScriptUpdateProcessor 可能是一个更简单的解决方案。玩得开心!
If you are using SOLR 4 or planning to use it, http://wiki.apache.org/solr/ScriptUpdateProcessor could be an easier solution. Have fun!