solrindex 将 nutch 模式映射到 solr 的方法
我们有几个自定义的 nutch 字段供爬虫抓取并建立索引。通过 solrindex (使用映射文件)将其传输到 solr 效果很好。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。 任何帮助将不胜感激,
谢谢, 阿肖克
We have several custom nutch fields that the crawler picks up and indexes. Transferring this to solr via solrindex (using the mapping file) works fine. The log shows everything is fine, however the index in solr environment does not reflect this.
Any help will be much appreciated,
Thanks,
Ashok
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我要做的是使用 tcpmon 之类的工具来准确监控 Nutch 发送到 Solr 的内容。通过检查 xml 负载,您可以确定 Nutch 是否正确地将这些自定义字段发送到 Solr。如果 Nutch 正确发送它们,则说明 Solr 端发生了一些事情。相反,重新检查您的 Nutch 代码。
What I would do is use a tool like tcpmon to monitor exactly what Nutch is sending to Solr. By examing the xml payload, you could determine if Nutch is correctly sending those custom fields to Solr. If Nutch is sending them correctly, there is something going on on the Solr side. On the opposite, re-check your Nutch code.