solrindex 将 nutch 模式映射到 solr 的方法

发布于 2024-09-16 20:59:15 字数 132 浏览 4 评论 0原文

我们有几个自定义的 nutch 字段供爬虫抓取并建立索引。通过 solrindex (使用映射文件)将其传输到 solr 效果很好。日志显示一切正常,但是 solr 环境中的索引并未反映这一点。 任何帮助将不胜感激,

谢谢, 阿肖克

We have several custom nutch fields that the crawler picks up and indexes. Transferring this to solr via solrindex (using the mapping file) works fine. The log shows everything is fine, however the index in solr environment does not reflect this.
Any help will be much appreciated,

Thanks,
Ashok

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

小巷里的女流氓 2024-09-23 20:59:15

我要做的是使用 tcpmon 之类的工具来准确监控 Nutch 发送到 Solr 的内容。通过检查 xml 负载,您可以确定 Nutch 是否正确地将这些自定义字段发送到 Solr。如果 Nutch 正确发送它们,则说明 Solr 端发生了一些事情。相反,重新检查您的 Nutch 代码。

What I would do is use a tool like tcpmon to monitor exactly what Nutch is sending to Solr. By examing the xml payload, you could determine if Nutch is correctly sending those custom fields to Solr. If Nutch is sending them correctly, there is something going on on the Solr side. On the opposite, re-check your Nutch code.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文