nutch 1.1 schema.xml

发布于 2024-09-10 03:34:11 字数 463 浏览 2 评论 0原文

我最近下载了最新版本的 nutch。 (nutch-1.1) 在查看其代码时,我注意到有一个conf/schema.xml 文件,它定义了与nutch 捆绑在一起的solr 部分的模式。

这个 schema.xml 为每个插件都有字段。 我的问题是,我如何找出特定插件正在重新调整的值?换句话说,如果我使用带有 nutch 的第三方插件(例如插件 X),并且想要在 schema.xml 中添加一些字段,我如何确定“插件 X”返回的是什么以及如果它是字符串、整数、数组?

我的第二个问题是,我看到conf/solrindex-mapping.xml,它被nutch的solrIndexer使用。这让我更加困惑,因为并非 schema.xml 中的所有字段都在 solrindex-mapping.xml 中。

为了简单地解释答案,我们可以说 Plugin X 是与 nutch 捆绑在一起的 feed 插件。

I recently downloaded latest version of nutch. (nutch-1.1) While going through its code, I noticed that there is a conf/schema.xml file which defines schema for solr part bundled with nutch.

This schema.xml has fields for every plugin.
My question is, How do I find out, what values a particular plugin is retuning? In other words, if I use a third party plugin (say plugin X) with nutch and wants to add few fields in schema.xml, how do I figure out what "plugin X" is returning and if it is string, int, array?

My second question is that, I see conf/solrindex-mapping.xml which is been used by solrIndexer of nutch. This makes me more confused, since not all fields in schema.xml are in solrindex-mapping.xml

For simplicity of explaining answer, lets say Plugin X is feed plugin bundled with nutch.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

血之狂魔 2024-09-17 03:34:11
  1. 访问并检查有问题的 Nutch 索引
    查看操作方法
  1. Access and inspect the Nutch Index in question
    View How-To recipe
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文