nutch 1.1 schema.xml
我最近下载了最新版本的 nutch。 (nutch-1.1) 在查看其代码时,我注意到有一个conf/schema.xml 文件,它定义了与nutch 捆绑在一起的solr 部分的模式。
这个 schema.xml 为每个插件都有字段。 我的问题是,我如何找出特定插件正在重新调整的值?换句话说,如果我使用带有 nutch 的第三方插件(例如插件 X),并且想要在 schema.xml 中添加一些字段,我如何确定“插件 X”返回的是什么以及如果它是字符串、整数、数组?
我的第二个问题是,我看到conf/solrindex-mapping.xml,它被nutch的solrIndexer使用。这让我更加困惑,因为并非 schema.xml 中的所有字段都在 solrindex-mapping.xml 中。
为了简单地解释答案,我们可以说 Plugin X 是与 nutch 捆绑在一起的 feed 插件。
I recently downloaded latest version of nutch. (nutch-1.1) While going through its code, I noticed that there is a conf/schema.xml file which defines schema for solr part bundled with nutch.
This schema.xml has fields for every plugin.
My question is, How do I find out, what values a particular plugin is retuning? In other words, if I use a third party plugin (say plugin X) with nutch and wants to add few fields in schema.xml, how do I figure out what "plugin X" is returning and if it is string, int, array?
My second question is that, I see conf/solrindex-mapping.xml which is been used by solrIndexer of nutch. This makes me more confused, since not all fields in schema.xml are in solrindex-mapping.xml
For simplicity of explaining answer, lets say Plugin X is feed plugin bundled with nutch.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
查看操作方法
View How-To recipe