PySolr RSS 数据导入
我正在使用 PySolr 来运行我的搜索。我想索引一个 rss feed,想知道是否可以使用 PySolr 来实现,如果可以的话,你该怎么做。
我在 http://wiki.apache.org/ 上找到了有关如何在 Solr 中执行此操作的说明solr/DataImportHandler#HttpDataSource_Example
但找不到有关如何在 PySolr 中执行等效操作的任何信息,
谢谢
I am using PySolr to run my search. I want to index an rss feed and was wondering if this is possible using PySolr and if so how do you do it.
I have found instructions on how to do this in Solr at http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example
but can't find anything on how to do the equivalent in PySolr
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可能不需要在 PySolr 中执行相同的操作。如果您已经让 Solr 对 feed 建立了索引(如示例所示),那么您只需使用 PySolr 来查询该索引即可。类似于:
如果您确实想从 Python 端执行此操作,那么您需要在那里获取并解析 RSS(使用其他库,例如 通用 Feed 解析器); PySolr 只是包装了与 Solr 的交互,它不“处理”数据源。
您可能想查看 Haystack,它使用 PySolr(并且可以使用其他引擎)并巧妙地抽象了创建工作搜索索引条目并将它们发送到 Solr 进行索引。
You probably don't need to do the equivalent in PySolr. If you already have Solr indexing the feed, as per the example, then you just use PySolr to query that index. Something like:
If you really want to do it from the Python side, then you'll need to fetch and parse the RSS there (using other libraries, e.g. Universal Feed Parser); PySolr just wraps the interaction with Solr, it doesn't “do” data sources.
You may want to check out Haystack, which uses PySolr (and can use other engines) and neatly abstracts the job of creating search index entries and shipping them off to Solr for indexing.