考虑将 Solr 用于 Web 应用程序,希望任何人能够提供任何性能见解
我正在构建一个涉及非常频繁的数据库更新(可能每秒 10-100 秒)的 Web 应用程序,并且还需要相同的搜索操作速率。 (即用户发布信息,然后需要非常定…
ruby 1.9 是否能够使用多核在 solr 中索引数据?
我有一个 ruby 1.9 Rails 3.0.7 应用程序,它使用 lucid/solr 来索引大量文本数据(3GB 左右)。数据存储在 MongoDB 数据库中,主要由电子邮件组…
Nutch 并将爬网数据保存到 Amazon S3
我正在尝试评估 Nutch/Solr/Hadoop 是否适合我的任务。 PS:之前我尝试将Nutch(1.4)和Hadoop集成起来,看看它是如何工作的。 这是我总体上想要实现…
Solr Jquery 自动完成 URL 源
浏览完SO后,我发现这段代码到处都是,即使我想实现AutoComplete,我正在使用Solr来实现搜索,并且想使用TermsComponent来实现Autocomplet var cache …
当列表页面从每 10 分钟更新一次的数据库中提取数据时,如何在表单提交后在列表页面上显示更改的数据库行?
我有一个列表页面,它是从查询到查询数据存储(例如:solr)构建的,该查询数据存储每 10 分钟从主(关系)数据库(批量)更新一次。 当用户点击一行…
SQL 选择 FOR XML 到 Solr 文档中
我正在尝试获取 SQL select 语句来生成符合 Solr 标准的 XML。 给定一个像这样的表: id | name --------- 1 | one 2 | two 3 | three 我需要一个类似…
Solr data-config.xml 中链接在一起的多个文档/根实体定义
我正在尝试定义 Solr data-config.xml 和 schema.xml 文件,以便我可以拥有多个独立的文档和/或根实体节点,然后将它们链接在一起。看起来 Solr 不会…
如何在 SOLR 中索引 URL,以便我可以在网站发布后提高结果
我的 SOLR 中索引了数千个文档,这些文档代表从不同网站爬取的数据。文档的字段之一是 SourceURL,它包含我爬行并索引到此文档中的网页的 URL。 我想…
solrQuery.setFilteQueries() 方法中的问题
我有以下查询,我从我的 URL 中获取 public static String query="pen&mq=pen&f=owners%5B%22abc%22%5D&f=application_type%5B%22cde%22%5D"; public …
在 Solr 中实现术语关联挖掘的最简单方法是什么?
关联挖掘似乎对于在文本语料库中检索相关术语给出了良好的结果。关于这个主题有很多著作,包括著名的 LSA 方法。挖掘关联的最直接方法是构建文档 X 术…
布尔运算符的奇怪 Solr/Lucene 行为
我在 Solr/Lucene 查询语法中遇到了 - 运算符的奇怪行为。 如果我执行查询, -text AND -text 我会得到所有预期结果(很多),但如果我加上一些括号,…
Solr 太阳黑子minimum_match
我刚开始使用 Solr Sunspot for Rails。我正在尝试使用, 所以自然不是所有的令牌都会匹配。我不知道如何在搜索中使用minimum_match功能http://outoft…