Apache Solr 字符串字段还是文本字段?

发布于 2024-12-01 07:45:36 字数 96 浏览 1 评论 0原文

在 apache Solr 中,如果两者都能解决目的,为什么我们总是需要更喜欢字符串字段而不是文本字段?

字符串或文本如何影响索引大小、索引读取、索引创建等参数?

In apache Solr why do we always need to prefer string field over text field if both solves purposes?

How string or text affects the parameters like index size, index read, index creation?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

海的爱人是光 2024-12-08 07:45:36

solr 模式中默认定义的字段有很大不同。

String 将单词/句子存储为精确字符串,而不执行标记化等。通常用于存储精确匹配,例如用于分面。

Text 通常执行标记化和二次处理(例如小写等)。当我们想要匹配句子的一部分时,对于所有场景都很有用。

如果以下示例“这是一个例句” 被索引到这两个字段,我们必须精确搜索文本这是一个例句才能从string 字段,而搜索 sample(甚至启用了词干提取的 samples)就足以从 文本中获取命中 字段。

The fields as default defined in the solr schema are vastly different.

String stores a word/sentence as an exact string without performing tokenization etc. Commonly useful for storing exact matches, e.g, for facetting.

Text typically performs tokenization, and secondary processing (such as lower-casing etc.). Useful for all scenarios when we want to match part of a sentence.

If the following sample, "This is a sample sentence", is indexed to both fields we must search for exactly the text This is a sample sentence to get a hit from the string field, while it may suffice to search for sample (or even samples with stemmning enabled) to get a hit from the text field.

稀香 2024-12-08 07:45:36

添加 Johans Sjöbergs 的好答案:

您可以对 String 进行排序,但不能对 Text 进行排序。

Adding to Johans Sjöbergs good answer:

You can sort a String but not a Text.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文