如何搜索允许标记的数据库列?

发布于 2024-07-17 01:36:19 字数 280 浏览 4 评论 0原文

文本可以使用 markdown、bbcode、html 等存储在数据库中。我应该从搜索词中删除任何允许的标签吗? 您的标记解析器有任何方法来协助完成该任务吗?

我将使用类似“%searchword%”的查询。 全文搜索对于这种简单的文本搜索有什么优势吗?

更新:似乎有很多方法可以做到这一点。 我会再澄清一下我的情况。 这是一家公司的职位发布网站,大约有 5 或 7 个 varchar 列可供搜索(其中 4 个允许标记),在任何给定时间大约有 150 个活跃的职位发布。

The text could be stored in the database using either markdown, bbcode, html, etc. Should I remove any allowed tags from the search terms? Does your markup parser have any method to assist in that task?

I was going to use like '%searchword%' queries. Does full text search offer any advantages for such a simple text search?

Update: It seems there is a real plethora of ways to do this. I'll clarify my situation a little more. It's for a company's job posting website, about 5 or 7 varchar columns are open to the search (4 of which will allow markup), approximately 150 active job postings at any given time.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

享受孤独 2024-07-24 01:36:19

如果文本上有任何类型的标记(例如 HTML),则在索引和搜索过程中可能无法获得很高的语言准确性。 在这种情况下,您有两种选择 - 首选方法是将文本数据存储在 varbinary(max) 列中,并指示其文档类型,以便可以对其进行过滤。 如果这不是一个选项,您可以考虑使用中性分词器,如果可能的话,将标记数据(例如 HTML 中的“br”)添加到干扰词列表中。

另请参阅

替代方案

If you have any type of markup (such as HTML) on your text, you may not get great linguistic accuracy during indexing and search. In that case, you have two choices—the preferred method is simply to store the text data in varbinary(max) column, and to indicate its document type so it may be filtered. If this is not an option, you may consider using the neutral wordbreaker and, if possible, adding markup data (such as 'br' in HTML) to your noise word lists.

See also:

Alternatives:

友欢 2024-07-24 01:36:19

我会使用一些外部全文搜索工具——例如 Lucene。

I'd use some external Full-Text search tool -- for example, Lucene.

谎言 2024-07-24 01:36:19

我会将该字段的条带版本存储在单独的字段中,并使用全文索引搜索。 剥离的字段将使用触发器更新到最新版本

I would store a striped version of that field in separate field and use full-text index search. The stripped field would be updated to the latest version using triggers

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文