是否可以使用正则表达式对 PL/PGSQL 中的文本进行标记?

发布于 2024-12-06 00:24:03 字数 126 浏览 0 评论 0原文

我想使用正则表达式对数据库中的文本进行标记,并将生成的标记存储在表中。首先,我想用空格分割单词,然后用标点符号分割每个标记。

我在我的应用程序中执行此操作,但在数据库中执行它可能会加快速度。

可以这样做吗?

I want to tokenize text in my database with RegEx and store the resulting tokens in a table. First I want to split the words by spaces, and then each token by punctuation.

I'm doing this in my application, but executing it in the database might speed it up.

Is it possible to do this?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

再可℃爱ぅ一点好了 2024-12-13 00:24:03

有许多函数可以完成此类任务。
要检索文本的第二个单词:

SELECT split_part('split this up', ' ', 2);

拆分整个文本并每行返回一个单词:

SELECT regexp_split_to_table('split this up', E'\\s+');

实际上,最后一个示例会在任何空白区域上进行拆分。)

There is a number of functions for tasks like that.
To retrieve the 2nd word of a text:

SELECT split_part('split this up', ' ', 2);

Split the whole text and return one word per row:

SELECT regexp_split_to_table('split this up', E'\\s+');

Actually, the last example splits on any stretch of whitespace.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文