由各种分隔符分割,同时保留分隔符?

发布于 2024-09-13 02:51:50 字数 243 浏览 13 评论 0原文

我想分割文本
过公元年?因为无论你如何选择。简体字危及了对古代文学的研究输入!

使用这三个(或更多)?!。字符作为分隔符。 我当然可以用
来做到这一点 $lines = preg_split('/[。,!,?]/u',$body);

但是我不想让结果行保留其结束分隔符。另外一个句子可能会像这样啊。。。什么!??!!!!

I would like to split a text
过公元年?因为无论你如何选择。简体字危及了对古代文学的研究输入!

Using on of these three (or more) ?!。 characters as delimiter.
i can do this of course with
$lines = preg_split('/[。,!,?]/u',$body);

However i wan't to have the resulting lines keep their ending delimiter. Also a sentence might end like so 啊。。。 or 什么!??!!!!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

说好的呢 2024-09-20 02:51:51

试试这个:

$lines = preg_split('/(?<=[。!?])(?![。!?])/u',$body);

它在一个分隔符前面有分隔符但后面没有分隔符的位置处进行分割。它不消耗分隔符,如果有两个或多个连续的分隔符,它只匹配最后一个分隔符之后的分隔符。

Try this:

$lines = preg_split('/(?<=[。!?])(?![。!?])/u',$body);

It splits at a position that's preceded by one of your delimiter characters but not followed by one. It doesn't consume the delimiter, and if there are two or more consecutive delimiters, it only matches after the last one.

枫林﹌晚霞¤ 2024-09-20 02:51:51

在这种情况下,您想自己编写字符串分割器。并保持整个分隔符连续。 (您可以设置一个状态变量来指示它是在文本块还是分隔符块中)。

In this case, you'd like to write the string splitter yourself. And keep continuous delimiters as a whole. (you can set a state variable indicating whether it is in text block or delimiter block).

别在捏我脸啦 2024-09-20 02:51:51

您应该使用 preg_match_all 而不是 preg_split,即

preg_match_all("/[^?!。]+[?!。]+/u", $text, $res);

参见 http: //www.ideone.com/rN7MB 使用。

You should use preg_match_all instead of preg_split, i.e.

preg_match_all("/[^?!。]+[?!。]+/u", $text, $res);

See http://www.ideone.com/rN7MB for usage.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文