使用 preg_split 进行文本解析的问题

发布于 2024-08-07 16:37:24 字数 356 浏览 4 评论 0原文

我为我的页面编写了一些简单的解析器,但遇到了一些问题。

HTML 文本:

<p>some text</p><p>another text</p>

如果我尝试使用类似以下内容:

preg_split("#<p>#",$string);

我得到的结果没有

,这是非常非常糟糕的。 (仅存在

也许我可以将此字符串拆分为数组,但不要删除

I write some easy parser for my page and have some problem with it.

HTML text:

<p>some text</p><p>another text</p>

If I try use something like:

preg_split("#<p>#",$string);

I have a result without <p>, and this is very very bad. (only </p> exist)

Maybe I can split this string to array, but don't remove </p>?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

情话墙 2024-08-14 16:37:24

您可以使用此构造 (?=

) ,即 正前瞻零宽度断言。该模式不会消耗它匹配的文本。它只会找到

字符串之前的位置。这是示例:

preg_split("#(?=<p>)#",$string);

You can use this construct (?=<p>) which is positive lookahead zero-width assertion. This pattern will not consume the text it matches. It just will find the position before <p> string. Here is example:

preg_split("#(?=<p>)#",$string);
小梨窩很甜 2024-08-14 16:37:24

就像 Ivan 所说,你应该使用 (?=

)。只是想补充一点,您可以使用

var $Paragraphs = array_filter(preg_split("/(?=<p>)/", "<p>some text</p><p>another text</p>"));

以下内容:

[1] => <p>some text</p>
[2] => <p>another text</p>

Just like Ivan said, you should use (?=<p>). Just wanted to add that you can use

var $Paragraphs = array_filter(preg_split("/(?=<p>)/", "<p>some text</p><p>another text</p>"));

Which will be:

[1] => <p>some text</p>
[2] => <p>another text</p>
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文