使用正则表达式从 HTML body 标记中提取内容时忽略类属性
我正在尝试获取正文中的内容使用正则表达式标记,但在某些情况下不起作用。
例如,如果网页具有:
<body>text</body>
它将起作用,但如果 body 标记具有类或定义的内容,则它将不起作用,就像
<body class="something">text</body>
我需要正则表达式来处理这两种情况一样。
Possible Duplicate:
How to parse and process HTML with PHP?
How to parse HTML with PHP?
I am trying to get what's inside a body tag using regex, but it doesn't work in some cases.
For example if a web page has:
<body>text</body>
it will work, but it won't work if the body tag has a class or something defined, like
<body class="something">text</body>
I need the regex to work on both cases.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
在“body”单词后使用
[^>]*>
:Use
[^>]*>
after 'body' word: