使用 PHP 的 DOM 获取 div 的内容
我浏览了有关该主题的其他 Stackoverflow 问题,但那里提供的解决方案似乎都不适合我。
我有一个 html 页面(用 file_get_contents()
抓取),并且该 html 是一个 id 为“main”的 div - 我需要使用 PHP 的 DOMDocument 或类似的东西获取该 div 的内容。对于这种情况,我无法使用 SimpleHTMLDom 解析器,这使事情变得有点复杂。
I've looked through the other Stackoverflow questions on this topic and none of the solutions provided there seem to work for me.
I have an html page (scraped with file_get_contents()
) and in that html is a div with an id of "main" - I need to get the contents of that div with PHP's DOMDocument, or something similiar. For this situation I can't use the SimpleHTMLDom parser, which complicates things a bit.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
DOMDocument + XPath 变体:
如果您正在寻找
innerHTML()
(PHP DOMDocument参考问题) - 而不是本答案中的innerXML()
- 给出了与 xpath 相关的变体 在此答案中。这里强调了所采用的变化:
DOMDocument + XPath variation:
If you're looking for
innerHTML()
(PHP DOMDocument Reference Question) - instead ofinnerXML()
as in this answer - the xpath related variant is given in this answer.Here the adoption with the changes underlined:
使用 DOMDocument...
要获取序列化的 HTML...
使用 < a href="http://php.net/manual/en/domdocument.savehtml.php" rel="nofollow">
saveHTML()
如果您的 PHP 版本支持的话。Using DOMDocument...
To get the serialised HTML...
Use
saveHTML()
if your PHP version supports it.