如何用PHP和DOM文档获取特定内容?
我有一个想要抓取的网址。我只想要其中的一小段内容。有问题的内容位于具有样本 ID 的 div 中。
<div id="sample">
Content
</div>
我可以像这样抓取文件:
$url= file_get_contents('http://www.example.com/');
但是我如何选择那个示例 div.
有什么想法吗?
I have a url I want to grab. I only want a short piece of content from it. The content in question is in a div that has a ID of sample.
<div id="sample">
Content
</div>
I can grab the file like so:
$url= file_get_contents('http://www.example.com/');
But how do I select just that sample div.
Any ideas?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我建议使用 PHP 简单 HTML DOM 解析器。
然后你可以这样做:
I'd recommend using the PHP Simple HTML DOM Parser.
Then you can do:
我会推荐类似 Simple HTML DOM 的东西,尽管如果您非常确定格式,您可能希望看看使用正则表达式来提取你想要的数据。
I would recommend something like Simple HTML DOM, although if you are very sure of the format, you may wish to look at using regex to extract the data you want.
不久前,我发布了一个名为
PHPPowertools/DOM-Query
,它允许您 (1) 加载 HTML 文件,然后 (2) 选择或更改 HTML 的部分,就像使用 jQuery 一样。使用该库,您可以按照以下方式为示例选择示例 div:
A while ago, I released an open source library named
PHPPowertools/DOM-Query
, which allows you to (1) load an HTML file and then (2) select or change parts of your HTML much like you'd do it with jQuery.Using that library, here's how you'd select the sample div for your example :