PHP:来自 cURL、HTML 扫描的数据

发布于 2024-08-16 14:17:10 字数 32 浏览 8 评论 0原文

如何扫描 html 页面中某个 div 内的文本?

How can i scan a html page, for text within a certain div?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

孤星 2024-08-23 14:17:10

最简单的方法是使用 简单 HTML DOM 解析器

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

The simplest way to do this would be to use Simple HTML DOM parser

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');
鸠书 2024-08-23 14:17:10

您还可以使用 DOMDocument 类来执行此操作。

用法非常简单:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

文档位于此处

可以找到现实世界使用的示例 这里

You can also do this using the DOMDocument class.

Usage is pretty straight-forward:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

Documentation is here.

An example of real world usage can be found here.

御守 2024-08-23 14:17:10

您可以按照其他人的建议使用内置功能,或者您可以尝试将简单 HTML DOM 解析器实现为一个简单的 PHP 类和一些辅助函数。它支持 CSS 选择器样式的屏幕抓取(例如 jQuery),可以处理无效的 HTML,甚至提供熟悉的界面来操作 DOM。

值得一看 http://simplehtmldom.sourceforge.net/

You could use build in functionality as suggested by others or you could try the Simple HTML DOM Parser is implemented as a simple PHP class and a few helper functions. It supports CSS selector style screen scraping (such as in jQuery), can handle invalid HTML, and even provides a familiar interface to manipulate a DOM.

It's worth to check it out at http://simplehtmldom.sourceforge.net/

又爬满兰若 2024-08-23 14:17:10

preg_match() 来匹配您想要的子字符串或使用 dom/xml。

preg_match() to match the substring you want or use dom/xml.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文