当前位置：文江博客话题详情

PHP：来自 cURL、HTML 扫描的数据

发布于 2024-08-16 14:17:10 字数 32 浏览 8 评论 0原文

如何扫描 html 页面中某个 div 内的文本？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤星 2024-08-23 14:17:10

最简单的方法是使用简单 HTML DOM 解析器

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

The simplest way to do this would be to use Simple HTML DOM parser

// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');    

// Find all <div> which attribute id=foo
$ret = $html->find('div[id=foo]');

回复收藏 0 原文

鸠书 2024-08-23 14:17:10

您还可以使用 DOMDocument 类来执行此操作。

用法非常简单：

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

文档位于此处。

可以找到现实世界使用的示例这里。

You can also do this using the DOMDocument class.

Usage is pretty straight-forward:

$dom = new DOMDocument();
$dom->loadHTML(file_get_contents($url));

// Example:
$dom->getElementById('foo');

Documentation is here.

An example of real world usage can be found here.

回复收藏 0 原文

御守 2024-08-23 14:17:10

您可以按照其他人的建议使用内置功能，或者您可以尝试将简单 HTML DOM 解析器实现为一个简单的 PHP 类和一些辅助函数。它支持 CSS 选择器样式的屏幕抓取（例如 jQuery），可以处理无效的 HTML，甚至提供熟悉的界面来操作 DOM。

值得一看 http://simplehtmldom.sourceforge.net/

回复收藏 0 原文

又爬满兰若 2024-08-23 14:17:10

preg_match() 来匹配您想要的子字符串或使用 dom/xml。

回复收藏 0 原文

~没有更多了~

关于作者

旧人哭

暂无简介

文章

26 人气

关注发私信

佚名

文章 0 评论 0

关注

羁客

文章 0 评论 0

关注

天天爱笑的徐老师

文章 0 评论 0

关注

星

文章 0 评论 0

关注

夏日落

文章 0 评论 0

关注

隐诗

文章 0 评论 0

友情链接

文江博客

PHP：来自 cURL、HTML 扫描的数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

PHP：来自 cURL、HTML 扫描的数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。