在php中提取html页面的内容

发布于 2024-12-27 08:32:32 字数 93 浏览 1 评论 0原文

有任何方法可以在php中提取从开始并以结束的HTML页面的内容。如果有人可以发布一些示例代码。

There is any way to extract the content of a HTML page that starts from <body> and ends with </body> in php. If there can anyone post some sample code.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

记忆里有你的影子 2025-01-03 08:32:32

您应该查看 DOMDocument 参考。

此示例读取 html 文档,创建 DOMDocument 并获取 body 标记:

libxml_use_internal_errors(true);
$dom = new DOMDocument;
$dom->loadHTMLFile('http://example.com');
libxml_use_internal_errors(false);

$body = $dom->getElementsByTagName('body')->item(0);

echo $body->textContent; // print all the text content in the body

您还应该查看以下资源:

DOM API 文档
XPATH 语言规范

You should have a look at the DOMDocument reference.

This example reads a html document, creates a DOMDocument and gets the body tag:

libxml_use_internal_errors(true);
$dom = new DOMDocument;
$dom->loadHTMLFile('http://example.com');
libxml_use_internal_errors(false);

$body = $dom->getElementsByTagName('body')->item(0);

echo $body->textContent; // print all the text content in the body

You should also check out the following resources:

DOM API Documentation
XPATH language specification

半寸时光 2025-01-03 08:32:32

尝试 PHP 简单 HTML DOM 解析器

$html = file_get_html('http://www.example.com/');
$body = $html->find('body');

Try PHP Simple HTML DOM Parser

$html = file_get_html('http://www.example.com/');
$body = $html->find('body');
情仇皆在手 2025-01-03 08:32:32

您还可以尝试使用基于 strpos 函数的非 DOM 解决方案:

$html = file_get_contents($url);
$html = substr($html,stripos($html,'<body>')+6);
$html = substr($html,0,strripos($html,'</body>'));

striposstrpos 的不区分大小写的版本,strripos 是 strpos 的不区分大小写的“最右边位置”版本。

希望对您有帮助!

You can also try to use non-DOM solution based on strpos function:

$html = file_get_contents($url);
$html = substr($html,stripos($html,'<body>')+6);
$html = substr($html,0,strripos($html,'</body>'));

stripos is case insensitive version of strpos, strripos is case insensitive 'rightmost position' version of strpos.

Hope that it will help you!

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文