禁用 cURL 和allow_url_fopen 时如何抓取网站

发布于 2024-09-26 15:06:49 字数 348 浏览 0 评论 0原文

我知道有关 PHP 网页抓取工具的问题已经被多次询问，并且使用这个问题，我发现了 SimpleHTMLDOM。在我的本地服务器上无缝工作后，我将所有内容上传到我的在线服务器，却发现有些东西无法正常工作。快速浏览一下常见问题解答，我就找到了这个。我目前正在使用免费托管服务，因此请编辑任何 php.ini 设置。因此，根据常见问题解答的建议，我尝试使用 cURL，却发现这也被我的托管服务关闭了。是否有其他简单的解决方案可以在不使用 cURL 或 SimpleHTMLDOM 的情况下抓取另一个网页的内容？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

空气里的味道 2024-10-03 15:06:49

如果 cURL 和 allow_url_fopen 未启用，您可以尝试通过

。 fsockopen.php" rel="nofollow noreferrer">fsockopen — 打开 Internet 或 Unix 域套接字连接

换句话说，您必须手动执行 HTTP 请求。有关如何执行 GET 请求的信息，请参阅手册中的示例。然后可以进一步处理返回的内容。如果启用了套接字，您还可以使用任何第三方库来利用它们，例如 Zend_Http_Client。

顺便说一句，请查看解析 HTML 的最佳方法以获取替代方法SimpleHTMLDom。

回复收藏 0 原文

花间憩 2024-10-03 15:06:49

cURL 是一个特殊的 API。它不是通常所说的 http 库，而是 FTP、SFTP、SCP、HTTP PUT、SMTP、TELNET 等的通用数据传输库。如果您只想使用 HTTP，可以使用相应的 PEAR 库。或者检查您的 PHP 版本是否启用了官方 http 扩展。
如需抓取，请尝试 phpQuery 或查询路径。两者都带有内置的 http 支持。