php simple_html_dom拉去大量数据解决方案

发布于 2022-09-04 05:52:28 字数 247 浏览 15 评论 0

通过simple_html_dom,我想拉取70000个页面的数据，每个页面url格式一样，所以我用for进行遍历，浏览器在进行过程中总是出现问题，比如
file_get_contents(http://o.uhin.org/i1.aspx): failed to open stream: HTTP request failed!
请问如何解决这类问题

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

迟月 2022-09-11 05:52:28

用curl获取网页数据，看看curl_error是什么。
另外这个应该算是一个小型爬虫了，建议你直接在cli运行

回复收藏 0

黯然#的苍凉 2022-09-11 05:52:28

1、不要在http请求里做大量的循环抓取，会超时的；使用cli去做；
2、不要直接抓取直接解析，用一个任务去抓取回来保存到本地，另外一个任务去做解析；
3、使用另外一个 HtmlParser （http://www.oschina.net/p/html...）代替 simple_html_dom，效果高很多，我亲自试过；

回复收藏 0