php抓取网页源码的问题

发布于 2022-08-28 12:44:38 字数 597 浏览 34 评论 0

抓取一般的页面没问题·。
但近期给一个网站个搞晕了·。请大神们帮帮忙看看是什么原因导致失败。谢谢

地址:http://183.36.249.82/

我们学校的图书馆。

我用的代码如下

<?php
header ( "Content-type: text/html; charset=utf-8" );
$url = "http://183.36.249.82/"; 
$contents = file_get_contents($url); 
echo $contents; 
?>

但会出现这个错误:

Server Error in '/' Application.

Runtime Error

我用的服务器是SAE。也试过用SAE提供的fetch功能。

但可惜也是报错。

错误是:string(3) "500" string(21) "Internal Server Error"

多天研究原因不解。求解答。谢谢

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

白日梦 2022-09-04 12:44:38

file_get_contents抓取的时候,一般要设置一下HTTP context.抓取网页还是用cURL比较好.

<?php

$header = <<<HEADER
Connection: keep-alive
Cache-Control: max-age=0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
User-Agent: Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36
DNT: 1
Referer: http://183.36.249.82/
Accept-Encoding: gzip,deflate,sdch
Accept-Language: zh-CN,zh;q=0.8

HEADER;

$context = stream_context_create(array(
    'http' => array(
        'method' => 'GET',
        'header' => $header,
        'timeout' => 10,
        'protocol_version' => '1.1',
    ),

));


$contents = file_get_contents('http://183.36.249.82/', false, $context); 
echo $contents; 
虐人心 2022-09-04 12:44:38

你没发现网站要求重定向了吗?是刚学php呢吧?换用curl吧,file_get_contents抓不下来这个的吧(显然我错了,看别人的回答就知道是可以的,没文化真可怕啊)。

给你个参考连接吧,我不想写代码了
http://segmentfault.com/q/1010000000484804#a-1020000000484819
问问题的人虽然问得是ruby的问题,但是人家的php代码估计够你参考用了。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文