当请求缺少用户代理时,维基百科 API 给出 ​​HTTP 403

发布于 2024-09-24 20:25:17 字数 1023 浏览 11 评论 0原文

我在使用维基百科 API 时遇到问题。我使用这个 PHP 脚本:

<?php
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

并且在浏览器中得到以下结果。为什么?

警告: DOMDocument::load(http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml) [domdocument.load]:打开失败 流:HTTP 请求失败! HTTP/1.0 403 D:\Program 中禁止 文件\VertrigoServ\www\wiki\index.php 第 3 行

警告:DOMDocument::load() [domdocument.load]:I/O 警告: 加载外部实体失败 “http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml” 在D:\程序中 文件\VertrigoServ\www\wiki\index.php 第 3 行

I have problem using the Wikipedia API. I use this PHP script:

<?php
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

and I have the following result in the browser. Why?

Warning:
DOMDocument::load(http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml)
[domdocument.load]: failed to open
stream: HTTP request failed! HTTP/1.0
403 Forbidden in D:\Program
Files\VertrigoServ\www\wiki\index.php
on line 3

Warning: DOMDocument::load()
[domdocument.load]: I/O warning :
failed to load external entity
"http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml"
in D:\Program
Files\VertrigoServ\www\wiki\index.php
on line 3

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

眼泪都笑了 2024-10-01 20:25:17
<?php
  $vars = array(
    'http' => array(
      'user_agent' =>'whatever'));
  $context = stream_context_create($vars);
  libxml_set_streams_context($context);
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

不要问我为什么需要用户代理,但我看到更多&更多关于 SO 的相同问题,都可以通过提供用户代理来解决。


编辑:
以下内容也可以工作(在这里确实如此):

<?php
  ini_set('user_agent','whatever');
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

也许 PHP 中此 user_agent 的默认设置已更改?

<?php
  $vars = array(
    'http' => array(
      'user_agent' =>'whatever'));
  $context = stream_context_create($vars);
  libxml_set_streams_context($context);
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

Don't ask my why a user-agent is required, but I see more & more the same questions here on SO, which all can be fixed by supplying a User-Agent.


edit:
The following would also work (it does here):

<?php
  ini_set('user_agent','whatever');
  $xmlDoc = new DOMDocument();
  $xmlDoc->load("http://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=New_York_Yankees&rvprop=content&format=xml");

  print $xmlDoc->saveXML();
?>

Perhaps a default setting in PHP for this user_agent has been changed?

林空鹿饮溪 2024-10-01 20:25:17

对于 MediaWiki 的用户代理政策:
http://meta.wikimedia.org/wiki/User-Agent_policy

For MediaWiki's User Agent policy:
http://meta.wikimedia.org/wiki/User-Agent_policy

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文