从一篇文章中获取维基百科的描述
我正在尝试通过以下方式对维基百科进行 API 调用: http://en.wikipedia.org/w/api.php?action=parse&page=Petunia&format=xml,但 xml 充满了 html 和 css 标签。
有没有办法只获取没有标签的纯文本?谢谢!
*编辑1:
$json = json_decode(file_get_contents('http://en.wikipedia.org/w/api.php?action=parse&page=Petunia&format=json'));
$txt = strip_tags($json->text);
var_dump($json);
显示空。
I am trying to make a API call to wikipedia through: http://en.wikipedia.org/w/api.php?action=parse&page=Petunia&format=xml, but the xml is full with html and css tags.
Is there a way to fetch only plain text without tags? Thanks!
*Edit 1:
$json = json_decode(file_get_contents('http://en.wikipedia.org/w/api.php?action=parse&page=Petunia&format=json'));
$txt = strip_tags($json->text);
var_dump($json);
Null displayed.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
此处部分回答了问题,
我无法使用
file_get_contents
,但它可以与一起使用>cURL
。Question was partially answered here
I was not able to use
file_get_contents
but it works fine withcURL
.可以使用 xml 从维基百科获取信息或描述。
但是curl必须安装在服务器上......祝你有美好的一天......
it is possible to fetch info or description from wikipedia by using xml.
But curl must be install on server... have a nice day...