从 MediaWiki API 调用中提取内容(XML、cURL)
URL:
http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=Lost_(TV_series)&format=xml
输出类似于:
<api><parse><text xml:space="preserve">text...</text></parse></api>
如何获取
和 < 之间的内容/文本>
?
我使用 curl
从此 URL 获取所有内容。所以这给了我:
$html = curl_exec($curl_handle);
下一步是什么?
URL:
http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=Lost_(TV_series)&format=xml
This outputs something like:
<api><parse><text xml:space="preserve">text...</text></parse></api>
How do I get just the content between <text xml:space="preserve">
and </text>
?
I used curl
to fetch all the content from this URL. So this gives me:
$html = curl_exec($curl_handle);
What's the next step?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
使用 PHP DOM 来解析它。这样做:
输出:
Use PHP DOM to parse it. Do it like this:
This outputs: