从 MediaWiki API 调用中提取内容(XML、cURL)

发布于 2024-09-19 02:25:38 字数 557 浏览 9 评论 0原文

URL:

http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=Lost_(TV_series)&format=xml

输出类似于:

<api><parse><text xml:space="preserve">text...</text></parse></api>

如何获取 < 之间的内容/文本>

我使用 curl 从此 URL 获取所有内容。所以这给了我:

$html = curl_exec($curl_handle);

下一步是什么?

URL:

http://en.wikipedia.org/w/api.php?action=parse&prop=text&page=Lost_(TV_series)&format=xml

This outputs something like:

<api><parse><text xml:space="preserve">text...</text></parse></api>

How do I get just the content between <text xml:space="preserve"> and </text>?

I used curl to fetch all the content from this URL. So this gives me:

$html = curl_exec($curl_handle);

What's the next step?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

星光不落少年眉 2024-09-26 02:25:38

使用 PHP DOM 来解析它。这样做:

//you already have input text in $html
$html = '<api><parse><text xml:space="preserve">text...</text></parse></api>';

//parsing begins here:
$doc = new DOMDocument();
@$doc->loadHTML($html);
$nodes = $doc->getElementsByTagName('text');

//display what you need:
echo $nodes->item(0)->nodeValue;

输出:

文字...

Use PHP DOM to parse it. Do it like this:

//you already have input text in $html
$html = '<api><parse><text xml:space="preserve">text...</text></parse></api>';

//parsing begins here:
$doc = new DOMDocument();
@$doc->loadHTML($html);
$nodes = $doc->getElementsByTagName('text');

//display what you need:
echo $nodes->item(0)->nodeValue;

This outputs:

text...

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文