检索维基百科文章的第一段

发布于 2025-01-08 02:16:21 字数 152 浏览 0 评论 0原文

过去 2 天我一直在尝试理解 MediaWiki 文档,但我不知道如何通过 MediaWiki API 检索 Wikipedia 文章的第一段。

有人能指出我正确的方向吗?

我即将诉诸 file_get_contents,但我相信有一个“更干净”的解决方案。

I've been trying to understand the MediaWiki documentation for the past 2 days and I can't figure out how to retrieve the first paragraph of a Wikipedia article through the MediaWiki API.

Could someone point me to the right direction?

I am about to appeal to file_get_contents, but I'm confident there's a "cleaner" solution.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

只是偏爱你 2025-01-15 02:16:21

file_get_contents 非常干净,你可以得到 HTML 代码。
然后您可以使用 DOMDocument 解析 html 代码。
DOMDocument 作为 JavaScript 工作,例如,您可以获取 div 中的所有


或者抢第一个。

例如:

$html = file_get_contents('the url');

$dom = new DomDocument();
@$dom->loadHTML($html);

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;

file_get_contents is pretty clean, you get the HTML code.
You can then parse the html code using DOMDocument.
DOMDocument works as javascript, you can fetch all <p>'s in a div for example.
Or grab the first one.

for example:

$html = file_get_contents('the url');

$dom = new DomDocument();
@$dom->loadHTML($html);

$p = $dom->getElementsByTagName('p')->item(0)->nodeValue;
红玫瑰 2025-01-15 02:16:21

不要尝试使用原始 API,而应使用客户端包装器。这里有一个很长的列表可供选择,全部适用于 PHP:

http://en.wikipedia.org/wiki /维基百科:PHP_bot_framework_table

Don't try to use the raw API, instead use a client wrapper. Here's a long list to choose from, all for PHP:

http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文