维基百科 api:仅获取解析的介绍

发布于 2024-10-23 18:59:48 字数 592 浏览 4 评论 0原文

使用 PHP,有没有一种好方法可以从维基百科页面获取(已解析的)介绍?

我必须使用当前的方法:

  • 第一个是调用 api 页面并返回,然后根据我从第一个请求中提取的介绍调用 Wiki 解析器(两个请求,从文本中提取介绍也不太好)。
  • 第二种是调用整个页面解析器并使用 xpath 检索内容表之前的每个

    标记。

使用这两种方法,我都必须重新解析 HTML,以确保介绍链接中的相关链接指向维基百科。

两者都不理想,一定有更好的方法吗?

Using PHP, is there a nice way to get the (parsed) introduction only from a wikipedia page?

I have to current methods:

  • The first is to call the api page and return, then call the Wiki parser on the introduction I have pulled from the first request (two requests, extracting the intro from the text isn't pretty either).
  • The second is to call the entire page parser and use xpath to retrieve every <p> tag before the contents table.

With both methods I then have to re-parse the HTML to ensure the relevant links inside the introduction link off to wikipedia.

Neither are ideal really, there must be a better way?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

太傻旳人生 2024-10-30 18:59:48

action=parse API 模块接受节号参数,像这样。引线是第 0 节。

The action=parse API module accepts a section number parameter, like this. The lead is section number 0.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文