维基百科 api:仅获取解析的介绍
使用 PHP,有没有一种好方法可以从维基百科页面仅获取(已解析的)介绍?
我必须使用当前的方法:
- 第一个是调用 api 页面并返回,然后根据我从第一个请求中提取的介绍调用 Wiki 解析器(两个请求,从文本中提取介绍也不太好)。
- 第二种是调用整个页面解析器并使用
xpath
检索内容表之前的每个标记。
使用这两种方法,我都必须重新解析 HTML,以确保介绍链接中的相关链接指向维基百科。
两者都不理想,一定有更好的方法吗?
Using PHP, is there a nice way to get the (parsed) introduction only from a wikipedia page?
I have to current methods:
- The first is to call the api page and return, then call the Wiki parser on the introduction I have pulled from the first request (two requests, extracting the intro from the text isn't pretty either).
- The second is to call the entire page parser and use
xpath
to retrieve every<p>
tag before the contents table.
With both methods I then have to re-parse the HTML to ensure the relevant links inside the introduction link off to wikipedia.
Neither are ideal really, there must be a better way?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
action=parse
API 模块接受节号参数,像这样。引线是第 0 节。The
action=parse
API module accepts a section number parameter, like this. The lead is section number 0.