检索维基百科文章的第一段
过去 2 天我一直在尝试理解 MediaWiki 文档,但我不知道如何通过 MediaWiki API 检索 Wikipedia 文章的第一段。
有人能指出我正确的方向吗?
我即将诉诸 file_get_contents,但我相信有一个“更干净”的解决方案。
I've been trying to understand the MediaWiki documentation for the past 2 days and I can't figure out how to retrieve the first paragraph of a Wikipedia article through the MediaWiki API.
Could someone point me to the right direction?
I am about to appeal to file_get_contents, but I'm confident there's a "cleaner" solution.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
file_get_contents 非常干净,你可以得到 HTML 代码。
然后您可以使用 DOMDocument 解析 html 代码。
DOMDocument 作为 JavaScript 工作,例如,您可以获取 div 中的所有
。
或者抢第一个。
例如:
file_get_contents is pretty clean, you get the HTML code.
You can then parse the html code using DOMDocument.
DOMDocument works as javascript, you can fetch all
<p>
's in a div for example.Or grab the first one.
for example:
不要尝试使用原始 API,而应使用客户端包装器。这里有一个很长的列表可供选择,全部适用于 PHP:
http://en.wikipedia.org/wiki /维基百科:PHP_bot_framework_table
Don't try to use the raw API, instead use a client wrapper. Here's a long list to choose from, all for PHP:
http://en.wikipedia.org/wiki/Wikipedia:PHP_bot_framework_table