解析 Wiki API 内容

发布于 2024-11-17 20:02:57 字数 627 浏览 3 评论 0原文

我从 API http://fr.wikipedia.org/w/api.php?action=query&titles=%C9rythropo%EF%E9tine&prop=revisions&rvprop=content&format=xmlfm

我想检索从以下位置开始的主要内容:

L''''érythropoïétine''' ('''EPO''') est une [[hormone]] ......etc

我尝试开始 preg_replace 从顶部“{{Chimiebox...”到底部“}}”的所有内容使用这个

preg_replace( '/^{{(.*)}}$/sim', '', $value[0]['*'] );

但有点不起作用..有人知道确定内容开始的好方法吗?感谢您的任何建议。

I have this wiki from the API http://fr.wikipedia.org/w/api.php?action=query&titles=%C9rythropo%EF%E9tine&prop=revisions&rvprop=content&format=xmlfm

which I would like to retrieve the main content starting from:

L''''érythropoïétine''' ('''EPO''') est une [[hormone]] ......etc

I tried for a start to preg_replace everything from the top starting from the word "{{Chimiebox..." to the bottom "}}" using this

preg_replace( '/^{{(.*)}}$/sim', '', $value[0]['*'] );

But kind of doesn't work..does anyone know of a good way to determine the start of the content?? Thanks for any advice.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

み青杉依旧 2024-11-24 20:02:57

嗯,据我所知,大多数项目直接使用维基百科解析器,例如 维基百科我大学的离线客户项目。由于您似乎正在使用 php,因此这对您来说可能是最简单的方法。

Well, afaik the most projects use the Wikipedia Parser directly, e.g. the Wikipedia Offline Client Project at my university. Since you seem to be using php, this may the be the easiest way for you.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文