当前位置：文江博客话题详情

在哪里可以找到一个好的 PHP MediaWiki 标记解析器？

发布于 2024-07-25 08:57:46 字数 91 浏览 7 评论 0原文

我会尝试稍微破解一下 MediaWiki 的代码，但我发现如果我能得到一个独立的解析器，那就没有必要了。

谁能帮我这个？

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

耀眼的星火 2024-08-01 08:57:46

本·休斯是对的。要做到正确是非常困难的，特别是如果您想以 100% 的准确度解析来自大型 wiki（例如维基百科本身）的真实文章。它在 wikitech 邮件列表中被频繁讨论，尽管进行了多次尝试，但还没有替代解析器能够提供这种产品。

首先，它并不是真正的解析器，因为它没有 AST（抽象语法树）这样的概念。它是一个专门转换为HTML的转换器。

其次，不要陷入将 wikitext 视为一种标记语言的陷阱，在极少数情况下可以使用 HTML 进行扩展。您必须将其视为 HTML 的扩展。向 HTML 解析器添加 wiki 文本支持比向 wiki 文本解析器添加 HTML 支持容易得多。

归根结底，如果您想要任何其他格式，则需要从 HTML 转换为该格式。

基本上据说只有 MediaWiki 可以解析 wiki 文本。但是，解析器与其余代码紧密集成。经验丰富的 MediaWiki 黑客对有关隔离解析器的问题反应不佳 - 我已经尝试过（-：

但无论如何我也已经隔离了它。它还没有完成或准备好与任何人共享。但基本上你想开始未安装 MediaWiki 源或未连接到数据库或 Web 服务器，创建一个包含解析器的 PHP 存根程序，并在运行失败时检查错误，并为类、函数或 Web 服务器创建一个虚假存根。重复此操作，直到您已对解析器与 MediaWiki 其余部分交互的大部分位置进行了存根，

然后问题就出现了，因为源代码树变化很快，并且实时 wiki 会接受这些变化。解析器非常快，如果要在未来工作，您的变体必须跟上。

查看我的功能请求：错误 25984 - 将解析器与数据库依赖项隔离

回复收藏 0 原文