DOM是如何解析的?

发布于 2024-10-10 22:36:06 字数 519 浏览 7 评论 0原文

可能的重复:
如果您'不应该使用正则表达式来解析HTML,那么HTML解析器是如何编写的?

我的问题很简单:当前的 DOM 解析器实际上如何从字符串(XML、 HTML,或其他)?

我知道你不应该用RegEx解析html ,但是 DOM 解析器不能使用 RegEx 来匹配打开/关闭标记的模式吗?或者,是否有一个好的一次性算法可以将提供的字符串解析为字符数组?

Possible Duplicate:
If you're not supposed to use Regular Expressions to parse HTML, then how are HTML parsers written?

My question is simple: How do current DOM parsers actually parse the DOM from a string (XML, HTML, or otherwise)?

I know you shouldn't parse html with RegEx, but couldn't a DOM parser use RegEx to match patterns for open/close tags? Or, is there a good once-over algorithm for parsing the provided string as a character array?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

泪痕残 2024-10-17 22:36:06

好吧,您可以从以下基本方法开始:

http ://www.blackbeltcoder.com/Articles/strings/parsing-html-tags-in-c

然后将其扩展以将所有内容存储到完整的 DOM 树结构中。

Well, you could start with a basic approach along the lines of:

http://www.blackbeltcoder.com/Articles/strings/parsing-html-tags-in-c

And then just expand it to store everything into the full DOM tree structure.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文