对于大量文件，是否有一种优雅的方式将每个 DOM 节点的计算样式记录到文件中？

发布于 2024-09-16 05:49:03 字数 442 浏览 4 评论 0原文

有没有一种优雅的方法来获取网页中每个 DOM 节点的大量文件的计算样式，以便比较这些文件中相似节点的样式数据？

我正在处理大量 HTML 文件（> 500），其中包含来自 MS FrontPage 的相当损坏的 HTML，试图提取样式数据并将其转换为语义标记。在某种程度上，我设法使用正则表达式来做到这一点，但现在它变得太复杂了。我了解到首先使用正则表达式解析 HTML 是一个坏主意，所以我试图找到一种方法让浏览器解析 HTML 并为我提供页面上每个节点的计算样式。

我知道我可以使用 JavaScript 访问 DOM 并获取每个节点的计算样式，但我一次只能对一个文件执行此操作，并且没有简单的方法可以跨多个文件比较此数据，或者有吗？如果我没记错的话，不可能将数据从 JavaScript 转储到文件中。还有哪些替代方案？

（顺便说一句。我尝试过使用 HTMLTidy，但 HTML 太糟糕了，以至于崩溃了。）

原文

分享到QQ

分享到微博