使用纯 Python 代码去除生成的 HTML 中的空格
我正在使用 Jinja2 生成 HTML 文件,这些文件通常非常大。我注意到生成的 HTML 有很多空格。是否有一个纯 Python 工具可以用来最小化此 HTML?当我说“最小化”时,我的意思是从 HTML 中删除不必要的空格(就像 Google 所做的那样 - 例如,查看 google.com 的源代码)
我不想依赖库/外部可执行文件,例如 tidy为了这。
需要进一步说明的是,实际上没有 JavaScript 代码。仅 HTML 内容。
I am using Jinja2 to generate HTML files which are typically very huge in size. I noticed that the generated HTML had a lot of whitespace. Is there a pure-Python tool that I can use to minimize this HTML? When I say "minimize", I mean remove unnecessary whitespace from the HTML (much like Google does -- look at the source for google.com, for instance)
I don't want to rely on libraries/external-executables such as tidy for this.
For further clarification, there is virtually no JavaScript code. Only HTML content.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
您还可以研究 Jinja 的内置空白控件,这可能会缓解一些问题渲染模板后需要手动删除空格。
引用文档:
You might also investigate Jinja's built-in whitespace control, which might alleviate some of the need for manually removing whitespace after your templates have been rendered.
Quoting the docs:
我发现 python slimmer 库非常适合您需要做的事情。
I found python slimmer library, perfect for what you need to do.
如果您只想删除多余的空格,您可以使用:
或:
如果您想做的事情比仅仅删除多余的空格更复杂,则需要使用更强大的工具(或更复杂的正则表达式)。
If you just want to get rid of excess whitespace, you can use:
or:
If you want to do something more complicated than just stripping excess whitespace, you'll need to use more powerful tools (or more complex regexps).