对 HTML 文件进行后审核
我有一个生成的 HTML 文件,我想在将其上传到网站之前对其进行审核(脚本每小时执行一次)
我想审核如下内容: ;
我不能使用:
sed -i "s/<script>//g" htmlfile.html
因为可能有,例如:
<scr<script>ipt>BADTHINGS</scr</script>ipt>
你有什么建议?我如何审核 HTML 文件?
附言。 htmlfile.html 包含新闻链接,例如:slashdot 等。 <- 该文件由脚本生成。
I have a generated HTML file, and I want to audit it, before uploading it to a website (a script does it, in every hour)
I want to audit for things like this: <script>BADTHINGS</script>
I can't use:
sed -i "s/<script>//g" htmlfile.html
Because there could be, e.g.:
<scr<script>ipt>BADTHINGS</scr</script>ipt>
What do you advise? How could I audit the HTML file?
PS. the htmlfile.html contains links to news, e.g.: slashdot, etc. <- the file is generated by a script.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
使用 sed 进行多次传递,使用 HTMLPurifier。
Do multiple passes with sed, use HTMLPurifier.