Linux-两条sed命令删除所有的HTML代码的区别

发布于 2017-02-13 01:15:34 字数 420 浏览 1167 评论 4

[root@CentOS5 ~]# cat 121.txt 
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<META NAME="Generator" CONTENT="EditPlus">
<META NAME="Author" CONTENT="">
<META NAME="Keywords" CONTENT="">
<META NAME="Description" CONTENT="">
</HEAD>

<BODY>
This is boby!
</BODY>
</HTML>

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

想挽留 2017-08-18 04:53:23

 sed -e 's/<[^<]*.[>$]//g' -e '/^s*$/d' 121.txt

归属感 2017-06-03 20:13:25

这个命令可以实现上述功能:

 sed 's/<[^<]*.[>$]//g;/^$/d' 121.txt > file.txt

清晨说ぺ晚安 2017-05-21 02:29:20

sed 's/<[^<].[>$]//g' a.log |sed '/^[ t]$/d'
sed 's/<[^<].[>$]//g;/^[ t]$/d' a.log
sed 's/[^<].[>$]//g;s@<@@g' a.log|sed '/^[ t]$/d'
当然可以哇
区别就是``第一个以<开始匹配`
第二个就是非<开头的数据开始匹配
给个awk的
awk -vRS="<[^<>]*>" 'NF=NF{printf $0}'

泛泛之交 2017-04-24 23:04:27

加上删除前后空格,还有删除空行

 sed -e 's/<[^<]*.[>$]//g' -e 's/^[ t]*//g' -e 's/[ t]*$//g' -e /^$/d 121.txt

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文