当前行以 ^M 结尾时在文件中追加下一行

发布于 2024-12-20 16:04:06 字数 301 浏览 0 评论 0原文

我有一个从工具输出的文件（从数据库查询）。其中一个字段的某些行末尾有 ^M 字符。这会导致我的输出被损坏。当当前行以 ^M 结尾时，如何将下一行追加到当前行。

我的机器安装了 sed、awk、perl、ruby 和 python，我使用的是 bash。

我使用 sed 尝试了以下操作：

sed -e :a -e '/^M$/N; s/^M\n//; ta' sourcefile > destfile

但这不起作用。

请指教。

谢谢，卡西克·S。

原文

I have a file which is output from a tool (queried from a DB). One of the fields has ^M characters at the end of some of the lines. This causes my output to be corrupted. How do I append the next line to the current line when the current line ends with ^M.

My machine has sed, awk, perl, ruby and python installed and I am using bash.

I tried the following using sed:

sed -e :a -e '/^M$/N; s/^M\n//; ta' sourcefile > destfile

But that did not work.

Please advise.

Thanks,
Karthick S.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吻风 2024-12-27 16:04:07

^M 表示 ctrl+M，它是一个字符，而不是两个字符。当您进行替换时，您输入的是两个字符还是一个字符？

一个字符：ctrl+v，然后 ctrl+m（正确）

两个字符：^ 然后 M （不正确，但可能看起来相同）

回复收藏 0 原文

婴鹅 2024-12-27 16:04:07

您看到的 ^M 字符实际上可能是回车符。您应该在正则表达式中使用 \r 来匹配那些。数据可能是由使用 CRLF 作为行结尾的系统（最有可能是 Windows）而不是仅使用 LF （像大多数 *nix 系统那样）插入到数据库中的。我猜它们后面已经有换行符，所以您可能想删除它们，而不是用换行符替换它们。

您的系统上可能有 dos2unix 命令，它可以为您转换这些行结尾。

您可能想首先使用 dos2unix 确保行结尾一致。之后，您可以像这样删除换行符：cat infile | dos2unix | tr -d '\n' >输出文件。
如果您想要在换行符所在的位置留出一个空格，可以使用 cat infile | dos2unix | tr '\n' ' ' >输出文件。

顺便说一句，使用 sed 删除换行符很困难，因为 sed 在文件中编辑行，一次处理一行。

回复收藏 0 原文

花海 2024-12-27 16:04:07

我希望我正确理解你的要求。请参阅下面的测试：

一个名为 test 的文件：

abc^M
___2ndline


xyz^M
###2ndline again

注意，我使用 ctrl-v, ctrl 在 vim 中输入的 ^M -m

现在可以看到以下 awk 行的输出。我希望这就是您所需要的：

kent$  awk  '/^M/{gsub(/^M/,"");printf $0;next;}1' test
abc___2ndline


xyz###2ndline again

i hope I understood your requirement correctly. see the test below:

a file called test:

abc^M
___2ndline


xyz^M
###2ndline again

note that, the ^M I typed in vim with ctrl-v, ctrl-m

now see the output with following awk line. I hope that is what you needed:

kent$  awk  '/^M/{gsub(/^M/,"");printf $0;next;}1' test
abc___2ndline


xyz###2ndline again

回复收藏 0 原文

稍尽春風 2024-12-27 16:04:07

为了了解文件每行末尾存在哪些字符，我使用了 @potong 注释：

sed -n 'l0' file
>>> 1st line\r$
>>> last line\r$

我的文件每行都以 \r$ 结尾，所以我这样做了：

sed -i "s/\r//g" file

它去掉了 < code>\r （或 ^M），通过就地重写文件来实现。这是 sed 的打印结果：

sed -n 'l0' file
>>> 1st line$
>>> last line$

To understand what caracters were present at the end of each line of my file, I used @potong comments:

sed -n 'l0' file
>>> 1st line\r$
>>> last line\r$

My file was ending with \r$ at each lines so I did :

sed -i "s/\r//g" file

which got rid of the \r (or ^M) by rewriting the file in place. Here is the resulting print of sed again:

sed -n 'l0' file
>>> 1st line$
>>> last line$

回复收藏 0 原文

~没有更多了~

关于作者

ゝ偶尔ゞ

暂无简介

文章

24 人气

关注发私信

友情链接

文江博客

当前行以 ^M 结尾时在文件中追加下一行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

梦屿孤独相伴

(devoted boy)

qq_pnDqVb

疯到世界奔溃

lock

niuniu

友情链接

当前行以 ^M 结尾时在文件中追加下一行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

梦屿孤独相伴

(devoted boy)

qq_pnDqVb

疯到世界奔溃

lock

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。