当前位置：文江博客话题详情

encoding character-encoding c

字符编码问题

发布于 2024-08-23 19:59:26 字数 249 浏览 4 评论 0原文

我最近正在编辑一个 Unicode 编码的文本文件，其中还包含泰语字符（以及“普通”字符）。由于某种原因，在每个泰语字符序列之后，都会出现一个新行。

在用 C 进行了一些修改之后，尝试删除所有换行符，我启动了 vim 来检查文件。显然，在每个泰语字符序列之后，都会出现一个“^M”字符串（不带引号）。

为什么会发生这种情况，“^M”是什么？我发现我可以通过删除泰语字符串中的最后三个字符来解决问题，但肯定必须有一种更优雅的方法来解决这个问题......

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

心是晴朗的。 2024-08-30 19:59:26

这与文件中包含一些泰语字符这一事实无关。 ^M（'carrot M'）是 Microsoft (DOS) 回车符的表示。 Dos2unix 文件，在 vim 中编辑之前删除这些文件。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

22 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

13886483628

文章 0 评论 0

流年已逝

文章 0 评论 0

℡寂寞咖啡

文章 0 评论 0

笑看君怀她人

文章 0 评论 0

wkeithbarry

文章 0 评论 0

素手挽清风

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文