当前位置：文江博客话题详情

UTF-8 Unicode malloc c

C中的utf8字符串和malloc

发布于 2024-12-09 02:30:40 字数 452 浏览 1 评论 0原文

使用“opendir”和“readdir”我确实读取了目录内容。在这个过程中，我做了一些字符串操作/分配：类似这样的：

int stringlength = strlen(cur_dir)+strlen(ep->d_name)+2;
char *file_with_path = xmalloc(stringlength); //xmalloc is a malloc wrapper with some tests (like no more memory)
snprintf (file_with_path, (size_t)stringlength, "%s/%s", cur_dir, ep->d_name);

但是如果一个字符串包含一个两字节的 utf8 字符怎么办？你如何处理这个问题？

stringlength*2?

谢谢

With "opendir" and "readdir" i do read a directories content.
During that process i do some strings manipulation / allocation:
something like that:

int stringlength = strlen(cur_dir)+strlen(ep->d_name)+2;
char *file_with_path = xmalloc(stringlength); //xmalloc is a malloc wrapper with some tests (like no more memory)
snprintf (file_with_path, (size_t)stringlength, "%s/%s", cur_dir, ep->d_name);

But what if a string contains a two-byte utf8 char?
How do you handle that issue?

stringlength*2?

Thanks

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

软糖 2024-12-16 02:30:40

strlen() 计算字符串中的字节数，它不关心包含的字节是否表示 UTF-8 编码的 Unicode 字符。因此，例如，包含 UTF-8 编码“aöü”的字符串的 strlen() 将返回 5，因为该字符串被编码为 "a \xc3\xb6\xc3\xbc"。

回复收藏 0 原文

倾城花音 2024-12-16 02:30:40

strlen 计算字符串中的字节数（直到终止 NUL），而不是 UTF-8 字符数，因此 stringlength 应该已经是您需要的大小它。

回复收藏 0 原文

~没有更多了~

关于作者

你曾走过我的故事

暂无简介

0 文章

0 评论

908 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文