调用 fopen 或 open 时使用什么编码？

发布于 2024-08-17 12:33:08 字数 245 浏览 7 评论 0原文

当我们在 Linux 中调用系统调用（如“open”）或 stdio 函数（如“fopen”）时，我们必须提供“const char * filename”。我的问题是这里使用的编码是什么？它是 utf-8 或 ascii 或 iso8859-x？这取决于系统或环境设置吗？

我知道在 MS Windows 中有一个接受 utf-16 的 _wopen 。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

追星践月 2024-08-24 12:33:08

它是一个字节字符串，解释取决于特定的文件系统。

回复收藏 0 原文

梦断已成空 2024-08-24 12:33:08

Linux 上的文件系统调用与编码无关，即它们不需要（不需要）了解特定的编码。就他们而言，文件名参数指向的字节字符串按原样传递到文件系统。文件系统期望文件名采用正确的编码（通常是 UTF-8，如 Matthew Talbert 提到的）。

这意味着您通常不需要执行任何操作（文件名被视为不透明的字节字符串），但这实际上取决于您从何处接收文件名，以及是否需要以任何方式操作文件名。

回复收藏 0 原文

梦中的蝴蝶 2024-08-24 12:33:08

这取决于系统区域设置。查看“locale”命令的输出。如果变量以 UTF-8 结尾，那么您的区域设置就是 UTF-8。大多数现代 Linux 将使用 UTF-8。尽管安德鲁是正确的，从技术上来说它只是一个字节字符串，但如果您与系统区域设置不匹配，某些程序可能无法正常工作，并且不可能获得正确的用户输入等。最好坚持使用 UTF-8。

回复收藏 0 原文

看轻我的陪伴 2024-08-24 12:33:08

文件名是字节字符串；无论您使用的区域设置或任何其他关于如何编码文件名的约定，您必须传递给 fopen 和所有采用文件名/路径名的函数的字符串都是文件的确切字节字符串命名。例如，如果您在 NFC 中有一个名为 ö.txt 的 UTF-8 文件，并且您的区域设置是 UTF-8 编码并使用 NFC，则只需将名称写入 ö.txt 并将其传递给 fopen。但是，如果您的区域设置基于 Latin-1，则无法将 ö.txt ("\xf6.txt") 的 Latin-1 形式传递给 fopen 并期望它成功；这是一个不同的字节字符串，因此是一个不同的文件名。您需要传递 "\xc3\xb6.txt" （"ö.txt" 如果您将其解释为 Latin-1），与真实姓名。

这种情况与您似乎熟悉的 Windows 非常不同，其中文件名 is 是解释为 UTF-16 的 16 位单元序列（尽管据我所知，它们实际上不需要是有效的 UTF -16) 和传递给 fopen 等的文件名根据当前语言环境解释为 Unicode 字符，然后用于根据其 UTF- 来打开/访问文件16 名字。

回复收藏 0 原文

落日海湾 2024-08-24 12:33:08

如上所述，这将是一个字节字符串，并且解释将向底层系统开放。更具体地说，想象一下 C 函数；一个在用户空间，一个在内核空间，它们以 char * 作为参数。用户空间中的编码将取决于用户程序的执行字符集（例如，由gcc中的-fexec-charset=charset指定）。内核函数期望的编码取决于内核编译期间使用的执行字符集（不确定从哪里获取该信息）。

回复收藏 0 原文