返回介绍

Unicode 和 UTF-8 支持

发布于 2020-09-10 13:29:47 字数 2078 浏览 945 评论 0 收藏 0

UltraEdit 提供 Unicode (16 位宽字符) 文件和 UTF-8 文件支持,允许象在 ASCII/ANSI 和 Unicode 或 UTF-8 文件之间转换一样,直接编辑 Unicode 类型的 UTF-8 文件。UltraEdit 会在文件载入时先侦测文件类型。它将查找 Unicode 文件的 FF FE 标记。对于 UTF-8 文件,它将用下列三种情况之一查找:

1) 文件标记 (BOM) EF、BB、BF。

2) 是否有“charset=utf-8”这样的字符

3) 将审视文件,并查找是否有有效的 UTF-8 多字节字符出现

如果发现文件是 Unicode,它将视为该种格式,状态栏中的文件类型前面会用“U-”开头显示,表示是 Unicode 文件。

如果发现文件是 UTF-8,它将视为该种格式,并转换到 Unicode (16 位) 进行编辑。状态栏中的文件类型前面会用“U8-”开头显示,表示是 UTF-8 文件。当保存文件时,它将从 Unicode 到 UTF-8 进行转换,并用该格式保存。

在内部用 Unicode 处理允许在字符输入时使用来自操作系统的 Unicode 字符消息表。另外,在某些 Windows 版本和某些应用程序支持使用 WM_UNICHAR 消息表,用 UltraEdit,允许在一些本身不支持 Unicode 的操作系统 (Windows 95/98/Me) 中输入 Unicode 字符。

下列是一些可用的 Unicode/UTF-8 转换功能:

ASCII 到 Unicode

从 ASCII 转到到 Unicode

UTF-8 到 Unicode

从 UTF-8 转换到 Unicode (16 位)

Unicode 到 ASCII

从 Unicode 转换到 ASCII

UTF-8 到 ASCII

从 UTF-8 转换到 ASCII

ASCII 到 UTF-8 (Unicode 版本)

将内部用 UNICODE 格式的文件在编辑时从 ASCII 转换到 UTF-8

Unicode/UTF-8 到 UTF-8 (Unicode)

将内部用 UNICODE 格式的文件在编辑时从 Unicode 或 UTF-8 (非内在 Unicode 格式) 转换文件到 UTF-8

Unicode/ASCII/UTF-8 到 UTF-8 (ASCII)

从 Unicode、ASCII 或 UTF-8 (内在 Unicode 格式) 转换到 UTF-8,但保留文件在非 unicode (ASCII 显示) 格式。

UltraEdit 内部提供在 Windows 95、98、Me、NT 和 2000 中的 Unicode 文件支持。

不是所有的操作系统本身就支持 Unicode,某些从多字节编码转换到 Unicode 或从 Unicode 转换到多字节编码不一定好用。如果活动代码页 (查阅 Windows 说明文档/帮助) 不支持这些字符,那么将不能正确转换。

这个功能用于在多字节编码和 Unicode 之间进行转换,包括查找/替换和列插入。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文