当前位置：文江博客话题详情

将源模块从 Unicode 转换为 ASCII 或反之亦然是否会严重扰乱差异？

发布于 2024-08-21 14:42:47 字数 381 浏览 5 评论 0原文

在测试套件中，我进行了处理分散在各个模块中的 unicode 的测试。我现在已将它们合并为一个测试类。

.cs 源模块中不再包含任何 unicode，仍保持 unicode 编码，因此其大小是其所需大小的 2 倍。我想将它们转换回 ASCII，以节省空间并缩短这些文件在编辑器和工具中的加载时间。

Q1. 这会破坏我的差异吗？我目前在我的工作站上使用 Kdiff3，但我对 TFS 生成的源模块的历史差异记录更感兴趣。

Q2. 将模块从 Unicode 转换为 ASCII 时，我还需要注意 wrt 源管理吗？

我的具体情况是 .NET 和 TFS，但我认为这个问题可能适用于几乎任何源代码控制系统和编程语言。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

俯瞰星空 2024-08-28 14:42:47

奇怪的是它被转换为 UTF-16。但从 Visual Studio 2008 中修复它很容易。使用“文件”+“另存为”，保留相同的名称，单击“保存”按钮上的箭头，然后选择“使用编码保存”。单击“编码”组合框并选择 UTF8。这是VS2008使用的默认编码。

生成的文件具有 BOM，就像 UTF-16 版本一样。这对于任何相当现代的 diff 工具（包括 KDiff3）来说应该足够好了。他们会将源代码文件中的文本解码回 Unicode。在几个文件上进行测试以确保。

回复收藏 0 原文

马蹄踏│碎落叶 2024-08-28 14:42:47

为什么不将所有内容都转换为 UTF-8？它可以处理 UTF-16 可以处理的所有内容（这显然就是“Unicode”的意思），但 ASCII 字符每个只占用一个字节，就像 ASCII 一样。而且您不必担心某些文件的编码与其他文件不同。如果您的 diff 工具首先将文件解码为通用编码，则它不会破坏旧的 diff。

将 UTF-16 转换为 ASCII 是一个非常糟糕的主意。你说这些文件中除了 ASCII 之外什么都没有，但如果你错了，非 ASCII 字符将会丢失。也就是说，除非您使用 Java 的 native2ascii 实用程序，它将非 ASCII 字符转换为 Unicode 转义符（例如，à -> \u00C3），但这会绝对会打破你的差异。

回复收藏 0 原文

~没有更多了~