当前位置：文江博客话题详情

导出文件时出现编码问题

发布于 2024-12-04 18:21:04 字数 448 浏览 1 评论 0原文

我试图找出集成项目中发生了什么。我们只是无法在最后得到正确的编码。

立陶宛文件已导入 as400。在那里，文本以 EBCDIC 编码存储。将数据导出到 ANSI 文件，然后读取为 windows-1257。 ASCII 字符工作得很好，有些立陶宛语也可以，但其余的字符看起来像 ~、¶ 和 ] 之类的垃圾。

穿过管道的示例字符串

启动文件
Tuskulënö

as400
图斯库拉诺
EAA9A9596
34224335A

导出的文件（转换为 windows-1257 后）
Tuskulėnö

导出文件的预期结果
Tuskulėnų

有什么想法吗？

问候，卡尔

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤独陪着我 2024-12-11 18:21:04

EBCDIC 不是单一编码，它是一系列编码（在本例中称为代码页），类似于 ISO-8859-* 是一个编码系列：这些系列中的编码共享大约一半的“基本”字母代码（大致相当于 ASCII 中存在的代码），而另一半则不同。

因此，如果您说它存储在 EBCDIC 中，则需要告诉我们使用了哪个代码页。

ANSI 也存在类似的问题：当用于编码时，它指的是 Windows 默认编码。不幸的是，Windows 安装的默认编码可能会根据配置的区域设置而有所不同。

再说一遍：您需要找出此处使用的实际编码（这些通常来自 Windows-* 系列，“正常”英语系列是 Windows-1252）。

一旦您真正知道您在每一点拥有和想要什么编码，您就可以进入第二步：修复它。

对于此类问题，我的个人偏好是这样的：只有一个步骤来转换编码：首先获取初始工具生成的所有内容并将其转换为 UTF-8步。从那时起，始终使用 UTF-8 来处理该数据。如果有必要，请在最后一步中将 UTF-8 转换为其他编码（但如果可能，请避免这样做）。

回复收藏 0 原文

~没有更多了~

关于作者

倦话

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

导出文件时出现编码问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

导出文件时出现编码问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

Gabu-gabumon

qq_CgiN62

荔枝明

赏烟花じ飞满天

独守阴晴ぅ圆缺

¤→小豸慧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。