当前位置：文江博客话题详情

使用 EmEditor 将 Unicode 文件保存为另一种格式会扭曲/更改格式。解决方案？

发布于 2024-11-19 17:11:10 字数 788 浏览 6 评论 0原文

有一个 MySQL 备份文件，这是一个巨大的文件 - 大约 3 GB。有一张表有一个 LONGBLOB 列，用于存储 JPEG 图像数据。

如果从 MySQL Workbench - 数据导入/恢复完成，文件导入成功。

我需要打开这个文件并提取前几行（大约包含图像数据的表的两行 INSERT），以便我可以测试另一个程序是否可以将此数据导入到另一个 MySQL 数据库中。

我尝试使用 EmEditor 打开该文件（它擅长打开大文件），然后仅将脚本的最多一个 Insert 语句复制/粘贴到新文件中（最多大约第 25 行，因为有问题的表是该文件中的第一个表）备份脚本），然后将所选内容粘贴到新文件中。

问题来了：

然而这会弄乱编码（即使我保存为utf8）。当我尝试将这个新文件（再次使用 MySQL Workbench）导入（恢复）到 MySQL 数据库时，我意识到这一点，恢复顺利进行，但 blob 列中的 JPEG 图像现在被破坏/损坏。

我的猜测是原始文件和新文件的编码不同。

EmEditor 不显示原始文件的编码，有一个检测选项，它将其检测为“UTF8 Unsigned”。但是保存的时候我保存为UTF8。我也尝试另存为 ANSI、ISO8859（Windows 默认）等，但每次都是相同的结果。

对于这个特殊问题你有什么解决办法吗？即我只想剪切巨大备份文件的前几行并保存到一个新文件，保持编码相同，以便图像（斑点）不会更改。有什么方法可以使用 EmEditor 来完成此操作（即我是否使用了错误的方法 [即剪切粘贴]？）是否有任何专门的软件可以做到这一点？我如何诊断这里出了什么问题？

感谢您的任何回复。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

羁客 2024-11-26 17:11:10

这会弄乱编码（即使我保存为 utf8）

UTF-8 对于任意二进制数据来说不是一个好的选择。有许多高字节序列在 UTF-8 中无效，因此您可能会在加载-更改-保存过程中的某个时刻破坏它们。

如果您使用将每个字节映射到唯一字符的编码加载文件，并使用相同的编码重新保存文件，则应保留原始内容 (*)。 ISO-8859-1 是通常为此目的选择的编码，因为它只是将每个字节 0..0xFF 映射到具有相同数字的 Unicode 代码点。

(*: 假设编辑器对于其他棘手的问题是二进制安全的，例如 null、\n/\r 和其他控制字符......我相信 EmEditor 可以.)

回复收藏 0 原文

挽袖吟 2024-11-26 17:11:10

在 EmEditor 中打开原始文件时，尝试选择编码为二进制（ASCII 视图）。正如 bobince 所说，二进制（ASCII 视图）会将每个字节映射到一个唯一的字符，并在保存文件时保留该字符。我认为这应该可以解决你的问题。

回复收藏 0 原文

~没有更多了~

关于作者

黑色毁心梦

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

使用 EmEditor 将 Unicode 文件保存为另一种格式会扭曲/更改格式。解决方案？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

丶视觉

蓝礼

birdxs

foonlee

微信用户

っ〆星空下的拥抱

友情链接

使用 EmEditor 将 Unicode 文件保存为另一种格式会扭曲/更改格式。解决方案？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

丶视觉

蓝礼

birdxs

foonlee

微信用户

っ〆星空下的拥抱

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。