使用奇怪的希伯来语编码翻译数据文件

发布于 2024-09-28 14:37:06 字数 313 浏览 7 评论 0原文

我有一个二进制数据文件,采用相对古老的程序使用的格式,我试图将其转换为正常的东西。在十六进制编辑器的帮助下,我基本上已经确定了文件格式,除了它包含具有奇怪编码的希伯来字符。

所有字符都是 8 位。 “标准”27 个辅音(包括“最后”辅音)从十六进制 80 到 9A。然后有一些元音似乎从十六进制 9B 左右开始(我猜是在标准辅音结束之后)。然后是“点”辅音,似乎从十六进制 E0 开始。

如果我没记错的话,我认为这是某种 DOS 编码。这是什么编码?我应该将其翻译成什么编码,以便以色列的用户能够最轻松地在 Microsoft Word 中打开它?我可以使用任何工具来进行翻译吗?

I have a binary data file, in a format used by a relatively ancient program, which I am trying to convert into something sane. With the help of a Hex editor I have basically worked out the file format except that it contains Hebrew characters with an odd encoding.

All characters are 8 bits. The "standard" 27 consonants (including "final" consonants) go from hex 80 to 9A. Then there are vowels that seem to start around hex 9B or so (I'm guessing right after the standard consonants end). Then there are "dotted" consonants that seem to start at hex E0.

If I remember correctly, I think this is some sort of DOS encoding. What encoding is this and what encoding should I translate it to so that a user in Israel will be able to most easily open it in, say, Microsoft Word? Are there any tools that I could use to do the translation?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

Bonjour°[大白 2024-10-05 14:37:06

80 到 9A 似乎与 CP862 中的代码点匹配,但我找不到任何匹配的元音码点。我认为你应该做的只是制作一个自定义映射 到 Unicode 并以 UTF- 格式生成输出8 或 UTF-16LE 纯文本文件。如果添加 BOM(字节顺序标记),记事本和/或 Word 应该能够毫无问题地读取它。我可能会制作一个小的 Python 脚本,但用任何其他语言应该不难。

80 to 9A seem to match the codepoints in the CP862, but I could not find any match for the vowel codepoints. I think what you should do is just make a custom mapping to Unicode and produce the output in UTF-8 or UTF-16LE plain text file. If you add a BOM (Byte-Order-Mark), Notepad and/or Word should be able to read it without issues. I would probably make a small Python script, but it shouldn't be hard in any other language.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文