如何使用 iconv 将存储为 LATIN1 ( sql ) 的西里尔字母转换为真正的 UTF8 西里尔字母?

发布于 2024-08-24 08:07:22 字数 947 浏览 8 评论 0原文

我有一个 SQL 转储文件,其中包含错误存储的西里尔俄语 (WINDOWS-1251) 文本,例如 Èðàíñêèå,它应正确显示为 Иранские

过去我已经成功转换了sql文件,但是内存在我所做的事情和顺序上失败了。

从逻辑上讲,这是有道理的,因为它存储在 LATIN1 中,我将从 LATIN1 转换为 WINDOWS-1251,然后从 WINDOWS-1251 转换为 UTF-8//TRANSLIT 或类似的东西。

到目前为止,我已经尝试过:

1.

iconv -f WINDOWS-1251 -t UTF-8//TRANSLIT -o new.sql snippet.sql

输出:

ÈðàГГ±ГЄГЁГй(不是我想要的)

2.

iconv -f LATIN1 -t UTF-8//TRANSLIT -o new.sql snippet.sql 

输出:

à<88>Á°à à± ññà¥(也不是我想要的)

注释

  • 我可能会转换一次然后两次以获得我想要的结果,但我很确定在最后一步中,我从 WINDOWS-1251 转换为 UTF-8//TRANSLIT,正如我的笔记中所写的那样。

  • 另一个注意事项是,当文件编码为 utf8(vim 中的本机)时,我正在 SQL 文件中查看Èðàíñêèå。如果我在 vim 中 set enc=latin1 那么我会看到 ~Hð| íñêèå 好像这不会让它变得更混乱。

I have a SQL dump file consisting of incorrectly stored Cyrillic Russian ( WINDOWS-1251 ) text, example Èðàíñêèå which should properly be displayed as Иранские.

In the past I have successfully converted the sql file but memory fails in what I did and in what order.

Logically it would make sense that since it's stored in LATIN1 I would convert from LATIN1 to WINDOWS-1251 and then from WINDOWS-1251 to UTF-8//TRANSLIT or something like that.

So far I've tried:

1.

iconv -f WINDOWS-1251 -t UTF-8//TRANSLIT -o new.sql snippet.sql

Output:

Èðàíñêèå ( Not what I want )

2.

iconv -f LATIN1 -t UTF-8//TRANSLIT -o new.sql snippet.sql 

Output:

Ã<88>ðàíñêèå ( Not what I want either )

Notes

  • It's possible that I might have converted once and then twice to get my desired result, but I'm pretty sure that on the last step I converted from WINDOWS-1251 to UTF-8//TRANSLIT as that was written down in my notes.

  • One other note is that I'm viewing Èðàíñêèå in the SQL file when the file encoding is utf8 ( native in vim ). If I do set enc=latin1 in vim then I see ~Hð| íñêèå as if that doesn't make it more confusing.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

情话难免假 2024-08-31 08:07:22
iconv -f utf-8 -t latin1 < in.sql | iconv -f cp1251 -t utf-8 > out.sql
iconv -f utf-8 -t latin1 < in.sql | iconv -f cp1251 -t utf-8 > out.sql
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文