如何使用 iconv 将存储为 LATIN1 ( sql ) 的西里尔字母转换为真正的 UTF8 西里尔字母?
我有一个 SQL 转储文件,其中包含错误存储的西里尔俄语 (WINDOWS-1251) 文本,例如 Èðàíñêèå
,它应正确显示为 Иранские
。
过去我已经成功转换了sql文件,但是内存在我所做的事情和顺序上失败了。
从逻辑上讲,这是有道理的,因为它存储在 LATIN1 中,我将从 LATIN1 转换为 WINDOWS-1251,然后从 WINDOWS-1251 转换为 UTF-8//TRANSLIT 或类似的东西。
到目前为止,我已经尝试过:
1.
iconv -f WINDOWS-1251 -t UTF-8//TRANSLIT -o new.sql snippet.sql
输出:
Èðà ГГ±ГЄГЁГй
(不是我想要的)
2.
iconv -f LATIN1 -t UTF-8//TRANSLIT -o new.sql snippet.sql
输出:
à<88>Á°à à± ññà¥
(也不是我想要的)
注释
我可能会转换一次然后两次以获得我想要的结果,但我很确定在最后一步中,我从
WINDOWS-1251
转换为UTF-8//TRANSLIT
,正如我的笔记中所写的那样。另一个注意事项是,当文件编码为 utf8(vim 中的本机)时,我正在 SQL 文件中查看
Èðàíñêèå
。如果我在 vim 中set enc=latin1
那么我会看到~Hð| íñêèå
好像这不会让它变得更混乱。
I have a SQL dump file consisting of incorrectly stored Cyrillic Russian ( WINDOWS-1251 ) text, example Èðàíñêèå
which should properly be displayed as Иранские
.
In the past I have successfully converted the sql file but memory fails in what I did and in what order.
Logically it would make sense that since it's stored in LATIN1 I would convert from LATIN1 to WINDOWS-1251 and then from WINDOWS-1251 to UTF-8//TRANSLIT or something like that.
So far I've tried:
1.
iconv -f WINDOWS-1251 -t UTF-8//TRANSLIT -o new.sql snippet.sql
Output:
Èðà ГГ±ГЄГЁГҐ
( Not what I want )
2.
iconv -f LATIN1 -t UTF-8//TRANSLIT -o new.sql snippet.sql
Output:
Ã<88>ðà Ãñêèå
( Not what I want either )
Notes
It's possible that I might have converted once and then twice to get my desired result, but I'm pretty sure that on the last step I converted from
WINDOWS-1251
toUTF-8//TRANSLIT
as that was written down in my notes.One other note is that I'm viewing
Èðàíñêèå
in the SQL file when the file encoding is utf8 ( native in vim ). If I doset enc=latin1
in vim then I see~Hð| íñêèå
as if that doesn't make it more confusing.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)