使用 iconv 时如何保留标点符号?
字符 «
、»
、'
、'
和其他几个字符消失,因为我指定了 //TRANSLIT
从 Latin-1/CP1251 转换为 UTF-8 时:
iconv -f utf-8 -t latin1//TRANSLIT < in.sql | iconv -f cp1251//TRANSLIT -t utf-8 > out.sql
'
会转换为 '
,因为它不是 Latin1。有没有办法让角色保持完整?
到目前为止,我一直在手动跟踪并用映射到字母的 CONSTANTSLIKETHIS
替换它们,并且在转换过程完成后进行手动 vim 替换。
The characters «
, »
, ‘
, ’
and several others disappear because I specify //TRANSLIT
when converting to UTF-8 from Latin-1/CP1251:
iconv -f utf-8 -t latin1//TRANSLIT < in.sql | iconv -f cp1251//TRANSLIT -t utf-8 > out.sql
The ‘
gets converted to a '
since it isn't in Latin1. Is there a way to keep the characters somehow intact?
So far I've been manually keeping track and replacing them with CONSTANTSLIKETHIS
mapped to letters, and I do manual vim replacements after the conversion process is done.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论