如何将带有中文字符的EBCDIC转换为UTF-8格式
我需要将使用 EBCDIC 编码(使用 IBM937 代码页编码)的文件转换为 UTF-8 格式,以便将该文件加载到启用多字节的 DB2 数据库中。
我尝试过 unix recode 和 iconv。他们都没有能力将 IBM 937 转换为 UTF8。我正在寻找这个世界上可以在基于 UNIX 的系统上执行此操作的任何实用程序(java、perl、unix)。有人可以帮我吗?
SL
I have a requirement to convert a file with EBCDIC encoding which is encoded using the IBM937 code page to UTF-8 format for loading the file into a multi-byte enabled DB2 database.
I have tried unix recode and iconv. None of them has the ability to convert IBM 937 to UTF8. I'm looking for any utility (java, perl, unix ) in this world which can do that on a unix based system. Can someone help me here?
SL
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
看看 ICU(Unicode 国际组件):http://site.icu-project.org/
它有一个 IBM-937 转换器: http://demo.icu-project.org/icu-bin/convexp?conv=ibm-937_P110-1999&s=ALL
Take a look at ICU (International Components for Unicode): http://site.icu-project.org/
It has a converter for IBM-937: http://demo.icu-project.org/icu-bin/convexp?conv=ibm-937_P110-1999&s=ALL
看来 Java 可以将 IBM937 代码页转换为 UTF-8。
您可以将输入格式指定为“cp937”。
以下是 Oracle 页面上关于 字符和字节流 的两种方法:
和
It appears that Java can convert the IBM937 code page to UTF-8.
You would specify the input format as "cp937".
Here are two methods from the Oracle page on Character and Byte Streams:
and