java读取文件的编码问题:有无BOM的UTF-8和GBK
java在读取文件的时候怎么去判断文件的编码:
有三种编码方式:有BOM的UTF-8、无BOM的UTF-8、GBK
在网上找了很多,都不是很准确的判断
特别是对无BOM的UTF-8和GBK的判断,有些例子要把文件读几遍,这样效率太低,不实用,有没有什么好的解决方法,请指教
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
用户上传的文件确实可能出现各种编码的情况,完美的解决方法不敢保证,但可以基于统计学原理的,最大限度的提供文件编码的侦测。
我使用过这个 cpdetector 基本可以解决我的需要。
附上代码示例:
就不给你写文件的方法了,File有获取URL的方法的。
我使用的时候导入了这几个jar。
找不到的话,可以留下邮箱,可以发你。
使用InputStreamReader,可以指定编码。
暂时找不到完美的解决办法