关于RTF格式解析和doc格式解析的问题
最近在做文件解析的工作,目前用的开源的POI解决doc和docx来解析,但是遇到rtf格式的会报错,请问java通过什么来判断后缀名为.doc的文件到底是word文件还是rtf格式文件呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
最近在做文件解析的工作,目前用的开源的POI解决doc和docx来解析,但是遇到rtf格式的会报错,请问java通过什么来判断后缀名为.doc的文件到底是word文件还是rtf格式文件呢?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
检查文件头,即文件的头几个字节。常见的 MIME Type 解析也是这个原理。因为阁下的需求非常简单,所以这里我也就不推荐用于 MIME 类型判断的第三方封装了。
RTF 定义类型的头几个字节经搜索查询得出是(十六进制):7B 5C 72 74 66
所以只需要读取文件的头五个字节,然后转换成 16 进制形式表现的字符串,再与“7b5c727466”比较即可判断是否为 RTF 类型。