使用java查找wma文件的mime类型
我正在使用 apache tika 来检测音频和视频文件的 mime 类型。由于某种原因,tika 将 wma 文件(Microsoft 拥有的 Windows Media Audio 格式)的 mime 类型报告为 application/octet-stream。你知道在java中查找mime类型文件的更好方法吗?或者我可以使用tika本身来查询这些信息吗?
I am using apache tika for detecting the mime type of audio and video files. For some reason tika reports the mime type of the wma file (Windows Media Audio format owned by Microsoft) as application/octet-stream. Do you know a better way to find mime type of file in java? Or can I use tika itself to query this information?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
如果您为文件提供文件名,Tika 应该能够检测到这些文件,例如
我打开了 https://issues.apache.org/jira/browse/TIKA-629 来跟踪缺少 mime magic 检测的情况(如果您手头没有文件名)。
Tika should be able to detect the files if you supply a filename for them, eg
I've opened https://issues.apache.org/jira/browse/TIKA-629 to track the lack of mime magic detection for if you don't have the filename to hand.
根据 Microsoft 支持:http://support.microsoft.com/kb/284094, WMA 的 MIME 类型应为
audio/x-ms-wma
。根据:http://kb.iu.edu/data/agtj.html mime-type
application/octet-stream
表示一个二进制文件。我不确定为什么 TIKA 无法识别正确的 mime 类型,但如果实际的 mime 无法识别,则返回application/octet-stream
是后备/备份策略。失败的原因可能有很多:请查看以下链接以查找 Java 中的 mime 类型:
As per Microsoft support: http://support.microsoft.com/kb/284094, the mime type of WMA should be
audio/x-ms-wma
.As per: http://kb.iu.edu/data/agtj.html the mime-type
application/octet-stream
represents a binary file. I am not sure why TIKA is failing to recognize the proper mime type but it is the fallback/backup strategy to returnapplication/octet-stream
if the actual mime is not recognizable. The reason for failure could be many:Have a look at the below links for finding out mime-types in Java: