当前位置：文江博客话题详情

检测 zip 文件中的二进制文件和字符编码

发布于 2024-08-07 06:24:04 字数 212 浏览 9 评论 0原文

当从未知来源读取 zip 文件（使用 Java ZipInputStream 或任何其他库）时，是否有任何方法可以检测哪些条目是“字符数据”（如果是编码）或“二进制数据”。而且，如果是二进制的，任何确定更多信息（MIME 类型等）的方式

编辑 ByteOrderMark (BOM) 是否出现在 zipentries 中，如果是这样，我们必须对其进行特殊操作。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

星軌x 2024-08-14 06:24:04

它基本上可以归结为确定文件内容的启发式方法。例如，对于文本文件（ASCII），应该可以通过检查文件中使用的字节值的范围来做出相当好的猜测——尽管这永远不会完全万无一失。

您应该尝试限制要识别的文件类型的类别，例如，区分“文本数据”和“二进制数据”是否足够？如果是这样，您应该能够获得相当高的检测成功率。

对于 UNIX 系统，总是有 file 命令尝试根据文件类型来识别关于（主要）内容。

回复收藏 0 原文

墨离汐 2024-08-14 06:24:04

也许实现一个能够应用 /usr/share/file/magic 中定义的规则的 Java 组件。我很想拥有这样的东西。（您基本上必须能够查看前 x 几个字节。）

回复收藏 0 原文

~没有更多了~

关于作者

怀里藏娇

暂无简介

文章

24 人气

关注发私信

jsonder

文章 0 评论 0

关注

給妳壹絲溫柔

文章 0 评论 0

关注

北笙凉宸

文章 0 评论 0

关注

国产ˉ祖宗

文章 0 评论 0

关注

月下客

文章 0 评论 0

关注

梦行七里

文章 0 评论 0

友情链接

文江博客

检测 zip 文件中的二进制文件和字符编码

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签