在 Linux 中使用 Python 读取 EXE、MSI 和 ZIP 文件元数据

发布于 2024-09-24 03:56:55 字数 535 浏览 1 评论 0原文

我正在编写一个 Python 脚本来将大量 Windows 安装程序索引到数据库中。

我想知道如何使用在 Linux 上运行的 Python 从 EXE、MSI 和 ZIP 文件中读取元数据信息（公司、产品名称、版本等）。

软件

我在 Ubuntu 10.04 64 位上使用 Python 2.6.5 和 Django 1.2.1。

目前发现：

可以提取 EXE 元数据的 Windows 命令行实用程序（如 SysUtils 中的 filever），或其他仅在 Windows 中工作的单独 CL 实用程序。我尝试通过 Wine 运行它们，但它们有问题，并且不值得花精力去查找这些 CL 实用程序所依赖的库和框架并尝试将它们安装在 Wine/Crossover 中。

Python 的 Win32 模块可以做一些事情，但不能在 Linux 中运行（对吗？）

第二个问题：

显然，更改文件的元数据会更改文件的 MD5 哈希和。除了定位和读取文件之外，是否有一种独立于元数据的散列文件的通用方法（例如：跳过前 1024 个字节？）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

雨落星ぅ辰 2024-10-01 03:56:55

看看这个库： http://bitbucket.org/haypo/hachoir/wiki/Home 以及使用该库的示例程序： http://pypi .python.org/pypi/hachoir-metadata/1.3.3。第二个链接是一个示例程序，它使用 Hachoir 二进制文件操作库（第一个链接）来解析元数据。

该库可以处理以下格式：

档案：bzip2、gzip、zip、tar
音频：MPEG 音频（“MP3”）、WAV、Sun/NeXT 音频、Ogg/Vorbis (OGG)、MIDI、AIFF 、AIFC、真实音频 (RA)
图像：BMP、CUR、EMF、ICO、GIF、JPEG、PCX、PNG、TGA、TIFF、WMF、XCF
其他：Torrent
程序：EXE
视频：ASF 格式（WMV 视频）、AVI、 Matroska (MKV)、Quicktime (MOV)、Ogg/Theora、Real media (RM)

此外，Hachoir 可以执行一些文件操作操作，我认为这些操作包括一些原始的元数据操作。