2.3 HDF5 工具
在后续章节里,我们将创建大量的文件,需要一种方法能够独立地查看其中的内容。特别是当你需要将文件归档或者共享给其他同事的时候,对错误数据类型的检查是越早越好。
2.3.1 HDFView
HDFView是HDF组织提供的一个免费的图形界面HDF5文件浏览器。虽然功能比较简单,但它是用Java写的,所以在Windows、Linux和Mac上都可以使用。它有一个内建的表格样式的数据浏览器,也能进行基本的绘图功能。
图2-2显示了一个HDF5文件的内容。左边的面板上列出了多个组。组1被打开,并显示了其包含的数据集。其中一个数据集又被打开,其内容被显示在右边的表格视图上。
图2-2 HDFView
HDFView还允许你查看数据集和组的特征。基本上只要是HDF5支持的数据类型它都支持,除了某些长度可变的数据结构。
2.3.2 ViTables
ViTables是另一个免费的图形界面浏览器,图2-3显示了同一个HDF5文件在ViTables上打开的界面。它为PyTables文件做了优化,不过也能完美处理原生的HDF5文件。ViTables的一大优势在于它是随着某些版本的Python打包安装的,比如PythonXY,所以你可能已经拥有它了。
图2-3 ViTables
2.3.3 命令行工具
如果你已经习惯了命令行,那一定要安装HDF命令行工具。基本上所有的包管理器都可以帮你安装它,如若不然,你可以在http://www.hdfgroup.org 上下载。连Windows版的都有。
本书多处用到了一个名字叫h5ls的程序,它可以列出HDF5文件的内容。下例用h5ls列出了一个HDF5文件包含的多个数据集和一个组:
我们可以用-vlr选项来打印一些额外信息并递归地打印组的成员:
这个格式有点用了,我们可以看到array数据集内的对象的类型是本地整型,且是一个有10个元素的1维数组。同样,在group组内有一个2维的subarray数据集,对象类型也是本地整型。
查看元数据像这样用h5ls就足够了。还有一个叫做h5dump的程序,它以更为清晰的格式打印出数据。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论