作者简介
Andrew Collette拥有UCLA的物理学博士学位,目前是科罗拉多大学的实验室研究科学家。他已经在两台几百万美元的研究设备上用Python-NumPy-HDF5进行过科学分析:第一台是UCLA的大型等离子设备(完全基于HDF5标准),第二台是位于科罗拉多大学波德分校的科罗拉多月面粉尘和大气研究中心的超高速粉尘加速器。另外,Collette博士还是HDF5 for Python(h5py)项目的开发领袖。
本书特色
Python语言在科学计算和数据处理领域应用前景广阔。大数据时代,催生了人们处理大量数据的实际需求。
Python应用领域的拓展,越来越多的人将Python用于处理大型数值数据集,使用标准格式来进行数据的存储和通信也显得越来越重要,而HDF5也正迅速成为人们存储科学数据的选择。
图书评论
本书会带你迅速了解使用HDF5对大小从GB至TB的数字数据集进行存档和共享的细节、最佳实践以及陷阱,体验在Python语言中用HDF5存储科学数据。
通过真实世界的例子以及动手练习,你将依次学习科学数据集、层次性组织的组、用户定义的元数据,以及有互操作性的文件等主题。本书的例子对于Python2和Python3都适用。
本书包括以下内容:
设置HDF5工具并创建第一个HDF5文件。
通过学习HDF5数据集对象来使用数据集。
理解数据集分块和压缩等高级功能。
使用组来学习如何利用HDF5层次性结构。
使用HDF5的属性来添加元数据,创建可以自解释的文件。
利用HDF5的类型系统创建有互操作性的文件。
使用引用,命名类型和维度标尺来表示数据之间的关系。
了解在Python中如何编写能跟HDF5互动的并行代码。
本书生产力和创造力的推进器的一个真实的完美例子。本书会让你觉得“HDF5很简单”。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论