第 3 章 Excel 文件
Microsoft Excel 几乎无处不在,使用 Excel 既可以保存客户、库存和雇员数据,还可以跟踪运营、销售和财务活动。人们在商业活动中使用 Excel 的方式五花八门,难以计数。因为 Excel 是商业活动中不可或缺的工具,所以知道如何使用 Python 处理 Excel 数据可以使你将 Python 加入到数据处理工作流中,进而从其他人那里接收数据,并以他们习惯接受的方式分享数据处理结果。
与 Python 的 csv 模块不同,Python 中没有处理 Excel 文件(就是带有 .xls 和 .xlsx 扩展名的文件)的标准模块。要完成本章中的示例,你需要 xlrd 和 xlwt 扩展包。xlrd 和 xlwt 扩展包使 Python 可以在任何操作系统上处理 Excel 文件,而且对 Excel 日期型数据的支持非常好。如果你安装了 Anaconda Python,那么就已经有了这两个扩展包,因为它们是与安装程序捆绑在一起的。如果你是从 Python.org 网站安装的 Python,那么还需要按照附录 A 中的指示下载并安装这两个扩展包。
简单解释一下术语:当提到“Excel 文件”时,和“Excel 工作簿”是一回事。Excel 工作簿包含一个或多个 Excel 工作表。在本章中,会交替使用“文件”和“工作簿”这两个词,并将工作簿中的个别工作表直接称为工作表。
和第 2 章中处理 CSV 文件一样,本章先给出使用基础 Python 完成的示例,这样你可以清楚数据处理的每个逻辑步骤,然后给出使用 pandas 完成的示例,这样你可以获得一个(通常情况下)更短小精悍的示例(尽管有一点抽象),你可以对这个示例进行复制和修改,然后用在自己的工作中。
要开始本章示例,需要先创建一个 Excel 工作簿。
(1) 打开 Microsoft Excel。
(2) 在工作簿中添加 3 个独立的工作表,并分别命名为 january_2013、february_2013 和 march_2013。然后分别添加数据,如图 3-1、图 3-2 和图 3-3 所示。
(3) 将工作簿保存为 sales_2013.xlsx。
图 3-1:工作表 1:january_2013
图 3-2:工作表 2:february_2013
图 3-3:工作表 3:march_2013
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论