python如何提取excel表格内部子表格?

发布于 2022-09-11 14:31:17 字数 235 浏览 39 评论 0

问题描述

使用python提取内容未知的excel表格中子表格

图片描述

类似图片的红框部分,如何在读取excel表格的之后,根据提前配置的关键字,完成对红色部分的子表的提取。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

药祭#氼 2022-09-18 14:31:17

示例数据:
图片描述

假设你是想获取“用户填写”和“公司填写”之间的数据。

import pandas as pd

df = pd.read_excel("test.xlsx")
target_index = df.iloc[:,0].isin(["用户填写", "公司填写"]).index

res = df.iloc[target_index[0]:target_index[1],:]
res = res.rename(columns=res.iloc[0]).drop(res.index[0])

结果:

Out[42]: 
0 用户填写 col1 col2 col3
1  NaN  NaN  NaN  NaN
2  NaN  NaN  NaN  NaN
3  NaN  NaN  NaN  NaN
4  NaN  NaN  NaN  NaN
简美 2022-09-18 14:31:17

数据表格

数据表格

相关读取代码

import xlrd

workbook = xlrd.open_workbook(u'1.xlsx')

sheet_names = workbook.sheet_names()

for sheet_name in sheet_names:
    sheet2 = workbook.sheet_by_name(sheet_name)
    hangshu = sheet2.nrows
    lieshu = sheet2.ncols
    for i in range(hangshu):
        print(sheet2.row_values(i))

执行结果

['', '', '', '', '', '', '']
['', '', '', '', '', '', '']
['合并单元格1', '', 'ID', '字段1', '字段2', '字段3', '字段4']
['', '', 1.0, 1.0, 1.0, 1.0, 1.0]
['', '', 2.0, 2.0, 2.0, 2.0, 2.0]
['', '', 3.0, 3.0, 3.0, 3.0, 3.0]
['', '', 4.0, 4.0, 4.0, 4.0, 4.0]
['', '', '', '', '', '', '']
['合并单元格2', '', 'ID', '字段1', '字段2', '字段3', '字段4']
['', '', '', '', '', '', '']
['', '', '', '', '', '', '']
['', '', '', '', '', '', '']
['', '', '', '', '', '', '']
['', '', '', '', '', '', '']
['', '', 0.0, 0.0, 0.0, 0.0, 0.0]
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文