pandas

pandas

文章 236 浏览 195

空dataframe过滤行之后列名丢失了

一个按条件过滤pandas中行的函数,对于非空的dataframe可以正常工作,但是对于带列名的空的dataframe,过滤后的空datafram缺丢失了列名 问题复现如下…

隐诗 2022-09-07 22:59:31 19 0

2组numpy数据对比时的异常

1、我在将2个dataframe表格的真实数据转化成numpy数据做列内容对比,遇到以下的情况:input: 不同数组的单个元素 d12.values[0] [0],d12.values[1] …

混吃等死 2022-09-07 21:27:05 24 0

Pandas多次分组统计

各位大佬,请教一个Pandas分组问题,个人感觉比较复杂。 df = pd.DataFrame({"Date":pd.date_range(start='2018-08-17 08:10:30',periods=15,freq='s…

慕巷 2022-09-07 21:22:18 14 0

Can only use .str accessor with string values错误?

目前我在构建一个合并财务报表系统,从财务系统里抓数然后做数据清洗和计算,其中清洗阶段主要使用pandas完成。抓的数据中,数字都用千分位符隔开,…

笑脸一如从前 2022-09-07 20:46:33 15 0

请问用Pandas把数据生成到excel的时候如何避免科学记数法?

问题描述 我从两个不同的excel里读了差异数据,然后把他们放到一个新的excel里,在IDE下显示身份证号一列都正常,但是到了excel里就变成了科学计数法…

遮云壑 2022-09-07 19:51:53 18 0

python pandas dataframe拆分行(某些行一行拆成多行)

比如有数据 A B C 1 1,2 3 2 3 3 3 4,5,6 3 这样一张表,要按B将他拆分为: A B C 1 1 3 1 2 3 2 3 3 3 4 3 1 5 3 1 6 3请问该如何操作 …

慕巷 2022-09-07 19:40:40 13 0

百度面试题,如何快速找出文件(大文件无法一次性读取)中的重复项?

百度面试题,大致意思是说,有个文件,文件很大不能一次性读取(可能是不能一次性加载到内存中),文件中存放的是IP地址,如何快速找出重复的IP地址…

独木成林 2022-09-07 16:26:15 33 0

DataFrame格式化数据的时候怎么忽略NaN?

df是一个dataframe,其中df中有部分NaN值,如下代码依次对每一列进行格式化(例如把金钱变成美元符号开头的字符串,对应的函数是formatter_function…

旧故 2022-09-07 16:19:16 14 0

如何自定义一个函数作用在dataframe的每一个值上

def hour_exceed(df): i=df.values if i is np.nan: return np.nan elif i>200: return 1 elif i<200: return 0 dataframe df15.head()Out[21]: time…

指尖微凉心微凉 2022-09-07 15:41:43 19 0

python pandas 如何对比两列数据的包含关系,并将结果写如表一内?

表一add列匹配表二key_word,如果表一add包含表二的key_word,在表一第4列写入group,如果不包含则标注‘未收录’。PS:我用迭代也测过了,笛卡尔积也试…

失去的东西太少 2022-09-07 12:46:16 24 0

如何设定dask array的shape和chunksize

如题:如何设置dask.array的chunksize和shape?代码如下 >>> x = data.values >>> x dask.array >>> y = data['label'].values >>> y dask.array >>>…

日记撕了你也走了 2022-09-07 12:38:05 34 0

pandas如何在已有excel的sheet里完全覆盖地写入数据?pandas如何删除excel里的一行数据?

在使用pandas进行文件写入时,如果原来sheet已有数据,则新写入数据在原来数据上进行不删除地复写。比如说原来有4行数据,我想删掉一行,read为dataf…

疯了 2022-09-07 12:28:43 107 0

从多个数据来源按优先度选取一条作为取值,如何用python做数据处理。

这里同一条数据(营收数据)最多有四个来源,也有的为null,我想从这四个来源选一个作为统计来源(放在取值这一列),来源1,2,3,4取值优先度递减。这种…

煮茶煮酒煮时光 2022-09-07 12:22:05 19 0

flask上实现dataframe前端显示

正在用 flask 写一个简单的 web app。想要实现的功能就是: 上传一个 excel 文件 用 pandas 清理一下数据 得到的 dataframe 在前端用表格预览 预览无…

飘然心甜 2022-09-07 12:16:01 18 0

如何利用Pandas,将一个文件的某列值根据另一个文件对应列名进行重新赋值?

现在有两个表(txt文件),需要将其中一个文件某列值修改成另一个文件对应的列值,具体如下:文件1 文件2 我需要将文件1的x,y列的值根据列名t和user…

坚持沉默 2022-09-07 11:46:53 15 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文