pandas

pandas

文章 236 浏览 195

python pandas 分组统计多出一列

想要统计每个价格支付的人数,同一个价格下同一个用户即使支付了多次也算作1人次,如下,100的价格 有用户1000和2000,这样算作两个人 user_price = […

网名女生简单气质 2022-09-12 12:54:13 26 0

pandas 分组合并元素后如何再重新组合。

原数据是这样的res = [ {"user_id": 1000, "log": ["0.3", "0.7", "1"]}, {"user_id": 2000, "log": ["0.3", "0.7", "1"]}, {"user_id": 1000, "log":…

勿挽旧人 2022-09-12 04:49:56 24 0

python pandas 这样的数据怎么处理?

这样的数据如何用python处理?处理完返回的格式还和现在一样,只不过做了统计,去重等操作。从数据库里查出来的是这样的res = [{'user_id': 1000, 'pa…

江南烟雨〆相思醉 2022-09-12 04:48:03 14 0

python直方图(频数密度)-深入浅出统计学

最近再看《深入浅出统计学》,想把里面的例子都用python画出来,才看几页就遇到问题了 - -例子如下图:画出上面的直方图,错误的表示如下图:这个画出…

活雷疯 2022-09-12 04:42:42 35 0

rolling mean的性能对比,DolphinDB比Orca慢?

有个细节想请教下,我想测rolling mean的速度对比。在orca上,直接 df['x'].rolling(120).mean(), 运行时间是0.2ms,相关代码如下:df = orca.read_tab…

能怎样 2022-09-12 04:16:11 23 0

python groupby 分组后如何用每一组的值减去每一组的最小值?

id case eid 1 0 0 3 0 1 4 0 2 7 0 3 9 0 4 11 0 5 2 1 0 5 1 1 6 1 2 8 1 3 10 1 4 12 1 5数据如上。df = pd.read_csv("/content/test.csv") plt.fi…

倾`听者〃 2022-09-12 04:13:50 37 0

查询分布式表时生成的中间表,有办法通过orca接口访问么

我在dolphindb database的GUI下执行命令,这个生成的中间表 df,有办法通过orca接口访问么?…

一口甜 2022-09-12 04:11:19 21 0

python openpyxl 设置公式失败

在python openpyxl 需要匹配两个条件需要设置公式时import openpyxl wb = openpyxl.load_workbook(r'C:\Users\Administrator\Desktop\test.xlsx') she…

女中豪杰 2022-09-12 04:08:46 26 0

pandas根据值判断写入同一行不同列

有一excel文件,有上千条数据,需要根据“地点”这一列,如果为北京,在“类型”这列写入‘A’,为上海,在“类型”这列写入‘B’,为广州,在“类型…

梦冥 2022-09-12 03:44:57 27 0

请教 pandas的dataframe中,如何取某一列<每个>数据最后2位?

我想取name列的后2位,type列的后2位,price列的小数点前2位 df = pd.DataFrame({('PG苹果', 'FT11', 17.8), ('XJ香蕉', 'FT12', 32.06), ('SY山药',…

神经大条 2022-09-12 03:38:34 21 0

dataframe放在字典循环里面无效

为啥我下面的字典循环语句跑出来的TA 列都是None, 但是拆开来跑就可以得到想要的结果呢? 这段得到是TA column是None: study_list_by_ta = {"CV_ME…

七分※倦醒 2022-09-12 03:38:15 21 0

pandas dataframe如何转换成列表,要有完整的表头和index

尝试用df.values.tolist() ,发现只是部分数据, df2=[df.columns.tolist()]+df.values.tolist() 发现有时可以满足要求,有时又没有每行的第一列的关…

硬不硬你别怂 2022-09-12 03:37:26 17 0

用Catboost架构写的Pandas程序,能快速移植到DolphinDB吗

我有一个程序,每天交易量新台幣一億七千萬,它是用Catboost做模型,由於是在Pandas上使用,所以大概從開盤後,約一分多鐘才會跑完當天標的後開始下單…

猛虎独行 2022-09-12 03:24:29 29 0

python中使用Scipy.optimize.minimize()优化求解时,同样的数据得到了不同的结果

import numpy as np import pandas as pd from scipy.optimize import minimize def get_y_hat(x_, y_, args): return (x_ * 100) / (1 + args[0]) +…

相权↑美人 2022-09-12 03:12:40 25 0

pandas 如何新增列?

脚本: import pandas df = pandas.DataFrame([dict( id=1001, province='河南', city='郑州', amount=100, ), dict( id=1002, province='河南', cit…

小耗子 2022-09-12 03:08:17 21 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文