如何在Python上从文本数据中分离特定数字
我有一个来自 pandas 的数据框: id adress 0 Jame Homie Street. N:60 5555242424 La 1 London. 2322325234243 Stw St. N 8 St.bridge 2 32424244234…
如何根据另一列中的条件创建新列
在 pandas 中,如何基于 df 中的列 A 创建新列 B,例如: B=1 if A_(i+1)-A_(i) > 5 或 A_(i) <= 10 B=0 如果 A_(i+1)-A_(i) <= 5 但是,第一个 B_i …
如何获取 pandas 数据帧的百分比
我的 df 为 300000 行和 25 列。 这是 数据集 21行的链接 ,我使用 uuid.uuid4 为所有行添加了唯一索引()。 现在我只想要数据集的随机部分(比如 25%…
将 python 列表转换为 pandas 数据框,从列表中选择特定字符串
我有以下 python 列表: w=[[['I=427', 'PLAN=1'], 'A=0PDB'], [['I=427', 'PLAN=1'], 'B=40NGC'], [['I=427', 'PLAN=1'], 'C=21#NGA'], [['I=429', '…
Python 线程与 Pandas Dataframe 并不能提高性能
我有一个 200k 行的 Dataframe,我想分成几个部分并为每个分区调用我的函数 S_Function。 def S_Function(df): #mycode here return new_df 主程序 N_…
将 JSON 转换为数据帧
我正在使用Python,我有以下JSON,我需要将其转换为Dataframe: JSON: {"Results": {"forecast": [2.1632421537363355, 16.35421956127545], "predic…
按日期拆分 pandas 数据框
我想创建一个 pandas 数据表,获取下面的字典 a 并添加从初始日期算起的 days_split 天数并创建一个表。因此,对于下面的字典,由于第一个日期值为 2/…
如何返回数据帧/系列中小于特定数字的列元素?
我有一个包含 2 列的数据框,我试图获取小于 5 的值。我试图让 pandas 返回小于 5 的值,但我得到的只是布尔值。 a b 0 1 4 1 2 5 2 3 6 data = pd.re…
合并两个数据框并添加新列
拥有几个这样的数据帧(df,df2), df D R1 R2 R3 0 D1 1 1 1 1 D1 1 1 1 2 D2 1 2 1 3 D2 1 2 1 4 D3 1 0 1 df2 D R1 R2 R3 0 D1 1 1 1 1 D1 1 1 1 …
从 python 中的字典创建 Dataframe
我对Python非常菜鸟。我的字典: my_dict:{0:['12531','1253145','251231','151315','51555'], 1:['1551','12554','454545']} 我需要将其转换为 DataF…
检查每个车站的平均出行间隔 - Pyhton
我有以下数据帧结构: id_trip dtm_start_trip dtm_end_trip start_station end_station 1 2018-10-01 10:15:00 2018-10-01 10:17:00 100 200 2 2018-…
Pandas Dataframe 数据清理了吗?
我正在尝试清理一些我已刮入 Excel 页面的数据,但我得到了额外的信息,我想清理一下它有人可以告诉我如何确定我需要使用 pandas 删除哪个级别? 到目…
获取dataframe中对应的列数据
我在 df 中有两列,分别为 AsofDate 和 old7Date,分别表示日期和 1 周前的日期。我必须将 df['old7Date'] 与 df['AsofDate'] 进行比较,并且当 df['o…