使用 pandas 循环数据帧的最有效方法是什么?
我想以顺序方式对数据帧中的财务数据执行我自己的复杂操作。 例如,我使用以下来自 Yahoo Finance 的 MSFT CSV 文件: Date,Open,High,Low,Close,Volu…
从数据框中提取重复行
我正在处理一个大型数据框,前几行如下: Assay Genotype Sample Result 1 001 G 1 0 2 001 A 2 1 3 001 G 3 0 4 001 NA 1 NA 5 002 T 1 0 6 002 G 2 …
从多种不同格式创建标准化数据表条目
我有一个包含多个字段的数据框。这些字段之一是“样本”,由于输入多种多样,我的样本使用多种格式命名。以下是一些示例: "12" "250" "1248" "1_1001…
为什么跑步是“独特的”?数据帧比 R 中的矩阵更快?
我开始相信,除了符号方便之外,数据框与矩阵相比没有任何优势。然而,当我在矩阵和数据帧上运行unique时,我注意到了这个奇怪的现象:它似乎在数据帧…
尝试使用用户定义的函数来填充数据框中的新列。出了什么问题?
超短版本:我正在尝试使用用户定义的函数使用以下命令填充数据框中的新列: TestDF$ELN<-EmployeeLocationNumber(TestDF$Location) 但是,当我运行该…
如何根据另一个类别对因子水平进行排序?
假设我有一个包含两个因素的数据框,我想对按第二类分组的一个因素的水平进行排序。 name <- letters[1:8] category <- factor(sample(1:2, 8, replac…
如何在值更改时重新编号的编号列表
我下面有 2 个数字列表(col1 和 col2)。 我想添加 2 列(col3 和 col4)来执行以下操作。 每次 col2 发生变化(例如从 b2 到 b3)时,col3 都会从 1…
如何按一列降序和一升序对数据框进行排序?
我有一个数据框,看起来像这样: P1 P2 P3 T1 T2 T3 I1 I2 1 2 3 5 52 43 61 6 "b" 2 6 4 3 72 NA 59 1 "a" 3 1 5 6 55 48 60 6 "f" 4 2 4 4 65 64 58…
在 R 中合并 - 合并相似的内容...简单
我有两个像这样的数据框: A B 1 6 2 7 5 4 3 3 9 9 和另一个: A C 1 5 5 9 3 1 9 1 我想合并它们以创建 A B C 1 6 5 5 4 9 3 3 1 9 9 1 通知,在合…
将一个字符串分成不同行上的多个字符串
我有一个数据框,其中包含一个长字符串,每个字符串都与一个“样本”相关联: Sample Data 1 000000000000000000000000000N01000000000000N0N00000000…
为什么在 R 中创建子矩阵后 str() 显示的因子水平信息不正确?
我在 R 中有以下数据框,有 274569 行和 15 列: > str(x2) 'data.frame': 274569 obs. of 15 variables: $ ykod : int 99 99 99 99 99 99 99 99 99 9…
从 R 中的现有数据帧中提取数据(或重塑)数据帧
我正在处理一个大型数据框,前几行如下: Assay Genotype Sample Result 1 001 G 1 0 2 001 A 2 1 3 001 G 3 0 4 001 NA 4 NA 5 002 T 1 0 6 002 G 2 …