将数据集拆分为任意部分
我有这个数据集: var_1 = rnorm(1000,1000,1000) var_2 = rnorm(1000,1000,1000) var_3 = rnorm(1000,1000,1000) sample_data = data.frame(var_1, v…
Python 中的高级字符串操作
我试图从以下字符串中仅获取字符串 2021 之后的值: Revenue Earnings Year 2018 110360000000 16571000000 2019 125843000000 39240000000 2020 1430…
编辑:不重叠的一列和公共变量的组合
数据已更新! 我有一个示例数据集 目标 开始 序列 A y1 ccc A y2 cct A y3 aag A y3 act B y1 aaa B y4 aat 并尝试获取类似 R 中的数据集: 目标 开始…
如何访问和处理嵌套对象、数组或 JSON?
我有一个包含对象和数组的嵌套数据结构。如何提取信息,即访问特定或多个值(或键)? 例如: var data = { code: 42, items: [{ id: 1, name: 'foo' …
仅当 R (dplyr) 中满足特定条件时,才将一列中的某些数据替换为另一列数据
我有一个包含 30 多列和 10000 多行的广泛数据框。今天我想重点关注两列:languages 和 languages2: languages languages2 Spanish NA Spanish NA Ot…
如何访问和处理嵌套对象、数组或 JSON?
我有一个包含对象和数组的嵌套数据结构。如何提取信息,即访问特定或多个值(或键)? 例如: var data = { code: 42, items: [{ id: 1, name: 'foo' …
为每“n 行”重复一组 ID。
我在 R 中有这个数据集: first_variable = rexp(100,100) second_variable = rexp(100,100) n_obs = 1:100 question_data = data.frame(n_obs, first…
当关键变量在给定组中具有不同长度时,如何在 R 中重塑数据时插入 0 或 NA
下面是我的数据结构(df)。目标是使用 R 通过变量“状态”(df.long) 将数据从长分隔转换为宽分隔。我知道状态“a”和“b”不会在所有月份中重复。 年…
在 R 中,有没有办法识别数据框中两列中的相似字符串值?
我有一个包含 70,000 个观察值的大型数据框,其中 A 列和 B 列有一对在同一班次一起工作的护士和医生。不幸的是,这里和那里有一些观察(我不能完全估…
组合具有共享值的任何向量
我有一个很大的向量 polyInt 列表,并且希望根据共享值将它们组合起来,删除任何重复的值。例如: polyInt = list(c(1,2,3,4), c(4,5,6), c(7,8,9), c…
对于二级邻居,按行重复到缺失
我可能只是没有找到正确的搜索词,但如果此条目出现在同一行之前,我想删除条目(设置为 NA)。 从 df 开始,我想到达 df2。 df <- data.frame(t(data…