使用 For 循环填充选定数据帧列的 NaN 值

发布于 2025-01-10 00:47:52 字数 650 浏览 4 评论 0原文

我有一个患者生命体征（HR、O2Sat、Temp、SBP、DBP、Resp）的数据框，其值为 NaN。我使用以下代码根据患者 ID (P_ID) 列在个别患者中填写了 NaN：

m['HR'] = m['HR'].fillna(m.groupby('P_ID')['HR'].transform('mean'))
m['O2Sat'] = m['O2Sat'].fillna(m.groupby('P_ID')['O2Sat'].transform('mean'))
m['Temp'] = m['Temp'].fillna(m.groupby('P_ID')['Temp'].transform('mean'))
m['SBP'] = m['SBP'].fillna(m.groupby('P_ID')['SBP'].transform('mean'))
m['DBP'] = m['DBP'].fillna(m.groupby('P_ID')['DBP'].transform('mean'))
m['Resp'] = m['Resp'].fillna(m.groupby('P_ID')['Resp'].transform('mean'))

它工作得很好。然而，它的代码很多。无论如何，我是否使用 for 循环 仅在重要列中填充 NaN 值？因为还有一些没有 NaN 值的列。谢谢。

原文

I have a dataframe of patients Vital signs (HR, O2Sat, Temp, SBP, DBP, Resp) with NaN values. I filled NaN in individual patient based on Patient ID (P_ID) column using the code:

m['HR'] = m['HR'].fillna(m.groupby('P_ID')['HR'].transform('mean'))
m['O2Sat'] = m['O2Sat'].fillna(m.groupby('P_ID')['O2Sat'].transform('mean'))
m['Temp'] = m['Temp'].fillna(m.groupby('P_ID')['Temp'].transform('mean'))
m['SBP'] = m['SBP'].fillna(m.groupby('P_ID')['SBP'].transform('mean'))
m['DBP'] = m['DBP'].fillna(m.groupby('P_ID')['DBP'].transform('mean'))
m['Resp'] = m['Resp'].fillna(m.groupby('P_ID')['Resp'].transform('mean'))

It worked perfectly. However it is a lot of code. Is there anyway I use for loop to fill NaN values in only the vital columns? As there are some more columns without NaN values. Thanks.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

哥，最终变帅啦 2025-01-17 00:47:52

是的，你可以使用循环

for i in ['HR','O2Sat','Temp','SBP','DBP','Resp']:
    m[i] = m[i].fillna(m.groupby('P_ID')[i].transform('mean'))

Yes, you can use a loop

for i in ['HR','O2Sat','Temp','SBP','DBP','Resp']:
    m[i] = m[i].fillna(m.groupby('P_ID')[i].transform('mean'))

回复收藏 0 原文

你怎么敢 2025-01-17 00:47:52

为了避免不必要的行和冗长的脚本，您可以使用数据帧的 columns 属性。但请注意，由于您提到了 vital 列，因此可能有一些列您不希望执行以下代码：

for column in m.columns:
  m[column] = m.fillna(m.groupby('P_ID')[column].transform('mean'))

In the interest of avoiding unnecessary lines and lengthy scripts, you can use the columns attribute of the dataframe. But note that, since you mentioned vital columns, there could be a few columns that you don't want to do the following code.:

for column in m.columns:
  m[column] = m.fillna(m.groupby('P_ID')[column].transform('mean'))

回复收藏 0 原文

~没有更多了~

关于作者

南风起

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

使用 For 循环填充选定数据帧列的 NaN 值

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

转角预定愛

玩物

qq_dEbOhs

陆九渊

qq_ScZtKg

权谋诡计

友情链接

使用 For 循环填充选定数据帧列的 NaN 值

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

转角预定愛

玩物

qq_dEbOhs

陆九渊

qq_ScZtKg

权谋诡计

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。