在数据集中添加一列,其中包含特定电影或电视节目的演员总数
我刚刚开始研究熊猫。目前我正在研究 NETFLIX 的数据集。
在此数据集中,我想添加一个新列,其中包含该特定电影或电视节目中的演员总数。我可以单独计算演员阵容,但我想计算所有演员。有人可以帮我写这段代码吗?
这是我正在尝试做的事情:
def set_cast(val):
for i in df['cast']:
if val== "None":
return 0
else:
return len(df.loc[i,'cast'].split(', '))
df['num_of_cast'] = df['cast'].apply(set_cast)
这就是我正在尝试的方法在新列中添加转换数量,但它不起作用...数据集包含 8807 行,因此单独添加每一行对我来说是不可能的。
为此需要一个解决方案。谢谢
I have just started my work on pandas. Currently I'm working on a dataset of NETFLIX.
In this dataset I want to add a new column which contains the total number of cast members in that particular movie or tv show. I can calculate the cast individually but I want to calculate all of them. Can someone help me to write this code ?
Here is what I'm trying to do:
def set_cast(val):
for i in df['cast']:
if val== "None":
return 0
else:
return len(df.loc[i,'cast'].split(', '))
df['num_of_cast'] = df['cast'].apply(set_cast)
That's how I'm trying to add number of cast in a new column but it's not working...The dataset contains 8807 rows so adding each of it individually is not possible for me.
Need a solution for this. Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您就快完成了
当您将函数
应用
到pd.Series
时,,它会应用于该系列的每个单独元素,所以请尝试以下操作:
You are almost there
When you
apply
a function to apd.Series
, it is applied to each individual element of the seriesSo try this: