计算数据集 pandas 的列中的所有单词
我正在对数据集进行 EDA,并且想要计算删除重复项之前和之后列中的单词总数。
这是我的代码:
print(train_dataset['text'].apply(lambda x: len(x.split(' '))).sum())
它抛出此错误:
AttributeError: 'float' object has no attribute 'split'
I am carrying out EDA on a dataset and want to count the total number of words in a column, before and after deleting duplicates.
Here is my code:
print(train_dataset['text'].apply(lambda x: len(x.split(' '))).sum())
It is throwing this error:
AttributeError: 'float' object has no attribute 'split'
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以尝试在拆分之前将列值转换为字符串类型:
You could try to convert column values to string type before split: