pandas drop_duplicates 有效，但使用 .to_csv 保存时它仍然显示所有

发布于 2025-01-18 08:00:31 字数 1318 浏览 2 评论 0原文

我只是想从 csv 中删除重复项，然后创建一个仅包含第一列且没有重复项的新 csv 文件。

我的终端显示其工作状态，但新的 csv 文件仍然显示所有内容。 ???

import pandas as pd
import numpy as np

#df = pd.read_csv('directory.csv',index_col=0,usecols=["From"]),
d = pd.read_csv('directory.csv')
df = pd.DataFrame(d, columns=['From'])


print(
    """
    
    
-----this is all phone numbers in header FROM-----


    """
)

print(df)
print(
    """


-----this is only unique values ----


    """
)

df = df.drop_duplicates(subset="From", keep="first", inplace=True)
print(df)

print(
    """


-----now saving to new csv----


    """
)

df.to_csv("uniquePhones.csv")

终端 python3 csvImport.py

-----这是标头中的所有电话号码 FROM-----

                              From
0       +34141414)
1      1231231231
2       1231213
3                  (+123123123
4       123212313..                             ...
692    1231237)
693  A123213616)
694    12321433)
695    1312)
696  1321321)

[697 rows x 1 columns]

-----这只是唯一值 ----

                              From
0       +34141414)
1      1231231231
2       1231213
3                  (+123123123
4       123212313.. 
692    1231237)
693  A123213616)
694    12321433)
695    1312)
696  1321321)

[279 rows x 1 columns]

-----现在保存到新的 csv----

原文

I'm simply trying to remove duplicates from a csv and then make a new csv file with only the first column and no duplicates.

My terminal shows its working but when then the new csv file still shows all. ???

import pandas as pd
import numpy as np

#df = pd.read_csv('directory.csv',index_col=0,usecols=["From"]),
d = pd.read_csv('directory.csv')
df = pd.DataFrame(d, columns=['From'])


print(
    """
    
    
-----this is all phone numbers in header FROM-----


    """
)

print(df)
print(
    """


-----this is only unique values ----


    """
)

df = df.drop_duplicates(subset="From", keep="first", inplace=True)
print(df)

print(
    """


-----now saving to new csv----


    """
)

df.to_csv("uniquePhones.csv")

Terminal
python3 csvImport.py

-----this is all phone numbers in header FROM-----

                              From
0       +34141414)
1      1231231231
2       1231213
3                  (+123123123
4       123212313..                             ...
692    1231237)
693  A123213616)
694    12321433)
695    1312)
696  1321321)

[697 rows x 1 columns]

-----this is only unique values ----

                              From
0       +34141414)
1      1231231231
2       1231213
3                  (+123123123
4       123212313.. 
692    1231237)
693  A123213616)
694    12321433)
695    1312)
696  1321321)

[279 rows x 1 columns]

-----now saving to new csv----

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你曾走过我的故事 2025-01-25 08:00:31

遇到了同样的错误，通过执行以下操作修复了它：

df = df.drop_duplicates().reset_index()
df.to_csv() # Now works

Had the same error, fixed it by doing:

df = df.drop_duplicates().reset_index()
df.to_csv() # Now works

回复收藏 0 原文

~没有更多了~

关于作者

似梦非梦

暂无简介

文章

26 人气

关注发私信

牛↙奶布丁

文章 0 评论 0

关注

COSO

文章 0 评论 0

关注

落叶

文章 0 评论 0

关注

暗地喜欢

文章 0 评论 0

关注

qq_i8qOEG

文章 0 评论 0

关注

qq_Wl4Sbi

文章 0 评论 0

友情链接

文江博客

pandas drop_duplicates 有效，但使用 .to_csv 保存时它仍然显示所有

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

牛↙奶布丁

COSO

落叶

暗地喜欢

qq_i8qOEG

qq_Wl4Sbi

友情链接

pandas drop_duplicates 有效，但使用 .to_csv 保存时它仍然显示所有

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

牛↙奶布丁

COSO

落叶

暗地喜欢

qq_i8qOEG

qq_Wl4Sbi

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。