模糊匹配的甜菜与不同的lenght列表

发布于 2025-01-29 23:26:09 字数 379 浏览 2 评论 0原文

在合并两个数据集的同时,我意识到某些数据是不匹配的,因为字符串不完全相同(例如:usop = usopp),所以我使用的是fuzzywuzzy库,所以问题是,问题是,问题是,问题是,问题是,问题是,问题是,问题是,问题是,问题是要合并的数据集具有不同的尺寸

list1 = df1['Name'].tolist()
list2 = df1['name'].tolist()
mat1 = []
mat2 = []
for i in list1:
    mat1.append(process.extract(i, list2, limit=2))
df1['matches'] = mat1

误差:值长度(2416)与索引的长度不匹配(190) 长度问题无法解决,我该如何解决?

after doing web scraping for a project while merging two datasets I realized that some data were not matched because the strings are not exactly the same ( example: Usop = Usopp), so to overcome this problem I am using FuzzyWuzzy library, the problem is that the datasets to be merged have different sizes

list1 = df1['Name'].tolist()
list2 = df1['name'].tolist()
mat1 = []
mat2 = []
for i in list1:
    mat1.append(process.extract(i, list2, limit=2))
df1['matches'] = mat1

ERROR: Length of values (2416) does not match length of index (190)
the length problem cannot be solved, how could I solve it?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文