record-linkage

record-linkage

文章 0 浏览 6

比较两个大熊猫系列,其中元素是逗号分隔字符串与矢量操作

我正在为RecordLinkage Python库创建一种自定义比较算法。我的功能将两个熊猫系列作为参数,其中该系列的每个元素都是一个或多个电话号码的列表。因此…

ゃ人海孤独症 2025-02-05 11:58:37 0 0

有没有办法加快Python中的记录链接来比较类似的记录

我正在使用Python中的RecordInlinkage库来检测几个遗产属性数据集中的重复项,这些遗产属性每周都会从几个网站上刮擦网络。在此过程中,我将以下数字…

最丧也最甜 2025-02-05 11:06:19 1 0

与Python模块recordLinkage索引时,是否有类似于大约相等数字值的阻止索引?

我有一个音乐曲目的SQLite数据库,我想删除重复。我想根据标题和持续时间比较曲目。 (我可能会尝试稍后将艺术家扔进去,但这是一个单独的桌子(每首…

最舍不得你 2025-01-30 18:56:57 3 0

解决 Pandas 数据框中的冲突

我正在数据帧上执行记录链接,例如: ID_1 ID_2 Predicted Link Probability 1 0 1 0.9 1 1 1 0.5 1 2 0 0 2 1 1 0.8 2 5 1 0.8 3 1 0 0 3 2 1 0.5 当…

吾家有女初长成 2025-01-16 19:17:34 3 0

使用 NetworkX 根据相似性绘制节点之间的边?

这是我的玩具节点数据框: import pandas as pd df = pd.DataFrame({ 'id': [1, 2, 3, 4, 5], 'a': [55, 2123, -19.3, 9, -8], 'b': ['aa', 'bb', 'ad…

飘然心甜 2025-01-09 07:09:01 4 0

“模糊搜索”的使用当交叉引用数据时

我的部门负责收集和显示来自各种公司内部来源的数据,以用于数据挖掘/公司仪表板。 我们面临的一大挑战是跨部门交叉引用位置名称。我们是一个相当大的…

北笙凉宸 2025-01-04 13:47:53 5 0

如何使用 R 的 RecordLinkage 包获取匹配对

谁能告诉我我在这里做错了什么。我正在尝试在玩具数据集上测试 R 包 RecordLinkage 的比较函数, > test<-cbind( + a = c(1, 1, 1), + b = c(2, 0, 2)…

软甜啾 2024-12-02 22:30:15 5 0

在小于指数时间内进行模糊匹配重复数据删除?

我有一个大型数据库(可能有数百万条记录),其中包含相对较短的文本字符串(按街道地址、名称等顺序)。 我正在寻找一种删除不精确重复项的策略,模…

灰色世界里的红玫瑰 2024-12-01 17:01:20 7 0

有推荐的重复数据删除软件吗?

我正在寻找一些与 MS SQL Server 兼容的重复数据删除软件。我有一个相当广泛且混乱的表格,其中包含来自世界各地的各种不同语言的地址。该表被设置为…

长安忆 2024-12-01 00:30:57 4 0

多列信息的模糊记录匹配

我的问题有点高层次,所以我会尽量具体。 我正在进行大量研究,涉及将不同的数据集与引用同一实体(通常是公司或金融证券)的标头信息相结合。此记录…

入怼 2024-10-20 16:21:00 15 0

Fellegi-Sunter 是否有开源实现?

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

橘虞初梦 2024-10-19 20:06:25 8 0

匹配“模糊”基于多个输入的数据

我有一个搜索和匹配问题: 输入 在我的数据库中,除了一些其他匹配特征之外,我还有数千个名称:几列数字数据,以及几列有助于识别该特定公司的其他文…

隔岸观火 2024-10-18 02:54:10 9 0

如何确定每个来源中的记录是否代表同一个人

我有多个包含个人数据的表源,如下所示: SOURCE 1 ID, FIRST_NAME, LAST_NAME, FIELD1, ... 1, jhon, gates ... SOURCE 2 ID, FIRST_NAME, LAST_NAME…

旧伤还要旧人安 2024-07-06 03:43:28 16 0
更多

推荐作者

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文