record-linkage

record-linkage

文章 0 浏览 4

如何使用 R 的 RecordLinkage 包获取匹配对

谁能告诉我我在这里做错了什么。我正在尝试在玩具数据集上测试 R 包 RecordLinkage 的比较函数, > test<-cbind( + a = c(1, 1, 1), + b = c(2, 0, 2)…

软甜啾 2024-12-02 22:30:15 0 0

在小于指数时间内进行模糊匹配重复数据删除?

我有一个大型数据库(可能有数百万条记录),其中包含相对较短的文本字符串(按街道地址、名称等顺序)。 我正在寻找一种删除不精确重复项的策略,模…

灰色世界里的红玫瑰 2024-12-01 17:01:20 2 0

有推荐的重复数据删除软件吗?

我正在寻找一些与 MS SQL Server 兼容的重复数据删除软件。我有一个相当广泛且混乱的表格,其中包含来自世界各地的各种不同语言的地址。该表被设置为…

长安忆 2024-12-01 00:30:57 0 0

多列信息的模糊记录匹配

我的问题有点高层次,所以我会尽量具体。 我正在进行大量研究,涉及将不同的数据集与引用同一实体(通常是公司或金融证券)的标头信息相结合。此记录…

入怼 2024-10-20 16:21:00 7 0

Fellegi-Sunter 是否有开源实现?

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

橘虞初梦 2024-10-19 20:06:25 5 0

匹配“模糊”基于多个输入的数据

我有一个搜索和匹配问题: 输入 在我的数据库中,除了一些其他匹配特征之外,我还有数千个名称:几列数字数据,以及几列有助于识别该特定公司的其他文…

隔岸观火 2024-10-18 02:54:10 7 0

如何确定每个来源中的记录是否代表同一个人

我有多个包含个人数据的表源,如下所示: SOURCE 1 ID, FIRST_NAME, LAST_NAME, FIELD1, ... 1, jhon, gates ... SOURCE 2 ID, FIRST_NAME, LAST_NAME…

旧伤还要旧人安 2024-07-06 03:43:28 11 0
更多

推荐作者

尘世孤行

文章 0 评论 0

烟─花易冷

文章 0 评论 0

倒带

文章 0 评论 0

忱杏

文章 0 评论 0

送君千里

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文