是否有免费、低成本或开源工具用于匹配姓名/地址数据?

发布于 2024-08-31 20:18:26 字数 1536 浏览 5 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

想你只要分分秒秒 2024-09-07 20:18:26

我建议将 Google Refine 作为开源项目(新的 BSD 许可证)用于解析和修复粗糙数据的工具。它还允许重复数据的集群和协调,以及数据挖掘功能。

我已经使用它成功导入和修复了各种格式(.csv、.tsv、.xls、.xml、.json、.rdf 等)的大量数据。它可以在内部使用,而无需向外部发送任何数据,这似乎是问题“用于匹配姓名/地址数据的工具”

注意。 Google Refine 以前称为 Freebase Gridworks。

I'd recommend Google Refine as an open source (New BSD license) tool for parsing and fixing crufty data. It also allows clustering and reconciling of duplicate data, as well as having data-mining features.

I've used it to import and fix a lot of data in various formats, .csv, .tsv, .xls, .xml, .json, .rdf etc. with success. It can be used in-house without sending any data externally, which seemed to be a concern of the question "tools for matching name/address data"

NB. Google Refine was previously called Freebase Gridworks.

堇色安年 2024-09-07 20:18:26

我偶然发现了以下文章:“合并/清除和重复检测”。

通过查看http://www.semaphorecorp.com,我发现了一些极低的价格。

这不是我想要的,但至少是一点帮助,并且是朝着正确方向迈出的一步。

I stumble upon the following article: "Merge/Purge and Duplicate Detection".

By looking at http://www.semaphorecorp.com I found some extremely low prices.

This is not what I'm looking for, but at least is a bit of help, and a step on the right direction.

得不到的就毁灭 2024-09-07 20:18:26

在 sourceforge 上尝试 OSDQ 开源数据质量和分析项目

Try OSDQ open source data quality and profiling project on sourceforge

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文