网络上是否有任何有用的数据集可用于数据挖掘?

发布于 2024-09-04 00:48:22 字数 1536 浏览 1 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(4

太阳公公是暖光 2024-09-11 00:48:23

Kaggle 上,您可以找到一些竞赛并下载相关数据集。

有一个系统可以实时对您的解决方案进行评分,您将在“实时排行榜”上看到自己的位置。

这是学习机器学习技术的好方法,因为选择“知识”竞赛,您可以将您的解决方案与其他参与者进行比较,并讨论各种方法的优点和缺点。

On Kaggle you can find some competitions and download the associated datasets.

There is a system that scores your solutions in real time and you'll see your place on the "live leaderboard".

It's a good way of studying machine learning techniques because choosing a "for knowledge" competition you can compare your solution with other participants and discuss strengths and weaknesses of various approaches.

挽手叙旧 2024-09-11 00:48:23

试试我的博客 Vellum Information,其中有一些带注释的参考书目,整理了数据集和数据源:

http://velluminformation.com/2014/03/05/big-data-public-databases-an-annotated-bibliography/

我有一份带有注释的各种可用数据源的参考书目。我在这里还提供了带注释的健康数据参考书目:

http://velluminformation.com/2012/05/19/free-online-public-data-sources-an-annotated-bibliography/

明显的披露,这是我的博客,所以那里还有其他技术内容。

Try my blog, Vellum Information, where I've got several annotated bibliographies curating data sets and data sources:

http://velluminformation.com/2014/03/05/big-data-public-databases-an-annotated-bibliography/.

I've got an annotated bibliography of various data sources that are available. I've also got an annotated bibliography for health data here:

http://velluminformation.com/2012/05/19/free-online-public-data-sources-an-annotated-bibliography/.

Obvious disclosure, this is my blog, so there are other technical things on there as well.

当梦初醒 2024-09-11 00:48:22

UCI 机器学习档案 以及 KDD Cup 可能是最知名的通用数据挖掘档案。更具体的来源示例是 UCR 时间序列分类/聚类页面。

The UCI Machine Learning Archive and the past datasets of the KDD Cup are probably the best known such archives for general data mining. An example of a more specific kind of source is the UCR Time Series Classification/Clustering Page.

惜醉颜 2024-09-11 00:48:22

这是来自 DataWrangling.com 的一篇文章,其中列出了数百个数据集。

Here's an article from DataWrangling.com that lists hundreds of datasets.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文