返回介绍

第 8 章 数据清洗:标准化和脚本化

发布于 2024-01-27 21:43:11 字数 266 浏览 0 评论 0 收藏 0

你已经学习了数据的匹配和解析方法,以及如何寻找重复值,你已经开始探索数据清洗的奇妙世界。随着进一步理解你的数据集和你想要回答的问题,你需要考虑数据标准化和清洗自动化的问题。

本章我们将探索数据标准化的方法和时机,以及何时将数据清洗脚本化并对脚本进行测试。如果你管理的数据集是定期更新或新增数据的话,你需要使清洗过程尽可能高效清楚,这样你就可以将更多时间花在数据分析和撰写报告上。我们首先讲数据集的标准化(standardizing)和归一化(normalizing),以及如果数据集没有归一化应该怎么做。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文