如何处理丢失的数据？信息将用于数据可视化

发布于 2025-01-25 13:21:12 字数 771 浏览 2 评论 0原文

每个人如何处理数据框中的丢失值？我通过使用普查Web API获取数据创建了一个数据框。 “ GTCBSA”变量提供了我将其用于（Plotly and Dash）所需的城市信息，我发现数据中有很多丢失值。我是否只是空白并继续进行数据可视化？以下是我的

2004 = https://api.census.gov/data/2004/cps/basic/jun?get=gtcbsa，pefntvty＆amp； amp; amp; amp; amp； app； *

varible description = https://api.census.gov/data/data/2022222/2022/cps/cps/cps/bbasic/jan/variable /gtcbsa.json

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

倾城泪 2025-02-01 13:21:12

有不同的方法。取决于用例和丢失的数据类型。例如，对于具有一些缺失值的几乎连续的时间表信号数据，您可以通过执行某种类型的插值（例如线性插值）来尝试根据附近值填充缺失值。

但是，在您的情况下，缺失的值是城市，行都是独立的（每行都是不同的受访者）。据我所知，您没有任何方法可以合理地推断城市缺少的行，因此您必须从考虑这些行中丢下这些行。

我不是美国人口普查使用的数据收集方法的专家，而是此源，似乎有多种方法，因此我可以看到受访者的城市有可能未知（在线工具可能无法获得被告的城市，或者也许被告拒绝陈述其城市）。缺少数据是一个非常普遍的问题。

但是，在用缺失的城市放下所有行之前，您可能会进行简短的检查以查看是否存在模式（例如，丢失城市的行主要来自一个州？）。如果您正在进行任何州级分析，则可以将行留在缺失的城市中。

回复收藏 0 原文

~没有更多了~

关于作者

一影成城

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何处理丢失的数据？信息将用于数据可视化

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如何处理丢失的数据？信息将用于数据可视化

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

櫻之舞

弥枳

m2429

寻找一个思念的角度

野却迷人

我怀念的。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。