请问爬虫爬过来的数据 为啥要先进行大数据处理才给后端展示呢?

发布于 2022-09-12 02:26:11 字数 58 浏览 14 评论 0

因为我了解的大数据可能就是数据分析和处理,比如爬虫 抓了很多数据 必须经过爬虫这样的处理才展示出来呢?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

め可乐爱微笑 2022-09-19 02:26:11

爬虫拿到的数据都是文本型的信息,其中的逻辑关系数据结构在爬数据的时候比较弱(关注主要业务),不一定是结构化有业务含义的。通过必要的数据清理后,可删除一些无意义的脏数据,一些老数据,整理数据结构和梳理逻辑关系,这样后端同学拿到后就比较愉快,更好的处理业务逻辑

牵你的手,一向走下去 2022-09-19 02:26:11

数据的清洗处理工作可能会占据数据分析过程的60%-70%工作量,可不止是分析~如果没有接触到数据清洗这块,可能是其他同事或者是已经有程序自动化处理过了。以上。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文