请问爬虫爬过来的数据 为啥要先进行大数据处理才给后端展示呢?
因为我了解的大数据可能就是数据分析和处理,比如爬虫 抓了很多数据 必须经过爬虫这样的处理才展示出来呢?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
因为我了解的大数据可能就是数据分析和处理,比如爬虫 抓了很多数据 必须经过爬虫这样的处理才展示出来呢?
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(2)
爬虫拿到的数据都是文本型的信息,其中的逻辑关系数据结构在爬数据的时候比较弱(关注主要业务),不一定是结构化有业务含义的。通过必要的数据清理后,可删除一些无意义的脏数据,一些老数据,整理数据结构和梳理逻辑关系,这样后端同学拿到后就比较愉快,更好的处理业务逻辑
数据的清洗处理工作可能会占据数据分析过程的60%-70%工作量,可不止是分析~如果没有接触到数据清洗这块,可能是其他同事或者是已经有程序自动化处理过了。以上。