请问如何学习数据仓库和数据挖掘
已经上了两节课了,老师讲的很理论~至今觉得和数据库没啥不一样的!
对这方面有很感兴趣,请问应该怎么学习啊?
推荐两本书吧~
谢谢大家了~
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
已经上了两节课了,老师讲的很理论~至今觉得和数据库没啥不一样的!
对这方面有很感兴趣,请问应该怎么学习啊?
推荐两本书吧~
谢谢大家了~
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
本帖最后由 quinb 于 2010-11-29 19:53 编辑
首先,都是在数据库中存储的。数据库做为存储,比如都放在oracle里面建了不同的schema,邻居。。另外都是基数据库的信息系统。都是字段,表,数据。
差别有几方面,oltp,olap,应用方向根本不同;数据仓库一般都是承载企业多个业务系统的数据,要做企业级统一视图,这在任何一个单一的业务系统都是不具备的,如果具备不用做dw了;业务系统关注业务流程,处理速度,实效性,数据仓库关注整体性,历史变化,事件递延。
dw后面一般是做报表,分析,挖掘应用的。
业务对象也不一样,业务系统主要给业务人员做业务处理使用,DW/BI一般是给分析报告,决策,等方向使用。
数据存储:业务系统很多都数据量不大(通信,银行,保险的业务数据还是比较大的),DW大都是海量数据。
你们老师是做dw/bi项目出来的嘛?或者纯学院理论?纯讲数据库理论的话,就没差别了。数据库是容器...
一个关键在A(Analyze),一个关键在T(Transact)。
说通俗一点, 业务系统的普通数据库,是将一个业务流程(事件), 零散地以数据的形式存放在数据库表里, 以便某一个业务可以延续。
数据仓库是将上面的数据进行事件还原,并对事件各个属性按照规则进行定义,使得多维分析成为可能。 同时由于信息还原, 使得事件间、事件对象属性间能关联、序列等分析成为可能,为后来数据挖掘更为方便。