轮到你了
本章只是机器学习的冰山一角。(根据“传统”的科学,典型的冰山有三分之二被隐藏在水下。)即便如此,你还是拥有足够强大的工具和知识来完成监督和无监督的数据处理。你可以设置描述性(回归和分类)和预测性的数据科学实验,并在一定程度上评估其有效性,得出不凡的结论。
祝贺你!现在你几乎已经是一名数据科学家了。(但你仍然需要完成剩余的项目。)
MOSN分类*
编写一个程序,通过注册用户数量和全球Alexa页面排名3,对大量的在线社交网站进行分类。由于站点的排名及其大小差异很大,所以应使用对数尺度来进行聚类和结果呈现。
分片线性的标准普尔500**
编写一个程序,从Yahoo! Finance4获得21世纪标准普尔500的收盘价的历史记录,并将每年价值的观测值表示为OLS回归模型。如果模型得分不够(0.95或以下),就将时间间隔分成两半,并采用递归的处理方式,直到OLS模型得分超过0.95或时间间隔短于一周,然后将标准普尔500价格的原始值和OLS模型的预测值绘制在一幅图中。
地铁预测***
编写一个程序,预测一个城市是否拥有地铁系统。程序可能需要用到人口总量、人口密度、预算大小、天气状况、所得税水平和其他变量。其中有些可能很容易在网上查到,而有些则不是。使用逻辑回归和随机决策森林,并选出性能最佳的方法。
3en.wikipedia.org/wiki/List_of_social_networking_websites
4finance.yahoo.com/q/hp?s=^GSPC+Historical+Prices
如果你找到了一本书里特别吸引你的段落,那就通过大声朗读开始学习吧。
——北美作家Grenville Kleiser
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论