5.9 本章小结
内容小结:本章的会员数据化运营讲到的知识不多,但都围绕实际读者最可能用到的场景展开,可落地性和应用性较强,这也是后面几章的显著性特征。
重点知识:本章最重要的几个内容是会员数据化运营分析模型、会员数据化运营分析小技巧以及最后的两个实际案例,尤其是案例中提到了一些之前没有介绍过的知识,这些知识都是日常应用中的常见方法,希望读者能够熟练掌握。具体包括:
将数据保存为csv、Excel文件以及写回数据库;
使用自定义方法建立RFM模型;
使用“管道”方法Pipeline建立组合模型器;
使用集成方法Adaboost做分类训练和预测,并测试了不同分类器数量下的性能;
使用交叉检验方法cross_val_score以及自定义的多种评估指标(accuracy、f1、pre-cision、recall、'roc_auc)做模型效果分析。
外部参考:本节中涉及新的相关知识点中笔者认为有必要进一步学习和了解的部分。
有关sklearn.pipeline(管道)的更多用法,包括特征组合、模型组合等请参照http://scikit-learn.org/stable/modules/classes.html#module-sklearn.pipeline。
有关sklearn更多集成方法的介绍,请详见http://scikit-learn.org/stable/modules/ensemble.html。
协同过滤以及个性化推荐是一个大命题,如果要写这个恐怕需要一本书,有关这方面的内容请查看《推荐系统》(《Recommender systems:An introduction》)。
应用实践:本章中的模型和小技巧是笔者做会员分析时的“利器”,而且每个模型笔者也都介绍了实施方法,希望读者能在充分了解后结合自身情况加以应用和实践。尤其需要注意的是,同一个模型应用到不同的公司和场景下会有不同的效果,以案例2的营销响应预测为例,86%其实不算是一个“特别出彩”的结果,但是如果结合到更多的数据集以及更多的数据特征变量,那么会使得该模型的效果得到显著性的提升;同样的应用其他模型也会很多优化和提升点可以挖掘。这些需要读者在实践中才能深度体会,仅凭书中的只言片语难以洞察到。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论