文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
1.Adaptive-Lasso 变量选择模型
运用LARS算法来解决公式(2)的Adaptive-Lasso估计,对于每给一个γ,该算法会寻找一个最优的λn。此处取γ=1,用Python编制相应的程序后运行得到如下结果,见表13-5。
表13-5 系数表
代码清单13-3 Adaptive-Lasso变量选择
#-*- coding: utf-8 -*- import pandas as pd inputfile = '../data/data1.csv' #输入的数据文件 data = pd.read_csv(inputfile) #读取数据 #导入AdaptiveLasso算法,要在较新的Scikit-Learn才有。 from sklearn.linear_model import AdaptiveLasso model = AdaptiveLasso(gamma=1) model.fit(data.iloc[:,0:13],data['y']) model.coef_ #各个特征的系数
代码详见:demo/code/1-adaptive-lasso.py
由表13-5可以看出,年末总人口、地区生产总值、第一产业产值、税收、居民消费价格指数、第三产业与第二产业产值比以及居民消费水平等因素的系数为0,即在模型建立的过程中这几个变量被剔除了,这是因为居民消费水平与城镇居民人均消费性支出存在明显的共线性,在构建模型的过程中,Adaptive-Lasso方法剔除了这个变量;由于某市存在流动人口与外来打工人口多的特性,年末总人口并不显著影响某市财政收入;居民消费价格指数与财政收入的相关性太小以致可以忽略;由于农牧业各税在各项税收总额中所占比重过小,而且该市于2005年取消了农业税,因而第一产业对地方财政收入的贡献率极低;其他变量被剔除均有类似于上述的原因。这说明使用Adaptive-Lasso方法构建模型时,能够剔除存在共线性关系的变量,同时体现了Adaptive-Lasso方法对多指标进行建模的优势。
综上所述,利用Adaptive-Lasso方法识别影响财政收入的关键影响因素是社会从业人数、在岗职工工资总额、社会消费品零售总额、城镇居民人均可支配收入、城镇居民人均消费性支出以及全社会固定资产投资额。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论