python中运用sklearn的决策树模型求真实数据

发布于 2022-09-11 17:34:03 字数 748 浏览 34 评论 0

问题来源:现在书上和网上的都是把一堆已知预测结果的数据集分为测试集和训练集,然后看预测结果和真实值之间的准确率,报告什么的。。。。弱弱的问下,我有数据集,现在要对没有结果的数据做结果预测。问题来了:请问怎么操作,待预测的数据要和训练集、测试集一起进行特征工程,怎么进行呢。也就是说如何把不带预测结果的数据集和用来训练的放在一起做特征工程。然后求解预测结果。

'''2 数据分割'''
#分割数据集到训练集和测试集
x_train,x_test,y_train,y_test= train_test_split(x,y,test_size=0.01)


#进行处理(特征工程),使用特征转换器进行特征抽取
dict= DictVectorizer(sparse=False)
# 类别型的数据会抽离出来 数据型的会保持不变
x_train = dict.fit_transform(x_train.to_dict(orient='records'))
print(dict.get_feature_names())
x_test = dict.transform(x_test.to_dict(orient='records'))
print(x_train)

'''3训练模型进行预测'''
#用决策树进行预测,初始化决策树分类器
dec = DecisionTreeClassifier(max_depth=12,min_samples_leaf=1)
# 训练
dec.fit(x_train,y_train)


# 预测 保存结果
y_predict = dec.predict(x_test)### 问题描述



如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

离鸿 2022-09-18 17:34:03

什么叫对没有结果的数据做结果预测?你总要有训练数据去训练你的模型,而这个训练模型是X和Y都要有的

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文