保存没有数据集的 scikit-learn 模型

发布于 2025-01-16 16:54:47 字数 298 浏览 3 评论 0原文

我已经使用 sklearn 库训练了 RandomForestClassifier 模型，并将其保存在 joblib 中。现在，我有一个近 1GB 的 joblib 文件，正在将其部署在 Nginx/Flask/Guincorn 堆栈上。问题是我必须找到一种有效的方法来从文件加载此模型并服务 API 请求。执行以下操作时是否可以在没有数据集的情况下保存模型：

joblib.dump(model, '/kaggle/working/mymodel.joblib')
print("random classifier saved")

原文

I've trained a RandomForestClassifier model with the sklearn library and saved it with joblib. Now, I have a joblib file of nearly 1GB which I'm deploying on a Nginx/Flask/Guincorn stack. The issue is I have to find an efficient way to load this model from file and serve API requests. Is it possible to save the model without the datasets when doing:

joblib.dump(model, '/kaggle/working/mymodel.joblib')
print("random classifier saved")

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

滥情空心 2025-01-23 16:54:47

Scikit-Learn 估计器的持久表示不包含任何训练数据。

谈到决策树及其集合（例如随机森林），估计器对象的大小与决策树的深度（即 max_depth 参数）呈二次方缩放。之所以如此，是因为决策树配置是使用 (max_depth, max_depth) 矩阵（float64 数据类型）表示的。

您可以通过限制 max_depth 参数来缩小随机森林对象。如果您担心预测性能可能会下降，则可以增加子估计器的数量。

从长远来看，您可能希望探索 Scikit-Learn 模型的替代表示形式。例如，使用 SkLearn2PMML 包将它们转换为 PMML 数据格式。

回复收藏 0 原文

~没有更多了~

关于作者

无敌元气妹

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

保存没有数据集的 scikit-learn 模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

保存没有数据集的 scikit-learn 模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。