当前位置：文江博客话题详情

用几个大型CSV文件培训模型

发布于 2025-02-09 20:16:02 字数 1395 浏览 1 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

深海不蓝 2025-02-16 20:16:03

我以前曾经处于这种情况，我的建议将退后一步，再次查看问题。

您的模型是否绝对需要所有数据？还是可以分批完成？您使用的模型也可以分批完成，但是您使用的库不支持这种情况。在这种情况下，要么尝试找到一个确实支持批处理的库，要么尝试不存在这样的库（不太可能），“重新发明了轮子”自己，即，您自己从头开始创建模型并允许批处理。但是，正如您提到的那样，您需要使用Scikit-Learn，Tensorflow或Pytorch的模型。因此，如果您确实想坚持提到的库，那么在您的问题上，与Pytorch和Tensorflow有关的问题中提到了Alexey Larionov和Iahdi等技术。

您的所有数据实际上都相关吗？一旦我发现我的数据子集对我试图解决的问题毫无用处；另一个时候，我发现这只是有很小的帮助。降低维度，减少数字和统计建模可能是您的朋友。这是Wikipedia页面有关数据减少的链接：

https://en.wikipedia.orgg/wiki/ data_reduction

数据减少不仅会减少所需的内存量，还会改善您的模型。不良数据意味着不良数据。

回复收藏 0 原文

~没有更多了~

关于作者

梦幻之岛

暂无简介

文章

30 人气

关注发私信

友情链接

文江博客

用几个大型CSV文件培训模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

用几个大型CSV文件培训模型

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。