当前位置：文江博客话题详情

对于基于多个连续变量的二进制分类模型，应使用哪种模型？

发布于 2025-02-01 02:48:23 字数 354 浏览 6 评论 0 原文

我正在研究废水数据。每5分钟收集数据一次。这是示例数据。

提供了单个参数的阈值。我的问题是，我应该选择哪种模型将其分类为可用或不可用的，并且由于它是无法使用的（如果可能的话），则输出异常（因为它是变量的组合）。是/否的列尚未提供给我。

我还有另一个问题是，由于每5分钟收集数据，我该如何保持运行？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

世界等同你 2025-02-08 02:48:23

您的数据和用例似乎适合决策树分类器。决策树很容易训练和解释（这是您的要求之一，因为您想知道为什么给定样品分类为可用或不可用），不需要大量的标记数据，可以培训并用于预测在大多数Haedware上，并且非常适合没有缺失值和低维度的结构化数据。它们也可以很好地工作，而无需使您的变量归一化。

Scikit Learn是超级成熟且易于使用的，因此您应该能够在没有太多麻烦的情况下完成工作。

关于时间，我不确定您或您的员工将如何取样，所以我不知道。如果您要以此速度获取和阅读样本，则使用模型来标记数据应该不是问题，但是我不确定我是否了解您的情况。

请注意，Stackoverflow的目的是针对“这是我的代码，我该如何修复？”的形式问题，而不是涉及这样的一般问题。还有其他专门致力于统计和数据科学的Stackexhange网站。如果您在这里找不到所需的东西，也许可以尝试其他网站！

回复收藏 0 原文

~没有更多了~

关于作者

撩起发的微风

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

对于基于多个连续变量的二进制分类模型，应使用哪种模型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

对于基于多个连续变量的二进制分类模型，应使用哪种模型？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。