当前位置：文江博客话题详情

data-modeling machine-learning regression classification

设计天气数据的分类问题

发布于 2024-10-18 00:52:27 字数 225 浏览 1 评论 0原文

在普通的二类或多类分类问题中，我们可以使用任何著名的机器学习算法（例如朴素贝叶斯或支持向量机）来训练和测试模型。我的问题是，我收到了天气数据，其中标签变量的格式为“20% 雨，80% 干燥”或“30% 多云，70% 雨”等。我应该如何解决这个问题？我需要以某种方式将问题转化为回归吗？在这种情况下，如果数据中有三个标签（雨、干燥、多云），将百分比信息转换为连续值的正确方法是什么？ 感谢您抽出时间

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

骷髅 2024-10-25 00:52:27

假设表达式“20% 雨，80% 干燥”和“30% 多云，70% 雨”表示概率，则这些类别是互斥的，并且我们可以忽略可能的序数关系（例如“干燥 > 多云 >其中，诸如多分类逻辑回归之类的模型可能适合这些值，就好像它们被分组或复制一样。

我想也可以采用其他临时程序，这可以最大限度地减少库尔贝克-莱布勒分歧等问题。

回复收藏 0 原文

若言繁花未落 2024-10-25 00:52:27

我会推荐一个具有三个输出标签雨、干、云的神经网络。

如果您的数据带有标签“20% rain”，则实例的权重将为 0.2。如果没有“雨”标签，则应包含“假”。其他方法是使用相同转换约定的 3 个不同的回归分类器。我认为回归会效果更好。

神经网络将是不错的选择，因为它可以同时进行所有三个回归/分类，并且它们可以相互影响。此外，训练算法很简单。

回复收藏 0 原文

~没有更多了~

关于作者

煮茶煮酒煮时光

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文