当前位置：文江博客话题详情

WEKA：属性尺度问题

发布于 2024-11-04 12:57:37 字数 205 浏览 5 评论 0原文

我有一个训练数据集和多个测试集（我正在集群框架中对实例进行分类，因此测试集的实例是动态计算的）。

实例属性具有不同的标度（第一个从 0 到 1，第二个从 0 到 100）。

我的分类器（逻辑回归和 SMO）如何处理它们无法立即获得整个测试集的事实？

换句话说，如果他们不知道测试集中的最大值是多少，他们如何处理不同的尺度属性？

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

兔姬 2024-11-11 12:57:37

根据Weka Javadocs，SMO“默认规范化所有属性” （请注意，输出中的系数基于标准化/标准化数据，而不是原始数据。）”即，如果您的训练集未覆盖每个属性的完整范围，您将得到错误的标准化。这有多糟糕取决于您的数据。

我建议您尝试使用标准化和不使用标准化进行训练（使用 setFeatureSpaceNormalization(false) 将其关闭），然后看看哪种效果最好。

回复收藏 0 原文

~没有更多了~

关于作者

反话

暂无简介

0 文章

0 评论

862 人气

关注发私信

離殇

文章 0 评论 0

关注

小姐丶请自重

文章 0 评论 0

关注

Aik

文章 0 评论 0

关注

国产ˉ祖宗

文章 0 评论 0

关注

猥琐帝

文章 0 评论 0

关注

半仙

文章 0 评论 0

友情链接

文江博客

WEKA：属性尺度问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

WEKA：属性尺度问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。