使用 Weka 过滤属性

发布于 2024-09-03 10:51:46 字数 166 浏览 0 评论 0原文

我有一个关于 WEKA 中过滤属性的简单问题。

假设我有 500 个属性,30 个类,每个类有 100 个样本,相当于 3000 行和 500 列。您可以猜到,这会导致时间和记忆问题。

如何过滤 3000 行中仅出现一次或两次(或 n 次)的属性。这是个好主意吗?

谢谢

I have a simple question about filtering attributes in WEKA.

Let's say I have 500 attributes 30 classes and 100 samples for each class which equals 3000 rows and 500 columns. This causes time and memory problems a you can guess.

How do I filter attributes that occur only once or twice (or n times) in 3000 rows. And is it a good idea?

Thank you

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

缪败 2024-09-10 10:51:46

使用以下过滤器

weka.filters.unsupervised.attribute.RemoveUseless

此过滤器会删除根本没有变化或变化太大的属性。所有常量属性以及任何超过方差参数最大百分比的属性都会自动删除。

Use the following filter

weka.filters.unsupervised.attribute.RemoveUseless

This filter removes attributes that do not vary at all or that vary too much. All constant attributes are deleted automatically, along with any that exceed the maximum percentage of variance parameter.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文