使用 Weka 过滤属性
我有一个关于 WEKA 中过滤属性的简单问题。
假设我有 500 个属性,30 个类,每个类有 100 个样本,相当于 3000 行和 500 列。您可以猜到,这会导致时间和记忆问题。
如何过滤 3000 行中仅出现一次或两次(或 n 次)的属性。这是个好主意吗?
谢谢
I have a simple question about filtering attributes in WEKA.
Let's say I have 500 attributes 30 classes and 100 samples for each class which equals 3000 rows and 500 columns. This causes time and memory problems a you can guess.
How do I filter attributes that occur only once or twice (or n times) in 3000 rows. And is it a good idea?
Thank you
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
使用以下过滤器
此过滤器会删除根本没有变化或变化太大的属性。所有常量属性以及任何超过方差参数最大百分比的属性都会自动删除。
Use the following filter
This filter removes attributes that do not vary at all or that vary too much. All constant attributes are deleted automatically, along with any that exceed the maximum percentage of variance parameter.