用于大型集合的贝叶斯网络分类器
这是另一个难题。我正在寻找 Weka 的贝叶斯网络分类器的等效项。请注意,它与朴素贝叶斯不同。 Weka 的问题是它使用太多内存,因此无法处理大型数据集。
需要处理几百万个示例集,在 Windows 上工作。
So here's another difficult question. I'm looking for the equivalent of Weka's Bayes Net classifier. Notice that it is different from Naive Bayes. Problem with Weka is that it uses too much memory and so cannot handle large data sets.
Needs to handle a few million examples set, work on Windows.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
为了(部分)回答我自己的问题,Knime 有一个使用 Weka 组件的扩展。它似乎可以更好地处理内存一个数量级。
尽管如此,我仍在寻找另一个应用程序、命令行实用程序或者 Python 库。
To (partially) answer my own question, Knime has an extansion for using Weka components. It seems to handle memory better by an order of magnitude.
Still, I'm looking for another app, command line utility or maybe a Python library.
您必须编辑安装 weka 的
RunWeka.ini
。打开 RunWeka.ini 并将
maxheap=128m
更改为maxheap=1024m
,然后save.finish
。You must edit
RunWeka.ini
where weka is installed.Open
RunWeka.ini
and changemaxheap=128m
tomaxheap=1024m
, thensave.finish
.如果您使用 Windows,还有另一种选择。 Microsoft 有一个名为 Infer.NET 的贝叶斯网络工具包。但它不是开源的。
If you work on Windows, there is another option. Microsoft has this bayesian networks toolkit called Infer.NET. But it is not open-sourced.