有哪些可定制的机器学习工具包可用?
我正在寻找一个机器学习工具包,它允许我指定自定义相似性度量以及选择我自己的数据表示形式。谁能向我指出任何此类工具包?最好是Python或Java。谢谢。
I'm looking for a machine learning toolkit that will allow me to specify custom similarity measures as well as choose my own representations for the data. Can anyone point me to any such toolkits? Preferably Python or Java. Thank you.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(4)
看看Weka;它是开源的、Java 的、主流的
take a look at Weka; it is open source, Java, and mainstream
请访问 http://mahout.apache.org 查看 Apache Mahout。
Check out Apache Mahout at http://mahout.apache.org.
ELKI 在自定义距离函数方面非常灵活。您可以将它们插入到几乎所有算法中(例如 DBSCAN 聚类、LOF 异常值检测;对于某些算法(例如常规 k-Means),这当然没有多大意义。但对于 DBSCAN 来说效果很好)。
请参阅他们的编写自定义距离函数的教程。
ELKI is very flexible when it comes to custom distance functions. You can plug them into almost every algorithm (e.g. DBSCAN clustering, LOF outlier detection; for some algorithms such as regular k-Means, it of course doesn't make much sense. But for DBSCAN that works very well).
See their Tutorial on writing custom distance functions.
lingpipe, 开放 NLP,GATE,图形表达式
lingpipe, OPEN NLP, GATE, graph expression