如何获得weka工具合适的输入文件格式?
我正在使用 weka 工具尝试从数据集中生成一组分类规则。数据集当前是以下形式的 .txt 文件:(
webpage attr1 attr2 attr3.....attrn type try.html 1 2 3.....
每个单词由制表符分隔)
如何将其转换为适合 weka 的输入文件? 我尝试将其转换为 csv,然后转换为 arff 格式,但它不起作用,并且一直给我两个错误之一 标头流无效
或 属性名称不唯一
。
I am using weka tool to try to generate a set of classification rules from a dataset. The dataset is currently a .txt file of the form:
webpage attr1 attr2 attr3.....attrn type try.html 1 2 3.....
(with each word seperated by a tab)
How do I convert this to a suitable input file for weka?
I tried converting it to csv and then to arff format, but it doesn't work and keeps giving me one of 2 errors header stream is invalid
or attribute names are not unique
.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
ARFF 文件具有以下格式:
它基本上可以是带有标题的 CSV 文件。您是否尝试手动写入 ARFF 文件的标头并附加 CSV 文件信息?也许自动化工具未能检测到生成的 ARFF 中属性的正确命名
An ARFF file have the following format:
It can be basically a CSV file with a header. Did you try to manually write the header of the ARFF file and append the CSV file information? Maybe the automate tool failed in detecting proper naming for the attributes in the resulting ARFF