如何获得weka工具合适的输入文件格式?

发布于 2024-10-30 23:57:18 字数 279 浏览 0 评论 0原文

我正在使用 weka 工具尝试从数据集中生成一组分类规则。数据集当前是以下形式的 .txt 文件:(

webpage attr1 attr2 attr3.....attrn type
try.html  1     2    3.....

每个单词由制表符分隔)

如何将其转换为适合 weka 的输入文件? 我尝试将其转换为 csv,然后转换为 arff 格式,但它不起作用,并且一直给我两个错误之一 标头流无效属性名称不唯一

I am using weka tool to try to generate a set of classification rules from a dataset. The dataset is currently a .txt file of the form:

webpage attr1 attr2 attr3.....attrn type
try.html  1     2    3.....

(with each word seperated by a tab)

How do I convert this to a suitable input file for weka?
I tried converting it to csv and then to arff format, but it doesn't work and keeps giving me one of 2 errors header stream is invalid or attribute names are not unique.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

放我走吧 2024-11-06 23:57:18

ARFF 文件具有以下格式:

@RELATION aNameForTheRelation

@ATTRIBUTE attr_0 TYPE
@ATTRIBUTE attr_1 TYPE
% ... (this' a comment)
@ATTRIBUTE attr_N TYPE

@DATA
sample_0_attr_0_v,sample_0_attr_1_v,...,sample_0_attr_N_v
sample_1_attr_1_v,sample_1_attr_1_v,...,sample_1_attr_N_v
% ...
sample_M_attr_1_v,sample_M_attr_1_v,...,sample_M_attr_N_v

它基本上可以是带有标题的 CSV 文件。您是否尝试手动写入 ARFF 文件的标头并附加 CSV 文件信息?也许自动化工具未能检测到生成的 ARFF 中属性的正确命名

An ARFF file have the following format:

@RELATION aNameForTheRelation

@ATTRIBUTE attr_0 TYPE
@ATTRIBUTE attr_1 TYPE
% ... (this' a comment)
@ATTRIBUTE attr_N TYPE

@DATA
sample_0_attr_0_v,sample_0_attr_1_v,...,sample_0_attr_N_v
sample_1_attr_1_v,sample_1_attr_1_v,...,sample_1_attr_N_v
% ...
sample_M_attr_1_v,sample_M_attr_1_v,...,sample_M_attr_N_v

It can be basically a CSV file with a header. Did you try to manually write the header of the ARFF file and append the CSV file information? Maybe the automate tool failed in detecting proper naming for the attributes in the resulting ARFF

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文