当前位置：文江博客话题详情

如何将ARFF文件导入PANDAS DF，然后再次将其转换为ARFF

发布于 2025-01-28 04:48:30 字数 1155 浏览 3 评论 0 原文

我想用Scikit从ARFF文件中学习数据库，然后在Python-Weka-Wrapper3模型上使用预处理数据库，因此我需要一个函数将ARFF加载为DF或将ARFF转换为CSV，并将其转换为CSV，并后来再次在ARFF上下载已编辑的DF或将CSV转换为ARFF。

有些人推荐 https://github.com/renatopp/lenatopp/liac-arff ）但是我不知道该库如何做到这一点。

因此，如果某人在Python3上知道任何功能或某些代码，我将重新启动。

就我而言，我尝试了此功能：

def arff2csv(arff_path, csv_path=None):
    with open(arff_path, 'r') as fr:
        attributes = []
        if csv_path is None:
            csv_path = arff_path[:-4] + 'csv'  # *.arff -> *.csv
        write_sw = False
        with open(csv_path, 'w') as fw:
            for line in fr.readlines():
                if write_sw:
                    fw.write(line)
                elif '@data' in line:
                    fw.write(','.join(attributes) + '\n')
                    write_sw = True
                elif '@attribute' in line:
                    #print(line.split(' ')[2])
                    attributes.append(line.split(' ')[1])  # @attribute attribute_tag numeric

        print("Convert {} to {}.".format(arff_path, csv_path))

原文

I want to preprocess a data base with scikit learn from an arff file, and later use on an python-weka-wrapper3 model the preprocessed data base, so I need a function to load the arff as df or transform the arff to csv, and later again download the edited df on an arff or transform a csv to arff.

Some people recomend https://github.com/renatopp/liac-arff (liac-arff) but I don't know how to do that with this library.

So, if someone knows any function or some code well explained on python3 I'll apreciate.

In my case I tried with this function:

def arff2csv(arff_path, csv_path=None):
    with open(arff_path, 'r') as fr:
        attributes = []
        if csv_path is None:
            csv_path = arff_path[:-4] + 'csv'  # *.arff -> *.csv
        write_sw = False
        with open(csv_path, 'w') as fw:
            for line in fr.readlines():
                if write_sw:
                    fw.write(line)
                elif '@data' in line:
                    fw.write(','.join(attributes) + '\n')
                    write_sw = True
                elif '@attribute' in line:
                    #print(line.split(' ')[2])
                    attributes.append(line.split(' ')[1])  # @attribute attribute_tag numeric

        print("Convert {} to {}.".format(arff_path, csv_path))

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心的位置 2025-02-04 04:48:30

如果您想留在Scikit-Learn生态系统中，可以看一下图书馆，使用 python-weka-wrapper3 。

btw python-weka-wrapper3可以直接创建数据集来自numpy矩阵。示例：,

回复收藏 0 原文

唠甜嗑 2025-02-04 04:48:30

我在AV上找到了这个答案，以解决将ARFF数据格式加载到PANDAS DataFrame 的问题。

from scipy.io import arff
import pandas

data = arff.loadarff('data_file_name.arff')
df = pandas.DataFrame(data[0])

I found this answer on AV to solve my problem of loading the arff data format into pandas dataframe.

https://discuss.analyticsvidhya.com/t/loading-arff-type-files-in-python/27419/2

from scipy.io import arff
import pandas

data = arff.loadarff('data_file_name.arff')
df = pandas.DataFrame(data[0])

回复收藏 0 原文

~没有更多了~

关于作者

拔了角的鹿

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

如何将ARFF文件导入PANDAS DF，然后再次将其转换为ARFF

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如何将ARFF文件导入PANDAS DF，然后再次将其转换为ARFF

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。