data-preprocessing

data-preprocessing

文章 0 浏览 1

数据集中的线性依赖列

我需要进行数据集的“清洁”,即预处理。我注意到数据集中有两个完全依赖的列。可以删除一个,还是我不允许这样做? 这是一个学校项目和一个“野生数…

明明#如月 2025-02-02 03:14:51 3 0

如何将工作循环的工作转移到熊猫的应用程序更快的应用功能?

我有一个带有经度和纬度列的数据框。我需要借助Geopy套餐来基于长长和LAT值来获取位置的县名。 longitude latitude housing_median_age total_rooms t…

妄司 2025-02-01 08:19:09 4 0

如何平滑图值或仅提取主信号

当我尝试在下面运行代码时,我会得到此图 ​ from numpy import nan import json import os import numpy as np import subprocess import math impor…

悲喜皆因你 2025-02-01 01:47:02 3 0

填充两个重叠形状之间的区域

我正在尝试将由两条线组成的二进制掩码转换为由两条线之间的区域组成的掩模。 但是,我被困,对如何前进没有任何想法。 这是我戴的面具的示例: mask …

安静 2025-01-31 23:26:16 3 0

填补角度列表之间的空白(数字)

我会说明简单的例子,然后进入深处 如果我有一个数字列表包括 t_original = [180,174,168,166,162,94,70,80,80,128,131,160,180] 180,174,168,166,162…

绿萝 2025-01-30 20:16:20 4 0

将数字值分配给Python中的列

我是一个初学者,如果我不清楚,请提前很抱歉:) 我有一个带有2列,doc_number和文本的.CSV。但是,有时行以DOC编号开头(如应该是),有时它只是从上…

简单 2025-01-30 15:39:58 3 0

预处理类错误,“ attributeError:' function'对象没有属性。

因此,我现在早些时候做了一个NLP项目,现在我已经腌制了该模型,并试图将其应用于新的数据集中,数据集是我从Twitter取消的内容。因此,当然,新的Da…

究竟谁懂我的在乎 2025-01-30 09:13:16 5 0

如何处理偏斜的分类数据以进行多类分类任务?

我想知道如何处理包含具有多个分类值的特定列的偏斜数据。这些值中的某些值与其他值相比具有更多的 value_counts()。 https://i.sstatic.net/ywxd7.…

野の 2025-01-29 20:14:43 4 0

我如何在熊猫的一定时间段内选择最少的NAN值?

我的数据集和数据集缺失了很多数据,这些数据将每小时数据存储几年。现在,我将实施一种季节性填充方法,其中我需要二年来我拥有的最佳数据(2*8760条…

守护在此方 2025-01-29 03:36:18 3 0

图像数据生成器中已经存在错误

generator = tf.keras.preprocessing.image.ImageDataGenerator(featurewise_center=False, samplewise_center=False, featurewise_std_normalization…

裸钻 2025-01-27 10:44:10 4 0

多态性数据转换技术 /数据湖 /大数据

背景:我们正在研究一种解决方案,以从各种客户中摄入大量的遥测数据。数据采用XML格式,包含多个具有许多嵌套元素的独立信息组。客户有不同的版本,…

停滞 2025-01-26 18:11:02 6 0

不同的单词嵌入方法是否可以在同一数据集中产生相同的词汇。

我想问一下为什么我的嵌入矩阵彼此之间具有不同的维度。 首先,我在IMDB数据集上使用Word2Vec,并在17620年左右生产词汇,而无需使用任何停止单词。其…

独夜无伴 2025-01-26 08:54:42 3 0

pytorch几何train_test_split_edges在数据集上实现,带有边缘功能崩溃了Google-Colab笔记本

您好Stackoverflow社区, 我是Pytorch几何新手。当我将数据集(数据尺寸=> data(x = [14254,1647])分开时https://colab.research.google.com/d…

驱逐舰岛风号 2025-01-25 19:55:59 3 0

如何从给定的数据帧列中删除所有字符串?

我需要在Python中预处以用于机器学习的列。该列包含一系列的1和0(这是所需的输出),但是其中有一些字符串需要删除['px7','d1'等。] 我考虑过将DF.R…

余生再见 2025-01-25 10:47:15 2 0

基于分类数据的分类

我有一个 Inp1 Inp2 Output A,B,C AI,UI,JI Animals L,M,N LI,DO,LI Noun X,Y AI,UI Extras 用于这些值的数据集,我需要应用ML算法。哪种算法最适合在…

简美 2025-01-25 05:39:25 2 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文