data-preprocessing

data-preprocessing

文章 0 浏览 1

使用Groupby Dict填充Nan

我试图使用具有中位模型圆柱体编号的词典来替换“圆柱”列中的NAN。我认为它应该很容易起作用,但是我一直在尝试每种尝试。 cylinders_model_med = df…

撩人痒 2025-02-10 19:06:28 2 0

需要从一个热编码形状检索原始数据形状

我收到了一个数据集,其中包括先前转换为一个热编码的列。我想检索其旧形状以进行一些预处理和填充NAS方法,当然也可以阅读数据集的统计模型。 我得到…

情深如许 2025-02-10 08:35:35 1 0

矢量器标准化中无效的模式

我正在尝试将独特的字符与单词分开,以便我可以将它们视为单独的令牌。 这是我的矢量器: vectorizer = tf.keras.layers.TextVectorization( standard…

佞臣 2025-02-09 11:10:28 1 0

如何在tf.dataset上调整文本向量层

我加载了这样的数据集: self.train_ds = tf.data.experimental.make_csv_dataset( self.config["input_paths"]["data"]["train"], batch_size=self.p…

巨坚强 2025-02-08 19:47:32 2 0

形状不匹配:在绘制条形图的同时,无法广播对象

我正在尝试将y_train和y_test数据的图形绘制,但是我会得到价值不匹配错误。有人可以帮助我修复它吗? #Read the dataset - Amazon fine food reviews…

千秋岁 2025-02-08 19:05:11 2 0

如何在将其传递到Keras LSTM层之前,将多个长度的多元时间序列排列

我有许多由相同过程产生的多元时间序列,但 长度有显着差异; 每个时间序列都是一个独立的实例,测量值是在不同的随机时间戳上进行的。 每个时间段的…

挖鼻大婶 2025-02-08 09:11:48 1 0

合并GCP中的CSV文件

我在GCP上工作的数据集为CSV格式,对于每个功能,都有一个没有标头的CSV文件。大约有20个文件,想为所有这些变量创建一个带标头的文件。但是,仅当我…

旧人哭 2025-02-07 22:25:39 1 0

如果您有两个0和1类的数值目标,并且所有功能也是数值的,我应该编码目标吗?

我正在处理二进制分类问题,我的数据集包含数值功能,而目标类也是数值,我有两个类别0或1类 在这种情况下,在对数据集进行预处理时,我应该仔细研究…

舟遥客 2025-02-07 05:50:53 1 0

如何解决此错误? &quot”功能'对象没有属性'标准标准器;

def preprocessing(df:pd.DataFrame,scaler:str): standard_scaler= preprocessing.StandardScaler() not_uv=[] for column in df.columns: if column…

为你拒绝所有暧昧 2025-02-06 23:56:37 2 0

来自Power BI中多家公司的数据的最佳方法

基本上,我有一个大约500x500的大Excel数据集,其中包含来自各种公司的经济信息。 每一行都代表另一家公司,在列中,我们有信息。它的一点点是定性的…

四叶草在未来唯美盛开 2025-02-06 23:24:37 1 0

使用SKLEARLEN COLLANSTRANSFORMER时,功能名称的长度将输入X的实际大小不匹配

我已经设计了以下管道来训练我的模型: from sklearn.compose import make_column_selector as selector from sklearn.compose import ColumnTransfor…

落叶缤纷 2025-02-05 08:40:48 3 0

如何确保GridSearchCV首先要分开,然后将其插入?

我有一个GridSearchCV,带有一个看起来像这样的管道: numeric_transformer = Pipeline(steps=[ ('imputer', SimpleImputer(strategy='most_frequent'…

扛起拖把扫天下 2025-02-05 05:41:02 3 0

尝试H2O AUTOML选项预处理= ['target_encoding&quot']。如何处理和检查看不见的数据中的性能?

尝试H2O AUTOML选项预处理= [“ target_encoding”]。测试性能确实有所改善。如何在看不见的/暂停数据上应用类似的转换来检查性能?…

杀お生予夺 2025-02-05 00:04:11 3 0

删除包含带有python上字母的数字的行

我有一个 txt 文件,每行包含一个句子,并且有包含字母附加的数字的行。例如: The boy3 was strolling on the beach while four seagulls appeared f…

不疑不惑不回忆 2025-02-02 15:35:35 6 0

如何与Groupby一起使用Sklearn Standardardscaler?

我正在尝试根据日期对大熊猫的数据框架进行标准化。 My dataset looks like this: date permno ret cumret mom1m mom3m mom6m 2004-01-30 80000 0.053…

绝不服输 2025-02-02 06:20:41 5 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文