data-preprocessing

投稿关注

文章 0 浏览 1

使用Groupby Dict填充Nan

我试图使用具有中位模型圆柱体编号的词典来替换“圆柱”列中的NAN。我认为它应该很容易起作用，但是我一直在尝试每种尝试。 cylinders_model_med = df…

撩人痒 2025-02-10 19:06:28 2 0

需要从一个热编码形状检索原始数据形状

我收到了一个数据集，其中包括先前转换为一个热编码的列。我想检索其旧形状以进行一些预处理和填充NAS方法，当然也可以阅读数据集的统计模型。我得到…

情深如许 2025-02-10 08:35:35 1 0

矢量器标准化中无效的模式

我正在尝试将独特的字符与单词分开，以便我可以将它们视为单独的令牌。这是我的矢量器： vectorizer = tf.keras.layers.TextVectorization( standard…

佞臣 2025-02-09 11:10:28 1 0

如何在tf.dataset上调整文本向量层

我加载了这样的数据集： self.train_ds = tf.data.experimental.make_csv_dataset( self.config["input_paths"]["data"]["train"], batch_size=self.p…

巨坚强 2025-02-08 19:47:32 2 0

形状不匹配：在绘制条形图的同时，无法广播对象

我正在尝试将y_train和y_test数据的图形绘制，但是我会得到价值不匹配错误。有人可以帮助我修复它吗？ #Read the dataset - Amazon fine food reviews…

千秋岁 2025-02-08 19:05:11 2 0

如何在将其传递到Keras LSTM层之前，将多个长度的多元时间序列排列

我有许多由相同过程产生的多元时间序列，但长度有显着差异；每个时间序列都是一个独立的实例，测量值是在不同的随机时间戳上进行的。每个时间段的…

挖鼻大婶 2025-02-08 09:11:48 1 0

合并GCP中的CSV文件

我在GCP上工作的数据集为CSV格式，对于每个功能，都有一个没有标头的CSV文件。大约有20个文件，想为所有这些变量创建一个带标头的文件。但是，仅当我…

旧人哭 2025-02-07 22:25:39 1 0

如果您有两个0和1类的数值目标，并且所有功能也是数值的，我应该编码目标吗？

我正在处理二进制分类问题，我的数据集包含数值功能，而目标类也是数值，我有两个类别0或1类在这种情况下，在对数据集进行预处理时，我应该仔细研究…

舟遥客 2025-02-07 05:50:53 1 0

如何解决此错误？＆quot”功能＆＃x27;对象没有属性＆＃x27;标准标准器；

def preprocessing(df:pd.DataFrame,scaler:str): standard_scaler= preprocessing.StandardScaler() not_uv=[] for column in df.columns: if column…

为你拒绝所有暧昧 2025-02-06 23:56:37 2 0

来自Power BI中多家公司的数据的最佳方法

基本上，我有一个大约500x500的大Excel数据集，其中包含来自各种公司的经济信息。每一行都代表另一家公司，在列中，我们有信息。它的一点点是定性的…

四叶草在未来唯美盛开 2025-02-06 23:24:37 1 0

使用SKLEARLEN COLLANSTRANSFORMER时，功能名称的长度将输入X的实际大小不匹配

我已经设计了以下管道来训练我的模型： from sklearn.compose import make_column_selector as selector from sklearn.compose import ColumnTransfor…

落叶缤纷 2025-02-05 08:40:48 3 0

如何确保GridSearchCV首先要分开，然后将其插入？

我有一个GridSearchCV，带有一个看起来像这样的管道： numeric_transformer = Pipeline(steps=[ ('imputer', SimpleImputer(strategy='most_frequent'…

扛起拖把扫天下 2025-02-05 05:41:02 3 0

尝试H2O AUTOML选项预处理= ['target_encoding＆quot']。如何处理和检查看不见的数据中的性能？

尝试H2O AUTOML选项预处理= [“ target_encoding”]。测试性能确实有所改善。如何在看不见的/暂停数据上应用类似的转换来检查性能？…

杀お生予夺 2025-02-05 00:04:11 3 0

删除包含带有python上字母的数字的行

我有一个 txt 文件，每行包含一个句子，并且有包含字母附加的数字的行。例如： The boy3 was strolling on the beach while four seagulls appeared f…

不疑不惑不回忆 2025-02-02 15:35:35 6 0

如何与Groupby一起使用Sklearn Standardardscaler？

我正在尝试根据日期对大熊猫的数据框架进行标准化。 My dataset looks like this: date permno ret cumret mom1m mom3m mom6m 2004-01-30 80000 0.053…

绝不服输 2025-02-02 06:20:41 5 0

共 4 页
1
2
3
4
下一页

友情链接

文江博客