是否可以计算Sklearn中线性和多项式回归模型的置信区间?
我正在使用Sklearn -linear和多项式回归模型进行一些基本的预测。我能够使我的模型启动并很快运行以做出预测,但是我也想计算80%的置信区间,以获得…
fit_transform和inverse_transform在两个不同的脚本上
如何 fit_transform & inverse_transform 在单独的脚本中? 我首先在脚本中标准化数值目标(整数)。 然后,我使用其他脚本实时预测这些数值目标…
Python聚类软件包,可以基于距离矩阵的聚类,但也可以预测新行(没有新的群集/距离矩阵)
我知道与距离矩阵一起使用的各种(Sklearn)聚类算法 - 例如,通过来自随机森林的接近矩阵产生的(下面有些笨拙的可重复的代码)。是否存在任何聚类算…
我们是否需要两个独立的标准标准来实现功能和目标?
因此,我了解的是标准标准()。fit_transform(x,y)不会更改目标功能( y )。同时,对于某些算法(例如基于权重或基于距离的算法),我们还需要扩…
群集中每个标签的Sklearn聚类提取ID
您好,我正在学习如何使用Scikit-Learn聚类模块。我有一个工作脚本,可以在大熊猫数据框架中读取。 df=pd.read_csv("test.csv",index_col="identifier…
有没有办法将sklearn.datasets.datasets.load_files用于图像文件
尝试将自定义文件夹与 x,y = sklearn.datasets.datasets.load_digits(return_x_y = true)用于SkLearn Image分类任务。 load_files可以执行我需要的…
Python(Sklearn)train_test_split:选择要训练的数据以及要测试的数据
我想使用Sklearn的Train_test_split手动将数据分为火车和测试类别。具体来说,在我的.CSV文件中,我想使用所有数据行,直到最后一行进行训练,然后进…
GridSearchCV返回最坏可能的参数(Ridge& lasso回归)
问题: Scikit-Learn的GridSearchCV正在返回参数,这会导致最差的分数(根MSE)而不是最佳。 我认为可能的问题是,我不是使用火车测试策略来创建一个…
什么是线性回归中的.rank_和.singular_?
我试图了解Sklearn文档中的线性回归,并且偶然发现了“属性”部分,但我不知道 .rank _ 和 .singular _ 表示。文档中没有全面的解释。 我有一个例子 >…
机器学习 - 使用不平衡数据训练模型
我的数据中有两个类。 这就是班级分布的样子。 0.0 169072 1.0 84944 换句话说,我有2:1班级分布。 我相信我有两个选择。下样本类 0.0 或upsample cl…
logisticRegress()vs logisticRegressioncv()及其CS超参数
我已经使用 logisticRegress()构建了一个模型,并且在网格搜索之后,数据建议我的正规化强度, c = .0000001 是“最佳”值做出我的预测。 此参数适…
如何将标准标准器正确加载到TensorFlow Keras型号?
我对TensorFlow模型的负载标准标准器有问题。 我使用以下代码来加载标准标准模型: scaler_load = pickle.load(open(path + save_dir +'std_scaler_1.…
自定义列变压器。培训问题
我在尝试实施管道时遇到以下问题 对于预处理器,我想组合添加新列和处理所有其他列。它的工作原理 features = ['Pclass', 'Sex', 'Age', 'Parch', 'Si…