逆转SCI-KIT LabElenCoder,但具有2D数组数据集
我正在尝试创建一个自动数据预处理库,我想将字符串数据转换为数值,以便可以通过ML算法运行。但是我似乎无法将其倒回原始状态,因为Sci-kit具有内置…
简化无法导入Sklearn模块
我只是想在此处学习一些有关数据科学的知识,并遵循本教程: https://www.youtube.com/watch?v=8m20lyczdoy 我运行该程序,它说即使我通过pip3安装了S…
tfidfvectorizer如何覆盖“ build_preprocessor”
我正在扩展标准强制性预处理步骤。查看对于 build_preprocessor ,他们的代码具有“分支”逻辑,但是我希望在超级呼叫返回的任何功能的顶部都添加一个…
Python,如何使用Sklearn中的Knnimputer并使用Groupby插入数据(填充缺失值)
我有大数据,我需要进行插补才能填写缺失的值。但是我需要使用GroupBy进行插补,以根据另一列的值填充缺失值。 假设我有这张表, data = {'name': ['A…
Vscode中的Python库的不同版本
我正在研究VSCODE,并且正在尝试更新 scikit-learn 库。但是,我在终端中有这种混乱。 user$ conda list scikit-learn # packages in environment at …
使用QR分解(相关特征)的Python线性回归
我需要在某些功能相关的数据集上应用Python线性回归。 Scikit的线性回归使用奇异值分解,以最大程度地减少平方误差。但是,此方法没有考虑变量之间的…
有多少可学习的参数具有有20个输入和3个类的脊回归分类器?
有多少可学习的参数具有脊回归分类器( https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.ridgeclassifiercv.html )如果它…
如何用角班轮计算损失
我正在使用Sklearn的KerasClassifier来包装我的KERAS型号,以执行K-折叠验证。 model = KerasClassifier(build_fn=create_model, epochs=20, batch_si…
ValueError:K必须小于或等于训练点的数量
我正在尝试在一系列句子上进行bertopic。实际上,我使用bert句子嵌入了聚集聚类,结果有许多簇,其中一个簇是 docs=["PARIS:France’s trade unions c…
如何为实体提取(使用SVM或PercePtron)部署ML模型
我正在尝试从空缺中提取软技能,目前我正在努力将ML型号(SVM或PercePtron)应用于我的数据集。首先,我制作了一个自定义的旋转ner,最终导致了一个数…
Sklearn使用哪种模型性能指标用于SVR模型?
我注意到SVR的数学指出,SVR使用L1惩罚或Epsilon不敏感的损失函数。但是Sklearn SVR模型文档提到了L2惩罚。我与SVR没有太多经验的经验认为拥有经验的…
ValueError:找到具有0个样本的数组(Shape =(0,19)),而最少需要1个
因此,我是编程和机器学习的新手,并且正在使用我从日记垃圾邮件检测日记中找到的代码。当我尝试使用它时,即使我已经正确准备了数据,结果也被证明是…
LogisticRecress预测1如果概率大于0.7
在Sklearn Logisticression中, model = LogisticRegression().fit(X_train,y_train) predictions = model.predict(X_test) 如果概率大于0.5,则会给…
XGBoost回归预测常数值
我正在尝试使用XGBoost来预测传入的呼叫数量。 我的 df 看起来像这样,有1152行: X 调用 0 0 8154.0 1 1 8526.0 2 2 8088.0 3 3 7044.0 4 4 7236.0 5…