ALS的Pyspark实施如何处理每个用户项目组合的多个评级?
我观察到,到ALS的输入数据不需要每个用户项目组合都具有唯一的评分。 这是一个可再现的例子。 # Sample Dataframe df = spark.createDataFrame([(0, …
pyspark RandomForestClassifier无法识别weightCol参数
我正在尝试在某些不平衡数据集上实现加权的随机森林模型。 这是我要做的事情:我有一个在Google Colab上运行的jupyter笔记本,并运行了一个火花群。 …
PySpark ML 模型是否可以根据条件仅在数据帧的一部分上运行?
我训练了一个逻辑回归算法,将职位名称和描述与一组 4 位数字代码相匹配。这一点它做得非常好。它将形成管道的一部分,该管道首先尝试通过加入参考数…
如何从 SparklyR 中的模型中提取 feature_importances?
我想从 SparklyR 中的模型中提取 feature_importances 。到目前为止,我有以下正在运行的可重现代码: library(sparklyr) library(dplyr) sc <- spark…
- 共 1 页
- 1