Pyspark.ml.Recommendation.als是否在引擎盖下创建一个枢轴表?
ALS建议模型执行矩阵分解,其中将用户与潜在因素的项目分配。
A matrix of 3 users and 3 items would look like this:
users | item_1 | item_2 | item_3 |
---|---|---|---|
user_1 | NA | 4 | 1 |
user_2 | 4 | 3 | 0 |
user_3 | NA | 1 | NA |
My dataframe starts such as:
users | items | rating |
---|---|---|
user_1 | item_2 | 4 |
user_1 | item_3 | 1 |
user_2 | item_1 | 4 |
user_2 | item_2 | 3 |
user_2 | item_3 | 0 |
User_3 | item_2 | 1 |
我的问题是,在将我的数据框架插入ALS模块之前,我是否需要以这样的方式进行转换,最后我将具有一个结构,例如:
用户 | item ittem | corting等级 |
---|---|---|
user_1 | item_1 | na |
user_1 | item_2 | 4 |
user_1 | item_3 | 1 |
user_2 | item_2 | 4 |
user_2 | item_2 | 3 |
user_2 user_2 | item_3 | 0 |
user_3 user_3 | item_1 | na |
user_3 | item_3 | euser_3 |
na | item_3 item_3 na | 或 |
will,在引擎盖下, ml.recommendation.als.als 函数函数创建与地方相关的观察值?例如:
用户 | 项目 | 评级 |
---|---|---|
用户_1 | item_1 | na |
如果不这样做,一种产生预期表的方法将是旋转它的,然后将其删除,但是它将产生非常巨大的用户矩阵与项目。但是,从中,似乎没有必要这个过程(枢轴,然后,undivot)。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
是的。它不是必需的。
训练您的ALS模型后,拟合的模型应用于预测“丢失的交互”。
因此,术语“填充”(在您的句子中“ ml.recommendation.als”模块填充那些丢失的交互”)是不合适的,您应使用术语“预测”。
Yes. It is not necessary.
After you train you the ALS model, the fitted model should be used to predict the "missing interactions".
Thus, the term "fill" (in your sentence " ml.recommendation.ALS module fill those missing interactions") is not appropriate, you should uses the term "predict".