BigQueryML:随机森林分类

发布于 2025-01-09 06:31:54 字数 157 浏览 0 评论 0原文

你好 stackoverflow 社区!

我最近发现 Bigquery ML 不支持随机森林分类模型。为了克服这个问题,我认为我可以使用 sklearn 包构建一个模型,然后在 bigqueryml 上使用相同的超参数。在这种情况下,在 bigquery 中使用提升树模型是最佳选择吗?

Hello stackoverflow community!

I recently found out that Bigquery ML does not support random forest classification models. To overcome that, I figured that I might be able to build a model with sklearn package and then use the same hyperparameters on bigqueryml. Is using the boosted tree model in bigquery the best option in this case?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

快乐很简单 2025-01-16 06:31:54

您可以使用 BQML 的提升树模型类型训练随机森林模型,并使用以下参数

  1. 将 BOOSTER_TYPE 设置为 GBTREE
  2. 将 NUM_PARALLEL_TREE 设置为大于 1 的某个数字
  3. 将 MAX_ITERATIONS 设置为 1
  4. 将 LEARN_RATE 设置为 1
  5. 将 {COLSAMPLE_BYTREE、COLSAMPLE_BYLEVEL、COLSAMPLE_BYNODE} 之一设置为小于1.

You can train a random forest model using BQML's boosted tree model type, with the following parameters

  1. Set BOOSTER_TYPE to GBTREE
  2. Set NUM_PARALLEL_TREE to some number greater than 1
  3. Set MAX_ITERATIONS to 1
  4. Set LEARN_RATE to 1
  5. Set one of {COLSAMPLE_BYTREE, COLSAMPLE_BYLEVEL, COLSAMPLE_BYNODE} less than 1.
云归处 2025-01-16 06:31:54

BQ ML 中添加了随机森林模型。

CREATE MODEL mydataset.model1
OPTIONS(MODEL_TYPE = 'RANDOM_FOREST_CLASSIFIER')
AS SELECT * FROM mydataset.mytable;

文档 - https:// cloud.google.com/bigquery-ml/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest

Random forest model was added to BQ ML.

CREATE MODEL mydataset.model1
OPTIONS(MODEL_TYPE = 'RANDOM_FOREST_CLASSIFIER')
AS SELECT * FROM mydataset.mytable;

Doc - https://cloud.google.com/bigquery-ml/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文