当前位置：文江博客话题详情

google-cloud-platform google-cloud-vertex-ai google-cloud-automl

vertexai表格式automl拒绝包含空的行

发布于 2025-02-11 21:56:15 字数 1067 浏览 2 评论 0 原文

我正在尝试基于一个相当稀疏的表格数据集构建二进制分类器，但是培训失败了以下消息：

训练管道失败，错误消息：输入行传递的验证太少。在1169548输入中，有194个有效。至少50％的行必须通过验证。

我的理解是，表格automl应该能够处理空值，因此我不确定这里发生了什么，我很感谢任何建议。文档> documentation 明确地提到我不审查每一列的无效性，但我不喜欢't请在“数据集”选项卡上设置或检查列的无用性（也许该文档已过时？）。此外，数字列出对缺失值的支持，只有NAN和INF。

数据集为100万行，34列，只有189行无效。我最稀疏的列有5,000行的数据，下一个最稀有的数据分别为72K和274K行。列是分类和数字的混合物，只有几个没有空的列。

数据存储为CSV，数据集导入似乎无问题运行。生成统计信息在数据集上运行，但由于某种原因，缺失％列未能填充。解决这个问题的最佳方法可能是什么？我不确定这是我需要更改CSV中的空表示，更改某些数据集/培训设置的情况，或者它是否是Automl错误（较小的可能性）。谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

过潦 2025-02-18 21:56:15

允许无效＆amp;培训期间的无效值预测，我们必须明确设置允许无效的值 flag在 yes 期间，如下图所示。您可以在数据集页面上的模型培训设置下找到此设置。标志必须按列以列设置。

回复收藏 0 原文

说好的呢 2025-02-18 21:56:15

我尝试了 @kabilan mohanraj 的建议并解决了我的问题。我要做的是单击下拉列表，以使无效的值进入培训。进行此更改后，所有行都通过了验证，我的模型能够毫无问题地训练。我最初认为丢失值不会被视为无效的，这是不正确的。

回复收藏 0 原文

~没有更多了~

关于作者

巴黎夜雨

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

vertexai表格式automl拒绝包含空的行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

vertexai表格式automl拒绝包含空的行

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

陪我终i

别忘他

野心澎湃

蒲公英的约定

。

旧时模样

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。