数据集的高维性

发布于 2024-11-25 13:03:19 字数 1539 浏览 0 评论 0原文

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

我不吻晚风 2024-12-02 13:03:19

SQL Server而言,普通表的列限制是 1,024。因此,我认为任何接近该限制的列数都很大。也就是说,您可以使用宽表将限制扩展到 30,000,但需要权衡:

宽表是定义了列集的表。宽表使用稀疏列将表的列总数增加到 30,000。索引和统计数据的数量也分别增加到1,000和30,000。宽表行的最大大小为 8,019 字节。因此,任何特定行中的大部分数据都应该为 NULL。要创建表或将表更改为宽表,请向表定义添加列集。宽表中非稀疏列加上计算列的最大数量仍然是 1,024。

通过使用宽表,您可以在应用程序中创建灵活的架构。您可以随时添加或删除列。请记住,使用宽表具有独特的性能考虑因素,例如增加的运行时和编译时内存要求。

根据 此线程,PostgreSQL 的限制是每个 1,600 列桌子。

根据这些数字,我建议任何接近 1,000 的列数都是巨大

As far as SQL Server is concerned, the column limit on a normal table is 1,024. So I would consider any number of columns approaching that limit to be large. That said, you can use wide tables to extend the limit up to 30,000 but there are tradeoffs:

A wide table is a table that has defined a column set. Wide tables use sparse columns to increase the total of columns that a table can have to 30,000. The number of indexes and statistics is also increased to 1,000 and 30,000, respectively. The maximum size of a wide table row is 8,019 bytes. Therefore, most of the data in any particular row should be NULL. To create or change a table into a wide table, you add a column set to the table definition. The maximum number of nonsparse columns plus computed columns in a wide table remains 1,024.

By using wide tables, you can create flexible schemas within an application. You can add or drop columns whenever you want. Keep in mind that using wide tables has unique performance considerations, such as increased run-time and compile-time memory requirements.

According to this thread, the limit for PostgreSQL is 1,600 columns per table.

Based on these numbers, I would suggest any number of columns that approaches 1,000 to be huge.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文