当前位置：文江博客话题详情

多少行数据算过多行数据？

发布于 2024-07-15 10:59:38 字数 114 浏览 8 评论 0原文

对于 SQL 表来说多大才算太大，是否有一些硬性规定？

我们以名称/值对格式存储 SCORM 跟踪数据，每个课程每个用户可能有 4-12 行，以后这会是一件坏事吗，因为有数百个课程和数千个用户？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤星 2024-07-22 10:59:38

这个神奇的数字是数十亿。在获得数十亿行数据之前，您根本不是在谈论太多数据。

算一算。

每个课程每个用户 4-12 行，...数百个课程和数千个用户？

400,000 到 1,200,000 行。假设每行 1000 字节。

即 400Mb 到 1.2Gb 的数据。您可以在 Apple 商店以 299 美元的价格购买 100Gb 驱动器。您很容易就会花费超过 299 美元的计费时间来处理那些不再重要的细节。

在达到 1Tb 的数据 (1,000 Gb) 之前，您所说的数据根本不算太多。

回复收藏 0 原文

思慕 2024-07-22 10:59:38

我个人曾在生产中使用过包含 5000 万行的表，这与我听说的相比很小。您可能需要通过分区来优化结构，但在您的环境中测试系统之前，您不应该浪费时间这样做。您所描述的内容非常小，恕我直言，

我应该补充一下，我正在使用 SQL Server 2000 和 SQL Server 2000。 2005 年，每个 DBMS 都有自己的大小限制。

回复收藏 0 原文

貪欢 2024-07-22 10:59:38

100（课程）* 1000（用户）* 10（记录）才一百万条。这是低端的，但一个像样的数据库应该可以很好地处理它。

听起来不太确定的是名称/值对。这将限制您正确索引内容的能力，而这对于良好的性能至关重要。

回复收藏 0 原文

旧时模样 2024-07-22 10:59:38

没有硬性规定，但有一种硬性方法可以获取号码。

编写一个程序，用大致接近实际数据预期形式的虚拟数据填充表（例如，相似的规律性、字符、模式等）。使用虚拟数据的实际查询对其运行性能测试，逐渐增加行数在表中，可能以 1000 或 10000 行为步长。

当查询性能（例如每秒完成的查询）变得不可接受时，您将拥有“太大”的行数。

回复收藏 0 原文

小红帽 2024-07-22 10:59:38

我曾经开发过一个 Web 表单系统，其名称/值对表中有超过 3 亿行。许多表单每次提交的行数超过 300 行。实际上性能并不算太差，但查询起来简直就是一个 PITA！在这次演出中，我的 SQL 编写能力确实得到了提高。

但恕我直言，如果您有任何意见，请摆脱它，而采用标准标准化表。

回复收藏 0 原文

故人爱我别走 2024-07-22 10:59:38

并不真地。这完全取决于您的业务需求，并且您必须购买支持您的估计行数的产品。

回复收藏 0 原文

不再让梦枯萎 2024-07-22 10:59:38

不，关于表中可以有多少行实际上没有任何硬性规则，这在很大程度上取决于行中有多少数据以及数据的索引程度。

对您所说的数字进行快速估计会得出大约数千万行。这当然不算太多，但足够了，如果你不小心的话，可能会成为一个问题。

也许该表可以标准化？相同的名称是否出现很多，因此您可以将名称放在单独的表中并使用表中的 id 吗？

回复收藏 0 原文

对你再特殊 2024-07-22 10:59:38

我认为这里没有真正的限制，但驱动器空间。但是请在索引很小的时候添加好的索引，因为当表很大时，添加索引将花费更长的时间。另外，如果索引不好，查询会随着速度的加快而变慢，当实际上没有任何问题，但索引很糟糕甚至没有索引时，人们会抱怨。

回复收藏 0 原文

澉约 2024-07-22 10:59:38

我曾经在数据库上工作过，我们试图创建包含 2B 行数据的表 - 但这不起作用，我们达到了 500M 并重新设计。使用如此大的表的最大问题之一是删除所需的时间 - 我经常看到将旧记录存档然后从主表中删除的方法。如果表足够大，则在重建索引时，删除操作将运行多个小时。

不确定截止点在哪里，但直觉表明表格> > 10M 行可能太大了。我们的方法是按日期对数据进行分区，因此我们最终得到了一个包含一周数据的表，另一个包含几个月数据的汇总表，以及另一个包含数年数据的汇总表 - 这在数据仓库中很常见。顺便说一句，这是在 SQL 7.0 上进行的，有兴趣知道数据库是否更擅长这种类型的东西吗？

回复收藏 0 原文