当前位置：文江博客话题详情

对于 MySQL 表来说多大算太大？

发布于 2024-10-06 23:15:51 字数 229 浏览 4 评论 0原文

我终于确信将较小的表放入一个较大的表中，但是对于 MySQL 表来说到底多大才算是太大呢？

我有一个包含 18 个字段的表。有些是 TEXT，有些是短 VARCHAR(16)，有些是较长的 VARCHAR(100)。

现在我们每天大约处理 200,000 行，每月将超过 600 万行。多大才算太大？有多少个字段重要还是只有行数重要？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

等待我真够勒 2024-10-13 23:15:51

对于“多大才太大”这个问题并没有一个很好的通用解决方案 - 这种担忧通常取决于您对数据的处理方式以及您的性能考虑因素。

表大小有一些基本限制。列数不能超过 1000 个。您的记录每条不能超过 8k。这些限制会根据数据库引擎而变化。（这里的数据是针对 InnoDB 的。）

听起来您已经将几个不同的数据集合并到一个表中。您可能有一些字段告诉您此记录属于哪个数据集，以及一些数据字段和一些时间戳信息。这不是一个非常广泛的记录（除非您记录每个请求的所有输入参数。）您的主要问题将是选择性。以有意义的方式对该表建立索引将是一个挑战。如果您的公共字段具有足够的选择性，您可以使用它们来获取您想要的记录，而无需查阅表格，这将是一个巨大的优势。（参见表扫描）

对于每天那么多记录（基本上，全天每秒两条，我假设您有一个高峰负载期，该期间的负载要高得多），您还需要确保您专门查看提高插入速度方面的优化。一般来说，索引越多=插入速度越慢。如果可以的话，考虑将过时的记录完全归档到另一个表中。在之前的工作场所中，我们使用了上个月、前三个月、前六个月的归档策略，每个策略都放在单独的表中。另一个想法是删除旧记录。许多环境根本不需要超过特定日期的信息。保留三个月前的日志记录通常成本过高。

最后，不要忽视桌子的物理存储。记录越薄，读取（或插入）记录所需的物理 IO 就越少。您可以将索引存储在单独的物理硬盘驱动器上。如果记录中有大量冗余数据，则存储表压缩实际上可能会提高速度。如果您有一点钱可以烧，请考虑一个好的 RAID 阵列用于条带化数据的价值。

所以，回答你的基本问题：这是很多记录，但只要仔细调整，这不会成为问题。

There's not a great general solution to the question "How big is too big" - such concerns are frequently dependent on what you're doing with your data and what your performance considerations are.

There are some fundamental limits on table sizes. You can't have more than 1000 columns. Your records can't be bigger than 8k each. These limits change depending on database engine. (The ones here are for InnoDB.)

It sounds like you've merged several different data sets into one table. You probably have some fields that tell you what data set this record pertains to, along with some data fields, and some timestamp information. That's not a very wide record (unless you're logging, say, all the input parameters of each request.) Your main problem will be with selectivity. Indexing this table in a meaningful way will be a challenge. If your common fields can be selective enough that you can use them to get to the records you want without consulting the table, that will be a huge plus. (Cf. table scan)

For that many records per day (basically, two a second all day, and I'm presuming you have a peak-load period where it's much higher), you'll also want to make sure that you specifically look at optimizations on improving insertion speed. As a general rule, more indexes = slower insertions. If you can, consider archiving off outdated records to another table entirely. In prior workplaces, we've used an archival strategy of Last Month, Prior Three Months, Prior Six Months, each in separate tables. Another idea is to delete older records. Many environments simply don't need information beyond a certain date. Hanging on to logging records from three months ago is often overly expensive.

Finally, don't neglect the physical storage of your table. The thinner your records are, the less physical IO needs to occur to read (or for that matter, to insert) a record. You can store your indexes on a separate physical hard drive. If there's a lot of redundant data in your records storing the table compressed might actually be a speed increase. If you have a little cash to burn, consider the value of a good RAID array for striping your data.

So, to answer your basic question: it's a lot of records, but with a careful eye towards tuning, it won't be a problem.

回复收藏 0 原文

饮湿 2024-10-13 23:15:51

我有一个大约有 98M 行的表，并且整天都在发生插入/删除。我们将记录保存 90 天...我预计本月该表的行数约为 1 亿行。就我个人而言，我会以不同的方式设计数据库模式，但它是购买的，我们需要保持它的完整性，这样我们就不会失去任何供应商支持。

我们使用 mysql 复制（MASTER-MASTER）并在其中一个和多个上执行插入/删除。对对方执行查询。这确实有助于提高性能，因为在我们更改为使用复制之前，删除会锁定表并阻止查询。

使用此实现，我们没有遇到任何性能问题。

我还每周执行一次表优化......

回复收藏 0 原文

醉殇 2024-10-13 23:15:51

我认为这基本上取决于情况。您使用的是哪个版本的 MySQL、什么操作系统以及您使用的是 MyISAM 还是 innoDB 表？在 32 位和 64 位上也有所不同，并且根据您的日志记录而有所不同设置。 MySQL 手册说：

有效的最大表大小
MySQL数据库通常是确定的
受操作系统限制
文件大小，不是由 MySQL 内部决定的
限制

该页面上还有有关这些限制的更多详细信息。

回复收藏 0 原文

鸩远一方 2024-10-13 23:15:51

选择在单个表中放入多少列还取决于所表示的数据类型以及您对规范化的关心程度。有些关系可以很容易地用一张表来表示；其他操作需要在多个较小的表中完成，尤其是当数据集中混合存在一对一、一对多和多对多类型关系时。

http://en.wikipedia.org/wiki/Database_normalization

回复收藏 0 原文

肥爪爪 2024-10-13 23:15:51

不是确切问题的答案...

为什么您确信将较小的桌子放入一张大桌子中？
您所做的称为“垂直分区”，实际上非常有用，具体取决于您的情况。对于许多大型 TEXT 或 BLOB 字段，垂直分区可以将更多查询的数据物理地保存在一起并更快地访问。

请参阅：http://en.wikipedia.org/wiki/Partition_(database)

垂直分区涉及创建列数较少的表并使用额外的表来存储剩余列。规范化还涉及跨表的列拆分，但垂直分区超出了这一范围，即使已经规范化，也会对列进行分区。也可以使用不同的物理存储来实现垂直分区；例如，将不常用或非常宽的列存储在不同的设备上是一种垂直分区的方法。这种类型的分区显式或隐式地称为“行拆分”（行按列拆分）。垂直分区的常见形式是将表中的动态数据（查找速度慢）与静态数据（查找速度快）分开，其中动态数据不像静态数据那样经常使用。在两个新创建的表之间创建视图会恢复原始表，但会带来性能损失，但是在访问静态数据（例如用于统计分析）时性能会提高

另请参阅：http://dev.mysql.com/tech-resources/articles/performance-partitioning.html

回复收藏 0 原文