mysql 7列 pk 与 1 列 md5 唯一约束

发布于 2024-08-07 23:26:24 字数 511 浏览 3 评论 0原文

我有一个非常大的表，目前大约有 7000 万行，并且每天都在以数千行的速度增长，这个模式现在每天都会发生变化，所以我正在转向分区表并重新设计 ddl。

该表基本上是 NOT NULL INTEGERS 的集合（有些中等，有些 INT，有些很小）需要对一组 7 列（表中的列更多）有一个唯一约束，这对于每次插入的计算非常昂贵，并且会进一步增加索引文件大小，因为我从不通过它检索，我更愿意删除它并以某种方式 md5/也许简单地连接值...还不知道。

问题是唯一可以容纳如此大的唯一数字的列类型是 varchar 我怀疑这个 PK 是否实际上会更好？同样，因为我将有一个主键“part_key”（site_id，id），所以我必须在分区设计中采取独特的约束，总结一下...... 我确信这不是一个新问题，但我无法找到任何比较两者的基准/文档，有人对这个问题有任何经验吗？问题是，当我从来没有通过 pk 或只是唯一字段的哈希值检索时，PK 是否真的应该是整个 8 个字段（请记住，该表可能有超过 100M 行） PS：检索主要由7列中的两列完成磁盘大小不是问题谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

偷得浮生 2024-08-14 23:26:24

在 mysql 进行分区修剪之前，我建议（gulp）对表进行非规范化以伪造分区。做一些类似对第一个值取模 32 并制作 32 个表的事情。

更新：显然mysql 5.1.6及更高版本确实支持修剪（http://dev.mysql.com/doc/refman/5.1/en/partitioning-pruning.html）所以我更强烈的建议是升级，然后允许mysql处理分区您，可能使用 7 列之一的哈希值。

回复收藏 0 原文

浮生面具三千个 2024-08-14 23:26:24

如果您可以找到与您的记录查找相匹配的良好散列，那么对每个分区应用唯一约束应该不是什么大问题。较小的分区大小将使您的独特约束更便宜。（如果我错了，我确信这里有人会教育我）。

我被困在 MySQL 5.0 上。我面临着手动分区几个超过 40M 行的表。我有一个可以在应用程序中进行哈希处理的文档 ID：floor(docID/10)%100。这可以给我 100 个分区，这应该可以显着减小我的索引大小。我对表进行了查询，并通过哈希计算了行数：

select count(docID), floor(docID/10)%100 as partno
from documents 
group by partno

幸运的是，我在第一次尝试时发现了一个非常均匀的分布。你自己的公式会不同，我不知道你的分布会是什么样的。您是否担心您的独特约束在分区时无法成立？

如果您可以利用 MySQL 分区，它将更强大并且对您的应用程序的影响更小。

If you can find a good hash that matches your record lookup, then applying your unique constraint on each partition shouldn't be that big of a deal. Smaller partition sizes will make your unique constraint less expensive. (If I'm wrong, someone here will school me I'm sure).

I'm stuck on MySQL 5.0. I'm facing manual partitioning a few tables over 40M rows. I have a document id that I can hash in my application: floor(docID/10)%100. This can give me 100 partitions and that should keep my index size down significantly. I did a query on the table and counted up the number of rows by hash:

select count(docID), floor(docID/10)%100 as partno
from documents 
group by partno

Luckily, I found a very even distribution on my first try. Your own formula will be different, I have no idea what your distribution would be like. Are you concerned that your unique constraint will not hold up in the face of partitioning?

If you can take advantage of MySQL partitioning, it will be more powerful and less of an impact on your application.

回复收藏 0 原文

~没有更多了~