MySQL Char() 或其他字段的顺序 UID 集生成

发布于 2024-10-02 13:37:05 字数 557 浏览 9 评论 0原文

尝试过谷歌搜索，但是：

问题：从外部为 MySQL 字段生成顺序 UID 值的最佳方法，该字段必须可表示为字符串。

原因：
从 char[0] 向前搜索字段索引时，用于磁盘顺序/页面附加插入的通用顺序 UUID-ish 值可提高写入性能，并添加日期前缀以提高读取速度。该列将被索引，但会寻找最佳数据来提高索引读取和表写入性能，而不是普通的旧 UUID。

我最初的想法是在固定宽度的字符字段中附加或替换 UUIDv4 生成的字符串的某些部分（即 [Unix epoch][remaining UUID4]）的某个粒度（可能是填充纪元）的日期，但我我不确定这是否具有所需的页内/磁盘排序结果和索引搜索结果。例如：

12904645950049bceba1cc24e80806dd

这些值必须独立于 MySQL 本身，因此使用 UUID 和时间戳而不是自动递增的某种变体。

任何了解 MySQL 索引内部结构的人有什么建议（对于 InnoDB 表）吗？

艾登

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

柳若烟 2024-10-09 13:37:05

可能有点离题，但请看一下 Twitter 的雪花。他们说它是：（

大致）时间排序（有助于避免昂贵的随机主键 BTREE 更新）
直接可排序
紧凑

更不用说其他功能（HA 等）。您可以修改他们的算法，也可以直接使用它。

整个 UID 最多只使用 64 位空间，所以我猜索引会非常有效 - 请参阅 http://www.mysqlperformanceblog.com/2006/10/03/long-primary-key-for-innodb-tables/ （反例）。

回复收藏 0 原文

南汐寒笙箫 2024-10-09 13:37:05

我认为您可能需要更具体地说明您要解决的问题（实际问题是什么 - 为什么不使用 auto_increment？，您建议的模式是什么？等）。
回答你的内部问题：

InnoDB 将数据存储在索引（聚集索引）中，以 16K 页为单位。

不按顺序插入的风险至少有两方面：

如果内存不合适，您可能需要执行随机 IO 从磁盘加载页面，以将值插入到该页面。
页面中可能没有剩余空间（InnoDB 填充了 93%，并留下了一个小间隙用于更新），这可能会导致页面需要拆分。更多拆分页面 = 碎片/对内存等事物的优化使用较少。

因此，我认为只要您近似连续，至少 (1) 不是主键索引的问题（对于任何唯一索引仍然可能如此）。您只需要担心（2）。

为什么我说理解这个问题很重要，因为除了长 GUID 之外，还有很多方法可以做到这一点。首先，MySQL 中的 BIGINT 比您可能使用的任何数据类型都要小，但范围为 18 quintillion。您可以一次将 N 千个密钥空间的“块”分配给工作节点，并保证没有重复项。如果工作节点崩溃并且没有使用它分配的所有块，那又怎样。没关系。

回复收藏 0 原文

灰色世界里的红玫瑰 2024-10-09 13:37:05

查看这个问题。它可能没有详细说明 MySQL 索引的具体用途，但它确实为您提供了一些性能数据以及生成 Seq 的代码。 UID。

看来 MySQL 索引极大地受益于顺序 ID，并且根据 MySQL 索引依赖于磁盘排序（请参阅部分：B 树索引特征）来查找相关结果。

根据记忆，MySQL 索引（至少对于字符串索引）首先依赖于字段的字母数字排序，即“哦，它以 A 开头？我有以 A 开头的数据，我会为你获取它。 .. ETC。”而不是对每个字段进行全文扫描。

按顺序输入 UID 意味着索引不会首先按“字母顺序”对结果重新排序，或者至少显着缩短该时间，因此具有上述性能优势。

（不是真正的解决方案，但至少是一个答案。）

回复收藏 0 原文

初心 2024-10-09 13:37:05

我所做的是使用固定宽度字符字段并将随机 UUID 字符串附加到当前时间（以毫秒为单位）。这很好，因为即使您的服务器在同一毫秒内被访问两次，它仍然（可能）是唯一的。我假设如果您有大量服务器负载，这可能会提供多个 id，但如果担心这一点，您可以检查是否已经创建了具有此 uuid 的行。

PHP：

$date = new DateTime();
$UUID = uniqid( $date->format('Uu'), FALSE);  // For less length
$UUID = uniqid( $date->format('Uu'), TRUE);   // For more length

这是我在我的（很少使用的）服务器上使用的。但它应该能够承受更大的负载。正如我所说，要克服创建两个相同密钥的微小可能性，请检查它是否已被使用并分配一个新密钥。（这种情况不应该经常发生）

What I do is I use a fixed width character field and perpend a random UUID string to the current time (in milliseconds). This is nice because even if your server is accessed twice in the same millisecond it will still (likely) be unique. I assume if you have a massive server load this could give multiple id's but if this is worried about you could check to see if a row with this uuid has already been created.

PHP:

$date = new DateTime();
$UUID = uniqid( $date->format('Uu'), FALSE);  // For less length
$UUID = uniqid( $date->format('Uu'), TRUE);   // For more length

This is what I use on my (rarely used) server. But it should hold strong for bigger loads. As I said to overcome the slight chance that two identical keys are created check to see if it has already been used and assign a new one. (this shouldn't happen too often)

回复收藏 0 原文

~没有更多了~