当前位置：文江博客话题详情

表示关系数据库中的数字范围 (MySQL)

发布于 2024-11-04 18:45:08 字数 556 浏览 4 评论 0原文

我试图了解是否有任何标准的最佳实践方法可以在关系数据库（在本例中为 MySQL）中对数字范围进行建模，以及这实际上是否是明智的做法。

我将解释引发该问题的任务的背景。

我目前正在设计一个数据库，该数据库将模拟向客户分配标识符池的情况。

潜在标识符池的范围从 0 到大约 2^30

可以为给定客户分配任意数量的标识符，从单个标识符到多个连续块中的数百万个标识符。

给定的标识符只能分配给单个客户（即，它是一对多关系）

显然，将有一个客户表和一个包含客户键的标识符表。

复杂性在于如何对标识符进行建模：

选项一是用一行代表单个标识符。这将导致表中可能出现大量行，但会使得搜索谁拥有哪个标识符以及给定标识符是否正在使用变得微不足道。

第二个（我认为更有希望）选择是让一行代表一系列具有最小值和最大值的值。这将使查询变得更加复杂（我假设用于检查标识符是否正在使用的查询将查询“最小值低于 X”和“最大值高于 X”的范围），但会导致远行数更少，可能更容易管理和更新。

我欢迎任何关于这是否是一个好方法的意见，如果不是，是否有我缺少的明显更好的方法。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吹梦到西洲 2024-11-11 18:45:08

如果范围不相交，则您可以将它们存储为 INT 值对：

CREATE TABLE customer_range
        (
        customerId INT,
        rgStart INT,
        rgEnd INT,
        PRIMARY KEY (customerId, rgStart),
        UNIQUE KEY (rgStart)
        )

要查询号码所属的客户，请使用以下命令：

SELECT  customerId
FROM    customer_range
WHERE   rgStart <= $mynum
        AND rgEnd >= $mynum
ORDER BY
        rgStart DESC
LIMIT 1

If the ranges do not intersect, then you may store them as pairs of INT values:

CREATE TABLE customer_range
        (
        customerId INT,
        rgStart INT,
        rgEnd INT,
        PRIMARY KEY (customerId, rgStart),
        UNIQUE KEY (rgStart)
        )

To query the customer a number belongs to, use this:

SELECT  customerId
FROM    customer_range
WHERE   rgStart <= $mynum
        AND rgEnd >= $mynum
ORDER BY
        rgStart DESC
LIMIT 1

回复收藏 0 原文

紫罗兰の梦幻 2024-11-11 18:45:08

如果我理解正确，您需要使用多个范围，这可能会变得棘手。您可能想查看 PostgreSQL 9.2 范围类型。它们看起来与您想要做的事情相关。

在现实世界中，范围可以重叠、相互包含或不重叠，并且它们可以是开放的或封闭的，使得范围检查查询可能复杂且容易出错。范围类型消除了大部分复杂性，并且它们由索引本身支持。

https://wiki.postgresql.org/images/7 /73/Range-types-pgopen-2012.pdf

最良好的祝愿，

尼克

回复收藏 0 原文

阳光的暖冬 2024-11-11 18:45:08

通常，我不会仅仅为了减少行数而尝试减少行数 - 原则上，只要您的查询命中，具有 10 亿行的索引良好的表应该与具有 100 行的表一样快索引。

我会更多地处理您可能想要运行的实际查询，并在此基础上设计解决方案。例如，您想要列出属于单个客户的所有 ID 吗？您想检查哪个客户拥有多个 ID 吗？您想知道客户拥有多少个 ID 吗？
如果您有“范围”表，则后者有点棘手 - 您必须计算每个范围中的 IP 数量，而不是执行 “从 customer = 1 的范围中选择 count(*)”为客户，并将它们相加。不是火箭科学，但在现实世界中可能会慢一些......

回复收藏 0 原文

尝蛊 2024-11-11 18:45:08

如果您创建一个像这样的表

table ids

id_start not null unsigned integer /*not autoincrement!*/
id_end not null unsigned integer 
customer_id unsigned integer not null
foreign key FK_customer (customer_id) REFERENCES customer.id
primary key (id_start, id_end)
key id_end (id_end)

来简单地检查可用密钥

SELECT count(*) as occupied FROM ids
WHERE 100 between id_start and id_end;

现在您可以通过执行To check a free range do

SELECT count(*) as occupied FROM ids
WHERE NOT ('$low' > id_end) AND NOT ('$high' < id_start)

If you make a table like so

table ids

id_start not null unsigned integer /*not autoincrement!*/
id_end not null unsigned integer 
customer_id unsigned integer not null
foreign key FK_customer (customer_id) REFERENCES customer.id
primary key (id_start, id_end)
key id_end (id_end)

Now you can simply check for a free key by doing

SELECT count(*) as occupied FROM ids
WHERE 100 between id_start and id_end;

To check a free range do

SELECT count(*) as occupied FROM ids
WHERE NOT ('$low' > id_end) AND NOT ('$high' < id_start)

回复收藏 0 原文

旧时浪漫 2024-11-11 18:45:08

一种可能性是使用正则表达式来表示标识符池，根据需要在字符串和数字之间进行转换。这里的问题是找到给定标识符列表的正则表达式。这可以使用 Aho-Corasick 算法自动化。仅当这些 ID 池看起来大部分相同时，这才实用。显然，如果它们是随机分配的，那么将很难找到比一长串 ORd 文字更好的正则表达式。

回复收藏 0 原文

~没有更多了~