当前位置：文江博客话题详情

database-design multi-tenant

多租户数据库：为什么在每个表中放置一个 TenantID 列？

发布于 2024-08-11 04:21:20 字数 363 浏览 8 评论 0原文

我看过的关于多租户数据库模型的每个教程都告诉您将 TenantID 放入每个表中：

zoos
-------
id
zoo_name
tenant_id

animals
-------
id
zoo_id
animal_name
tenant_id

但是，这对我来说似乎多余。为什么不将 tenant_id 列添加到 zoos 表中并利用 zoos 和 animals 之间的外键关系？

您是否将 tenant_id 添加到每个表只是为了防止连接变得过于疯狂？它是针对错误的防范措施吗？性能考虑？

Every tutorial I've seen about Multitenant database models tells you to put the TenantID in every single table:

zoos
-------
id
zoo_name
tenant_id

animals
-------
id
zoo_id
animal_name
tenant_id

However, this seems redundant to me. Why not add the tenant_id column to just the zoos table and exploit the foreign key relationship between zoos and animals?

Do you add tenant_id to every table just to keep the joins from getting too crazy? Is it a safeguard against bugs? A performance consideration?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（6）

情绪操控生活 2024-08-18 04:21:20

如果您的关键设计考虑因素之一是安全性（具体来说，一个客户端在访问另一客户端的数据时无法进行任何操作），那么，根据您实现此安全性的方式，可能有必要在每个表中粘贴该限定列。此处描述的一种此类策略需要在每个表上构建一个视图；假设每个表都包含一个tenantId列，那么如果配置正确，每个视图都可以包含“WHEREtenantId = SUSER_SID()”子句（当然，您配置数据库以便客户端只能访问视图）。

另一个因素（如我当前的工作）是加载仓库数据 (ETL)。表根据tenantId进行分区（我们使用表分区，但分区视图也可以工作），并且可以轻松地为客户端加载或卸载数据，而不会严重影响任何其他客户端。

但与以往一样，这涉及到很多“这取决于情况”。如果当前没有明确的需求，并且未来需求的可能性非常低，则将该列标准化。只是要意识到，它更多的是物理实现的设计，而不是概念或逻辑数据库设计。

回复收藏 0 原文

蓝海 2024-08-18 04:21:20

它的存在是为了方便和性能 - 在标准化方面你是绝对正确的，它只需要进入顶部。那么问题就变成了，要获取一些数据（例如动物园 -> 动物 -> 食品 -> 供应商），您必须对理论上非常简单的查询进行极其复杂的连接。

因此，在现实世界中，人们必须妥协——问题就变成了妥协的地点和程度。

请参阅这篇文章也许标准化并不正常 - 及其结论：

正如那句老话
去，正常化直到疼痛，
反规范化直到它起作用

开始探索该主题的地方

回复收藏 0 原文

ゃ人海孤独症 2024-08-18 04:21:20

如果我的tenantID位于层次结构的顶部（即动物园级别），那么您需要考虑几个问题。

层次结构的顶部永远不会改变，例如，如果您需要在动物园级别之上的树上添加一个节点（例如区域 -> 动物园 -> 动物），那么每次都会强制重新组织。
对于某些查询，您将被迫从层次结构的顶部开始，即给我一个所有可用动物的列表将迫使您从树的顶部开始
为什么不使用模式？每个租户在自己的模式中都是隔离的。这也将很好地分离数据集。

回复收藏 0 原文

落墨 2024-08-18 04:21:20

我首先想到的是查找 animals > 的速度较慢。动物园>租户不仅仅是动物>租户。这很可能是您经常执行的查找（例如，“获取某个租户的所有动物，无论动物园如何”）。

对于中小型应用程序，您可以采用更标准化的结构，但为了提高效率，您应该使用无关的数据（一般来说，多租户应用程序并不小）。只要确保它不会“不同步”，这是冗余数据带来的风险。

回答你的最后一段，原因是性能，纯粹而简单。连接并不是坏事；它们可以帮助您将一份数据保存在一个地方而不是三个地方。这绝对不是为了防止错误。将 tenant_id 字段添加到更多表中会增加出现错误的风险（尽管对于永不更改的 id，这不会是一个大问题）。

回复收藏 0 原文

游魂 2024-08-18 04:21:20

那么，鲍勃可能在第一动物园拥有一只长颈鹿，而乔可能在同一动物园拥有一只狮子。
他们不应该查看彼此的数据。

回复收藏 0 原文

音盲 2024-08-18 04:21:20

N1 的原因是为了安全性。

安全性需要成为多租户应用程序中的一个强有力的概念。

假设您授予用户修改动物的能力。
您创建一个带有选择的表单，显示当前租户的动物园。
如果用户破解表单并传递另一个租户的动物园 ID，会发生什么？

动物将被转移到另一个租户的另一个动物园！！

这对于多租户应用程序来说是真正的痛苦！

回复收藏 0 原文

~没有更多了~

关于作者

我是有多爱你

暂无简介

文章

评论

28 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

浪子阿飞

文章 0 评论 0

JK.Yang

文章 0 评论 0

人间不值得

文章 0 评论 0

静待花开

文章 0 评论 0

只涨不跌

文章 0 评论 0

污浊的双黑

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文