当前位置：文江博客话题详情

SQL 转向垂直记录

发布于 2024-09-29 18:44:55 字数 978 浏览 5 评论 0原文

我在 Informix v11.10 中有一个表（200 万行），复制（50+ 节点）环境

基本布局如下：
ID（PK）（整数）
除法（整数）
公司（int）
特征1 字符(20)
特征2 int
...
feature 200 char(2)

当前布局存在几个问题：有 200 个与此记录关联的“特征”，但在任何给定时间，其中可能有 5-10 个不是默认/空（每个记录不同）。

更新公司的所有记录有时意味着更新 10 万行，这会阻碍复制并且不易管理。

所以我对表格进行了如下更改：
ID（整数）
ID_TYPE（ID、部门或公司）
功能名称
feature_value

并且有另一个表，其中仅：
ID（整数）
除法（整数）
company (int)

因此，对于 ID #1，表中将有 10 行，关联的部门可能有一些记录，而公司可能有一些记录。 ID 记录将“覆盖”具有与部门匹配的相同 feature_name 的任何记录，并且部门将覆盖任何公司。

我创建了一个函数，当您传入 ID 和 feature_name 时，它会根据公司进行查询，然后根据部门进行查询，然后根据 ID 进行查询，并根据上述覆盖逻辑返回特征值。（基本上是一个有序的 foreach 循环）

然后我创建了一个如下所示的视图：
选择
my_func(feature1,ID) 作为feature1
my_func(feature2,ID) 作为特征2
...
my_func(feature200,ID) 作为 feature200
现在的

问题是，我为每个功能点击表 200 * 3（对于 ID、公司、部门）次，但这是行不通的，它会占用 CPU。新的记录数量约为 2000 万条，占用的空间要少得多。

有什么想法吗？我觉得我在某个地方缺少临时表的使用，这可以防止它需要访问 2000 万行表 600 次。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

讽刺将军 2024-10-06 18:44:55

您不应该为每个功能点击表 200*3，而是为视图的每一行点击 - 这是因为您的视图每行包含 200 个对 my_func 的调用（每个功能一个）。

这就引出了一个问题：您是否需要同时访问所有 200 个功能？从问题中所写的内容来看，听起来好像任何给定的 ID 可能只使用一小部分功能 - 任何特定于特定功能的查询可能应该直接访问 my_func （而不是通过视图）特征。

另一方面，如果必须检索所有 200 个特征，则基于对 my_func 的 200 次调用的视图将保证检索的每行有 600 次逻辑访问。相反，我建议重写视图以直接访问功能表，按 ID 分组，每个功能由 MAX(CASE WHEN... 类型结构派生。这仍然会导致 600 个物理行被读取，但对于每个返回的视图行最多只能进行 3 次逻辑读取 - 我希望这会表现得更好。

回复收藏 0 原文