当前位置：文江博客话题详情

MySQL database normalization

是否规范数据库？只读MyISAM表，性能是主要优先考虑（MySQL）

发布于 2024-09-01 18:58:15 字数 433 浏览 3 评论 0原文

我正在将数据导入到未来的数据库，该数据库将有一个静态 MyISAM 表（只能从中读取）。我选择 MyISAM 是因为据我了解它更快地满足我的要求（我对 MySQL / SQL 完全没有经验）。

该表将包含各种列，例如 ID、姓名、性别、电话、状态...以及国家/地区、城市、街道列。现在的问题是，我应该为最后 3 列创建表（例如 Country: Country_ID、Country_Name）并通过 ID 在主表中引用它们（规范化...[?]），还是将它们存储为 VARCHAR主表（显然有重复项）？

我主要关心的是速度 - 由于表不会被写入，数据完整性不是优先考虑的问题。唯一的操作是选择特定行或搜索符合特定条件的行。

如果我只使用 VARCHAR，按“国家/地区”、“城市”和/或“街道”列（以及同一搜索中的其他列）搜索是否会更快？

编辑：该表大约有 30 列和大约 10m 行。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

若水微香 2024-09-08 18:58:15

如果进行规范化，搜索速度会更快，因为数据库只需比较整数而不是字符串。表数据也会更小，这使得搜索速度更快，因为可以一次将更多数据加载到内存中。

如果您的表索引正确，那么无论哪种方式都会非常快 - 您可能不会注意到显着的差异。

您可能还想查看全文搜索如果您发现自己写的是LIKE '%foo%'，因为后者将无法使用索引并会导致全表扫描。

回复收藏 0 原文

小情绪 2024-09-08 18:58:15

我会尽力给您提供比通常的“这取决于情况”答案更多的内容。

#1 - 对于小 N 来说一切都很快 - 如果您的行数少于 100,000 行，只需将其平坦加载，根据需要对其进行索引，然后继续执行更高优先级的操作。

将所有内容保持在一张表中可以更快地读取所有内容（所有列），但是要查找或搜索它，您通常需要索引，如果您的数据非常大，并且具有冗余的城市和国家信息，那么使用代理外键可能会更好分成单独的表，但你不能真正说硬和快。

这就是为什么几乎总是使用某种数据建模原则 - 通常使用传统的标准化（例如实体关系）或维度（例如 Kimball） - 这两种情况下的规则或方法旨在帮助您对数据进行建模，而无需预测每个用例。显然，了解所有使用模式将使您的数据模型偏向于支持它们 - 因此大量聚合和分析是使用非规范化维度模型的有力指标。

因此，这实际上在很大程度上取决于您的数据配置文件（行宽和行数）和使用模式。

回复收藏 0 原文

長街聽風 2024-09-08 18:58:15

不幸的是，除了通常的“这取决于情况”之外，我没有更多的答案。

根据实际搜索的需要进行尽可能多的标准化。如果您从未真正搜索过居住在萨克拉门托榆树街或丹佛枫树大道上的人，那么任何使这些列正常化的努力都几乎是浪费的。通常，您会标准化类似的内容以避免更新错误，但您已经声明数据完整性不是一个风险。

像鹰一样观察你的慢查询日志！这会告诉您需要标准化什么。对这些查询执行EXPLAIN，并确定是否可以添加索引来改进它，或者是否需要标准化。

我使用过一些我们称之为“超标准化”的数据模型。它们采用所有正确的范式，但通常用于我们使用数据的方式不需要它的事情。这些数据模型很难一眼理解，而且非常烦人。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

22 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

留蓝

文章 0 评论 0

18790681156

文章 0 评论 0

zach7772

文章 0 评论 0

Wini

文章 0 评论 0

ayeshaaroy

文章 0 评论 0

初雪

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文