当前位置：文江博客话题详情

MYSQL 中的规范化

发布于 2024-08-01 16:28:44 字数 36 浏览 3 评论 0原文

MySQL 中的规范化是什么？在什么情况下以及如何使用它？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

挥剑断情 2024-08-08 16:28:44

我尝试在这里用外行术语来解释标准化。首先，它适用于关系数据库（Oracle、Access、MySQL），因此它不仅仅适用于 MySQL。

规范化是为了确保每个表具有唯一的最小字段并消除依赖关系。想象一下，您有一个员工记录，每个员工都属于一个部门。如果将部门与员工的其他数据一起存储为字段，则会遇到问题 - 如果删除部门会发生什么？您必须更新所有部门字段，并且有可能出错。如果某些员工没有部门（也许是新分配的？）怎么办？现在将会有空值。

因此，简而言之，规范化是为了避免字段为空，并确保表中的所有字段仅属于所描述的数据的一个域。例如，在员工表中，字段可以是 id、姓名、社会安全号码，但这三个字段与部门无关。只有员工 ID 描述了该员工属于哪个部门。所以这意味着员工所在的部门应该在另一个表中。

这是一个简单的标准化过程。

EMPLOYEE ( < employee_id >, name, social_security, department_name)

正如所解释的，这没有标准化。规范化形式可能如下所示

EMPLOYEE ( < employee_id >, name, social_security)

，此处，Employee 表仅负责一组数据。那么我们在哪里存储员工属于哪个部门呢？在另一个表中

EMPLOYEE_DEPARTMENT ( < employee_id >, department_name )

这不是最佳的。如果部门名称变了怎么办？（这种情况一直在美国政府中发生）。因此最好这样做。

EMPLOYEE_DEPARTMENT ( < employee_id >, department_id )
DEPARTMENT ( < department_id >, department_name )

有第一范式、第二范式和第三范式。但除非你正在学习数据库课程，否则我通常只会选择我能理解的最规范化的形式。

I try to attempt to explain normalization in layman terms here. First off, it is something that applies to relational database (Oracle, Access, MySQL) so it is not only for MySQL.

Normalisation is about making sure each table has the only minimal fields and to get rid of dependencies. Imagine you have an employee record, and each employee belongs to a department. If you store the department as a field along with the other data of the employee, you have a problem - what happens if a department is removed? You have to update all the department fields, and there's opportunity for error. And what if some employees does not have a department (newly assigned, perhaps?). Now there will be null values.

So the normalisation, in brief, is to avoid having fields that would be null, and making sure that the all the fields in the table only belong to one domain of data being described. For example, in the employee table, the fields could be id, name, social security number, but those three fields have nothing to do with the department. Only employee id describes which department the employee belongs to. So this implies that which department an employee is in should be in another table.

Here's a simple normalization process.

EMPLOYEE ( < employee_id >, name, social_security, department_name)

This is not normalized, as explained. A normalized form could look like

EMPLOYEE ( < employee_id >, name, social_security)

Here, the Employee table is only responsible for one set of data. So where do we store which department the employee belongs to? In another table

EMPLOYEE_DEPARTMENT ( < employee_id >, department_name )

This is not optimal. What if the department name changes? (it happens in the US government all the time). Hence it is better to do this

EMPLOYEE_DEPARTMENT ( < employee_id >, department_id )
DEPARTMENT ( < department_id >, department_name )

There are first normal form, second normal form and third normal form. But unless you are studying a DB course, I usually just go for the most normalized form I could understand.

回复收藏 0 原文

∞觅青森が 2024-08-08 16:28:44

规范化不仅仅适用于 MYSql。它是一个通用数据库概念。

标准化的过程是
有效地组织数据
数据库。该组织有两个目标
标准化过程：消除
冗余数据（例如，存储
多个表中的相同数据）
并确保数据依赖性
sense（仅将相关数据存储在
桌子）。这两个都是有价值的目标
因为它们减少了空间量
数据库消费并保证数据
逻辑存储。

SQL 中的范式如下所示。

第一范式 (1NF)：关系是
如果它只有
单值属性，两者都不是
不允许重复或数组。
第二范式 (2NF)：关系
如果它在 1NF 中，则称其在 2NF 中
并且每个非关键属性都完全
功能依赖于初级
关键。
第三范式（3NF）：我们说
如果关系在 2NF 中，则该关系在 3NF 中并且
没有传递依赖。
Boyce-Codd 范式 (BCNF)：A
关系被认为是在 BCNF 中，如果并且
仅当其中的每个行列式
关系是候选键。
第四范式 (4NF)：关系
如果它在 BCNF 中，则称其在 4NF 中
并且不包含多值依赖。
第五范式（5NF）：关系是
称为 5NF 当且仅当每个
隐含了关系中的连接依赖性
通过关系的候选键。
域名密钥范式 (DKNF)：我们说
一个关系在 DKNF 中，如果它是
没有任何修改异常。
插入、删除和更新
异常情况正在修改
异常

另请参阅

数据库规范化基础知识

回复收藏 0 原文

倥絔 2024-08-08 16:28:44

这是一种通过消除重复来确保数据保持一致的技术。因此，如果数据库中相同的信息存储在多个表中，那么该数据库就不是标准化的。

请参阅有关数据库规范化的维基百科文章。

（这是关系数据库的通用技术，不是 MySQL 特有的。）

回复收藏 0 原文

以可爱出名 2024-08-08 16:28:44

在为应用程序创建数据库架构时，您需要确保避免任何信息存储在不同表的多个列中。

由于数据库中的每个表都标识应用程序中的重要实体，因此唯一标识符是它们的必备列。

现在，在决定存储模式时，正在识别这些实体（表）之间的各种关系，即一对一、一对多、多对多。

对于一对一的关系（例如 A
学生在大学中拥有独特的排名
类），同一个表可用于
存储列（来自两个表）。
对于一对多关系（例如
一个学期可以有多个
课程），外键正在
在父表中创建。
对于多对多关系（例如
一位教授照顾许多学生并且
反之亦然），第三个表需要
被创建（主键来自
两个表都作为复合键），以及
两个表的相关数据将
被存储。

一旦您处理了所有这些场景，您的数据库模式将标准化为 4NF。

回复收藏 0 原文

无语# 2024-08-08 16:28:44

在关系数据库领域
设计、规范化是一个系统化的过程
确保数据库的方法
结构适用于
通用查询并且免费
某些不受欢迎的
特征——插入、更新和
删除异常——这可能会导致
数据完整性丢失。[1] EF
Codd，关系理论的发明者
模型，引入了概念
正常化以及我们现在所知道的
1970年的第一个范式。[2] 科德
继续定义第二个和第三个
1971 年的范式，[3] 以及 Codd 和
雷蒙德·博伊斯 (Raymond F. Boyce) 定义了
Boyce-Codd 范式，1974 年。[4]
更高范式定义为
随后几年的其他理论家，
最近的是第六常态
由 Chris Date、Hugh 提出的形式
达尔文和尼科斯·洛伦佐斯
2002.[5]
通俗地说，关系数据库
表（计算机化表示
关系的）通常被描述为
如果是第三个则“标准化”
范式（3NF）。[6] 大多数 3NF 表
免于插入、更新和
删除异常，即大多数情况下
3NF 表遵循 BCNF、4NF 和
5NF（但通常不是 6NF）。
数据库设计的标准部分
指导意见是设计师应该
创建完全标准化的设计；
选择性反规范化可以
随后执行
性能原因。[7] 然而，一些
建模学科，例如
数据维度建模方法
仓库设计，明确推荐
非标准化设计，即设计
在很大程度上不遵守
3NF。[8]