当前位置：文江博客话题详情

database-design MySQL database-normalization

动态规范化表是否实用？

发布于 2024-11-15 04:07:29 字数 529 浏览 2 评论 0原文

假设我的数据库跟踪鸟类目击事件（注：我实际上是在刮木桶底部的例子）。

这些字段是：

sighting_id | common_name | park_name | location | time | etc....

尽管我假设公园始终位于同一位置，但该网站就像一个电子表格。用户为每个条目输入park_name 和location。另请注意，我的实际模式还有其他字段也依赖于类似的“公园名称”（例如州）。

我没有办法让用户预定义公园，所以我无法提前知道它们。我是否应该尝试动态规范化这些数据？例如，我的程序是否应该自动填充 parks 表，用 park_id 替换观鸟表中的 park_name 和 location 列？

我主要担心的是表现。列出每个目击事件需要加入填充公园和位置。此外，动态管理几乎肯定需要比节省的资源更多的资源。我可能需要一个 Cron 工作来消除孤立的 Parks，因为它们可能会在多次目击中被引用。

Let's say my database tracks bird sightings (Note: I'm really scraping the bottom of the barrel for examples).

The fields are:

sighting_id | common_name | park_name | location | time | etc....

Although I'm assuming that a park will always be in the same location, the website is like a spreadsheet. The user enters park_name and location for every entry. Also please note that my actual schema has other fields that are dependent on the analogous "park name" as well (e.g. state).

I do not have a way for the user to predefine parks, so I can't know them ahead of time. Should I even attempt to dynamically normalize this data? For example, should my program automatically populate a parks table, replacing the park_name and location column in the bird sighting table with a park_id?

I'm worried about performance, mostly. Listing every sighting would require a join to populate park and location. Also, dynamically managing this would almost certainty require more resources than it would save. I would probably need a Cron job to eliminate orphaned Parks, since they may be referenced in multiple sightings.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

暮年慕年 2024-11-22 04:07:29

这有点取决于您的使用情况。标准化方法（公园是一张桌子）将使以下查询变得更容易：

每个公园有多少次观鸟
在哪个公园您最有可能看到鸟 XYZ
可能还有很多这样的查询

但是是的，你确实遇到了一些棘手的问题。 “如果公园 XYZ 不存在，则将其插入公园表”的模式会遇到您必须处理的竞争条件。

现在，我们来谈谈反对规范化的一些论点……大多数客户数据库可能将我的街道地址存储为“123 Foo Street”，而不动态规范化街道名称（我们可以有一个街道表并将“Foo Street”放在那里，然后引用为什么我要提出这一点，是为了表明即使是讨厌任何重复数据的人也可能会承认有一条线你不一定必须跨越

另一个愚蠢的例子是我们可能会分享。我们真的需要一个包含唯一姓氏和姓氏的表吗？从其他表中获取外键可能对某些应用程序很有帮助，但对于 99% 的应用程序来说，这太过分了，而且性能较差，几乎没有任何好处。

那么我希望如何从表中查询数据。老实说，在这种情况下，我可能会为公园做一个单独的表，但在其他情况下，我选择不这样做

。。

回复收藏 0 原文

旧时浪漫 2024-11-22 04:07:29

我对原始“公园”示例的两点看法（相对于OP的实际问题）：

反对尝试自动标准化公园和位置列的决定性论点是可用性：当数据以可编辑的类似电子表格的格式呈现给用户时，他们自然会假设每一行都可以独立编辑，因此如果某些列例如因为“位置”是实际上与公园有关，而不是与行有关。

处理此类情况的典型模式是仅提示用户输入公园的详细信息，并在输入新公园时在“公园”表中创建一行。例如，如果公园列包含一个下拉框，则最后一个选项可以是“添加新公园”。或者，当用户输入无法识别的公园名称时添加一个新公园，但仍然让用户清楚正在创建一个新公园。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

苦中寻乐

文章 0 评论 0

lueluelue

文章 0 评论 0

嗼ふ静

文章 0 评论 0

王权女流氓

文章 0 评论 0

与花如笺

文章 0 评论 0

残酷

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文