当前位置：文江博客话题详情

2 关于数据库开发理念和最佳实践的问题

发布于 2024-10-07 21:55:12 字数 387 浏览 0 评论 0原文

关于 Web 应用程序的数据库的实现，哪一个最好：一个精简且非常小的数据库，只有裸露的信息，同时还有一个应用程序，根据需要，根据这些基本信息“重新计算”所有辅助信息，或者，一个数据库充满了之前已经计算出的所有辅助信息，但可能已经过时了？

显然，这是一个权衡，我认为任何人都会说这个问题的最佳答案是：“取决于”或“两者之间的混合”。但我真的不太舒服或没有足够的经验来单独推理这个主题。有人可以分享一些想法吗？

另外，另一个不同的问题：数据库应该是特定时刻的“快照”，还是应该积累之前时间的所有信息，以便回溯所发生的事情？例如，假设我正在对银行帐户进行建模。我应该只保留该人当天的余额，还是应该保留该人的所有交易，并从这些交易中推断出余额？

关于这类在数据库设计方面更深入的东西有什么指示吗？

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

兔小萌 2024-10-14 21:55:12

我的快速回答是将所有内容存储在数据库中。在谈论超大规模应用程序时，存储成本远远低于处理成本。在小规模应用程序中，数据会少得多，因此存储仍然是一个合适的解决方案。

大多数RDMS都非常擅长处理海量数据，因此当有数百万/万亿条记录时，仍然可以相对较快地提取数据，这对于每次手动处理数据来说就不是那么容易了。

如果您选择计算数据而不是存储数据，则处理时间的增加速度不会与数据大小的增加速度相同 - 数据越多，用户就越多。这通常意味着处理时间将乘以数据大小和用户数量。

processing_time = data_size * num_users

为了回答您的其他问题，我认为最好的做法是仅当数据达到如此高的值以至于处理时间将很长时才引入特定时刻的“快照”。

在计算大额金额（例如银行余额）时，最好将任何大量计算的结果及其日期戳存储到数据库中。这仅仅意味着他们不需要再次计算，直到它变得过时。

My quick answer would be to store everything in the database. The cost of storage is far lower than the cost of processing when talking about very large scale applications. On small scale applications, the data would be far less, so storage would still be an appropriate solution.

Most RDMSes are extremely good at handling vast amounts of data, so when there are millions/trillions of records, the data can still be extracted relatively quickly, which can't be said about processing the data manually each time.

If you choose to calculate data rather than store it, the processing time doesn't increase at the same rate as the size of data does - the more data ~ the more users. This would generally mean that processing times would multiply by the data's size and the number of users.

processing_time = data_size * num_users

To answer your other question, I think it would be best practice to introduce a "snapshot" of a particular moment only when data amounts to such a high value that processing time will be significant.

When calculating large sums, such as bank balances, it would be good practice to store the result of any heavy calculations, along with their date stamp, to the database. This would simply mean that they will not need calculating again until it becomes out of date.

回复收藏 0 原文

路还长，别太狂 2024-10-14 21:55:12

没有理由让预先计算的值过时。这就是触发器的用途（除其他外）。然而，对于大多数应用程序，除非您需要，否则我不会开始预先计算。可能计算速度一直都在。现在，在银行应用程序中，您需要几乎立即从数千甚至数百万条记录中进行预计算，是的，可以基于触发器设计预计算流程，以便在每次更改值时调整值。

至于是否只存储时间图片或历史值，这很大程度上取决于您存储的内容。如果与财务数据有关，请存储历史记录。当您接受审核时，您将需要它。顺便说一句，设计为存储截至操作日期的一些数据（这不是非规范化）。例如，您有一个订单，不要依赖客户地址表或产品表来获取有关产品运往何处或订购时的成本的数据。这些数据会随着时间的推移而变化，然后您的订单就不再准确。您不希望您的财务报告因 6 个月后价格发生变化而更改销售金额。

还有其他一些东西可能不需要历史存储。在大多数申请中，我们不需要知道您两年前是 Judy Jones，现在是 Judy Smith（HR 申请通常是一个例外）。

回复收藏 0 原文

各空 2024-10-14 21:55:12

我想说，一开始只是跟踪您需要的数据并即时执行计算，但在整个设计过程以及软件的测试/生产过程中，请记住，您可能必须切换到存储预先计算的数据某个时刻的值。如果需要，设计时能够迁移到该模型。

添加预先计算的值是听起来不错的事情之一（因为在许多情况下它很好），但可能不需要。保持设计尽可能简单。如果性能成为动态计算的一个问题，那么您可以向数据库添加字段来存储计算，并在夜间运行批处理以赶上并填充旧数据。

至于银行业的比喻，肯定会存储所有交易的完整记录。存储任何相关的数据。数据库应该是过去和现在数据的存储。审计跟踪等。“当前状态”可以即时计算，也可以在平面表中维护，并在写入其他表期间重新计算（触发器对于此类事情很有用），如果性能需要的话。

回复收藏 0 原文

暗恋未遂 2024-10-14 21:55:12

这取决于:) 在数据库中保留派生数据可能很有用，因为它使您能够针对它实施约束和其他逻辑。它还可以被索引，或者您可以将计算放入视图中。无论如何，请尝试坚持使用 Boyce-Codd / 第五范式作为数据库设计的指南。与您有时听到的相反，规范化并不意味着您不能存储派生数据 - 它只是意味着数据不应从同一个表中的非键属性派生。

从根本上来说，任何数据库都是特定时间点已知事实的记录。大多数数据库都包含一些时间组件，并且一些数据被保留，而另一些则没有 - 需求应该规定这一点。

回复收藏 0 原文