数据仓库项目的存储过程与 JDO

发布于 2024-08-19 04:43:19 字数 610 浏览 9 评论 0原文

过去我们通过存储过程来访问数据库。它们被视为管理数据的“更好”方式。我们将数据保存在数据库中，任何语言/平台都可以通过 JDBC/ODBC/等访问它。

然而，近年来，基于运行时反射/元数据的存储检索机制（例如 Hibernate/DataNucleus）已经变得流行。最初，我们担心它们会很慢，因为涉及额外的步骤（反射成本很高），以及当我们只需要一个字段时它们如何检索不必要的数据（整个对象）。

我开始计划一个使用 J2EE 的大型数据仓库项目，但我有点不确定是选择存储过程还是 JDO/JPA 等。最近，我一直在使用 Hibernate，说实话，我很怀念编写 CRUD 存储过程！

它本质上可以归结为：

存储过程
+ 可以在服务器上进行优化（尽管只是查询）
- 每个表可能有超过一千个存储过程：添加、删除、更新、getById 等。

JDO
+ 我不会在接下来的几个月里写parameters.add("@firstNames", customer.getFirstName()); ...
- 会比 SP 慢（但大多数支持分页）

在我的情况下你会选择什么？在这种情况下，我认为这是一个很大的问题。

谢谢，

约翰

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

南街女流氓 2024-08-26 04:43:19

“JDO - 会比 SP 慢（但大多数支持分页）”

这个假设通常是错误的。 SP 没有理由特别快。我已经做了一些测量，它们并不比数据库外部的代码快。

数据仓库的特点是仅插入加载和长时间运行的SELECT...GROUP BY...查询。

您不是在编写 OLTP 事务处理。您没有使用 3NF 作为防止更新/删除事务中出现更新异常的方法。

由于您正在进行批量插入，因此 SP 肯定会比批量加载实用程序慢。批量加载器通常是多线程的，并且会消耗所有可用的 CPU 资源。 SP是DB的一部分，只能共享有限的DB资源。

由于您主要执行SELECT GROUP BY，因此 SP 在这里也没有多大帮助。 SELECT 语句不会因包含在过程中而受益。

你不需要它们。他们没有帮助。

您可以轻松地对批量加载和查询进行基准测试，以证明 SP 没有帮助。

回复收藏 0 原文

那请放手 2024-08-26 04:43:19

Rod Johnson 在他的《J2EE Design and Development》中写了一篇非常清晰的关于 ORM/StoredProcedures 的分析。他说

存储过程只能在 J2EE 系统中用于执行始终大量使用数据库的操作，无论它们是在数据库中实现还是在与数据库交换大量数据的 Java 代码中实现。

当您计划实现数据仓库时，我认为存储过程方法是正确的选择。

回复收藏 0 原文

枕花眠 2024-08-26 04:43:19

我建议使用元数据来生成用于加载到数据仓库中的脚本。这使您可以通过使用专门的加载工具以及存储过程（如果您使用的是足够古老的数据库）来获得性能优势。另外，您可能最终会至少手工编写一些 SQL 代码。将通用脚本作为存储过程完成将允许您以相同的方式安排所有脚本，并且不必担心在重写某些生成的代码以使其运行得更好时更改它们的调用方式。

至于获取数据，如果您在 J2EE 中构建的是报告工具，那么使用 JDO 可能会更好。虽然我对报告方面不太熟悉，但我可以看到的一个好处是，允许您的最终用户更容易制作您事先没有预料到的自定义报告（尽管您仍然必须拥有对他们可以做的事情有一些限制，这样他们就不会在此过程中删除数据库）。

回复收藏 0 原文

~没有更多了~