当前位置：文江博客话题详情

从 Excel 查询 SQL 数据库的最快方法？

发布于 2024-12-13 11:39:15 字数 638 浏览 1 评论 0原文

我将从 Excel 中构建一些添加功能，以启用让用户从 Excel 执行临时报告。

最明显的方法是通过针对 ODBC 数据源的 SQL 语句，但我担心它不会很好地针对一个巨大的表进行扩展（即：对包含 50 GB 数据的表进行 SUM 或 COUNT 将导致性能问题）

我一直在考虑使用某种缓存技术，并且基本上在 RAM 中查询数据：http://www.yellowfinbi.com/wp_inmemory.pdf 这对于 RAM 来说可能是昂贵的，而且我还不太确定它的实现有多困难。

我的约束如下：

我应该能够从 Excel 查询任何类型的数据源（SQL Server、MySql）
将从 Excel 中执行临时报告（通过我的加载项）
查询结果应尽快发送回 Excel 单元格尽可能
我不想构建Datawarehouse或Olap立方体，但查询数据源

对于算法、实现技术（In-Ram 报告？）有什么建议，以便以最优化的方式执行 Excel 的即席查询？（除了优化的 SQL 代码！）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

迷荒 2024-12-20 11:39:16

PowerPivot 是一个选项，它是 Excel 的免费插件，针对以这种方式聚合（求和/计数）数据进行了优化。

它确实需要足够的 RAM 来缓存来自服务器的数据。

回复收藏 0 原文

等风也等你 2024-12-20 11:39:16

“（即：对包含 50 GB 数据的表执行 SUM 或 COUNT 将导致性能问题）”

这正是您可能不想在客户端缓存数据的原因。除非每个用户都有自己的带有 64 GB RAM 的小型超级计算机，否则您需要减少遇到的行数。

事实上，大多数用户发现大型报告毫无用处。我们的大脑只能在短期记忆中保存不到十几个值。因此，用户将无法从大量数据中收集到任何有用的信息。

他们需要执行分析，通常分析涉及聚合或过滤数据。

您可以使用其中之一或组合使用两个选项：

1) 实现预聚合数据的视图。许多数据库引擎都有类似物化视图或 SQL Server 中的无扩展选项之类的功能，基本上可以让您预先聚合报告。如果您试图避免这种情况，并让您的插件处理这种情况，那么您基本上是在构建 OLAP 引擎，并且应该查看 OLAP 系统使用的算法（这正是 PowerPivot 已经具备的算法）。

这个想法是让数据库引擎做它擅长的事情，将行数减少到更接近客户端需求的聚合量。这可确保您不会通过网络发送大量数据并要求客户端处理该数据并在 RAM 中缓存。

2) 使用 WHERE criteria/SP 参数传递过滤条件，以减少仅返回绝对需要的行数。这里有发挥真正创意的空间，比大多数人意识到的要多。例如，也许您的表包含一些用户无权访问的数据，因此与授权表（或您用于访问控制的任何机制）连接并过滤掉他无权访问的任何数据是有意义的。

要求用户选择过滤器将数据过滤到合理的数量。

用户想要的数据超出了他们的承受能力，这是很常见的情况。