在 Sql Server 或 .Net 中执行数据分析？

发布于 2024-08-07 16:30:40 字数 754 浏览 6 评论 0原文

我需要执行一些数据分析。平均而言，它会涉及 50K-150K 行。我需要根据五个不同的标准从这些行中提取 Sum(X) 和 Count(X) 的总和。有两种方法可以实现这一目的：

编写 10 个不同的查询，每个查询都旨在使用 Sum() 或 Count() 聚合 X 列中的数据。运行每一个并使用 SqlCommand.ExecuteScalar() 检索结果。
创建一个自定义对象以包含评估不同条件所需的所有不同参数。使用 SqlCommand.ExecuteDataReader() 运行一个查询，该查询将返回组成包含所有不同条件子集的超集所需的所有数据。将 DataReader 中的每一行读取到一个新对象中，并将每一行添加到 List 集合中。检索完所有数据后，使用 Linq-to-Object 根据不同条件确定所需的不同 Sum() 和 Count() 值。

我知道我可以尝试每一个，看看哪一个最快，但我对社区关于哪一个可能更快的建议感兴趣。假设 Sql Server 和 Web Server 各自运行在自己的计算机上，并且各自具有足够的内存。

现在我倾向于选项 1。即使对数据库有更多的查询，数据库本身也会完成所有的聚合工作，并且在 Sql Server 和 Web Server 之间传递的数据很少。使用选项 2，只有一个查询，但它将向 .Net 传递大量数据，然后 .Net 将必须完成与聚合函数相关的所有繁重工作（尽管我不这样做）有任何基础，我怀疑 Sql Server 在运行这些类型的大聚合函数方面更有效）。

关于走哪条路有什么想法（或者我缺少的第三个选择）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心作怪 2024-08-14 16:30:40

数据库通常是分析此类数据的最佳选择，我会选择#1。

不过，我还会考虑第三种选择，即创建一个传递给 SQL 的查询（而不是十个）。这可能涉及将 CASE 语句放入聚合函数中，以便您可以在一次数据传递中完成所有工作。

考虑执行 PIVOT 的旧方法：

SELECT 
   SUM(CASE WHEN ConditionX = 1 THEN SomeField END) AS SUM1
   SUM(CASE WHEN ConditionX = 2 THEN SomeField END) AS SUM2
FROM SourceData
;

The database is generally the best option for analysing data like this, and I'd go for #1.

However, I'd also consider a third option, in which you create a single query that you pass to SQL (instead of ten). This could involve putting CASE statements in the aggregate functions, so that you can do all the work in a single pass of the data.

Consider the old way of doing PIVOT:

SELECT 
   SUM(CASE WHEN ConditionX = 1 THEN SomeField END) AS SUM1
   SUM(CASE WHEN ConditionX = 2 THEN SomeField END) AS SUM2
FROM SourceData
;

回复收藏 0 原文

西瑶 2024-08-14 16:30:40

你知道，我会选择选项 1。在我看来，50-150k 行实际上并不是那么多行，特别是如果你没有太多列的话。

一旦你开始谈论数百万行，我就会开始考虑优化。

另一件事：与数据库一样，确保您的查询正确命中索引。这比你们两个想法之间的差异更重要。

回复收藏 0 原文

~没有更多了~

关于作者

伏妖词

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

在 Sql Server 或 .Net 中执行数据分析？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚守退让之实

小兔几

mb_3y7WUgWY

友情链接

在 Sql Server 或 .Net 中执行数据分析？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚 守退让之实

小兔几

mb_3y7WUgWY

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

秉忠贞之诚守退让之实