Linq to Objects：过滤性能问题

发布于 2024-09-27 09:50:54 字数 512 浏览 4 评论 0原文

我正在考虑 linq 的计算方式，这让我想知道：

如果我写的

var count = collection.Count(o => o.Category == 3);

执行方式会与以下内容有所不同：

var count = collection.Where(o => o.Category == 3).Count();

毕竟， IEnumerable.Where() 将返回 IEnumerable; 没有实现 Count 属性，因此后续的 Count() 实际上必须遍历这些项目来确定计数，这会导致额外的时间都花在这上面了。

我编写了一些快速测试代码来获取一些指标，但它们似乎随机地互相击败。我最初不会在这里输入测试代码，但如果有人请求，我会输入它。

那么，我是否遗漏了一些东西？

原文

I was thinking about the way linq computes and it made me wonder:

If I write

var count = collection.Count(o => o.Category == 3);

Will that perform any differently than:

var count = collection.Where(o => o.Category == 3).Count();

After all, IEnumerable<T>.Where() will return IEnumerable<T> which doesn't implement Count property, so a subsequent Count() would actually have to walk through the items to determine the count which should cause extra time being spent on this.

I wrote some quick test code to get some metrics but they seem to beat each other at random. I won't put in the test code here initially, but if anyone requests, I'll get it in.

So, am I missing something?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

哽咽笑 2024-10-04 09:50:54

实际上，其中不会有太多内容 - 两种形式都会迭代集合，检查每个项目的谓词，并计算匹配项。两种方法都会传输数据 - 例如，它不像 Where 实际上构建所有匹配的内存列表。

第一种形式的间接层较少（薄），仅此而已。使用它的主要原因（IMO）是为了可读性/简单性，而不是性能。

回复收藏 0 原文

倾城°AllureLove 2024-10-04 09:50:54

正如乔恩·斯基特（Jon Skeet）所说，两种技术本质上都必须做同样的事情——枚举序列，同时在谓词匹配时有条件地增加计数器。两者之间的任何性能差异都应该很小：对于几乎所有用例来说都是微不足道的。如果有一个令牌获胜者，我会认为它应该是第一个，因为从反射器看来，采用谓词的Count重载使用了它自己的< code>foreach 进行枚举，而不是使用更明显的方式将工作卸载到流式 aWhere 到无参数Countas在你的第二个例子中。这意味着技术#1可能有两个次要性能优势：