连接表本身 - 性能

发布于 2024-12-23 17:00:00 字数 364 浏览 1 评论 0原文

我想要一些有关以下加入的帮助。我有一张表（大约有 2000 万行），其中包含：

MemberId（主键）| ID（主键）|交易日期 |余额

我想在一次查询中获取所有客户的最新余额。我知道我可以做这样的事情（我只是凭记忆写的）。但这种方式实在是太慢了。

SELECT * 
FROM money 
WHERE money.Id = (SELECT MAX(Id) 
                  FROM money AS m 
                  WHERE m.MemberId = money.MemberId)

还有其他（更快/更智能）的选择吗？

原文

I would like some help with the following join.
I have one table (with about 20 million rows) that consists of:

MemberId (Primary Key) | Id (Primary Key) | TransactionDate | Balance

I would like to get the latest Balance for all the customers in one query.
I know I could do something like this (I just wrote it from my memory). But this way is terribly slow.

SELECT * 
FROM money 
WHERE money.Id = (SELECT MAX(Id) 
                  FROM money AS m 
                  WHERE m.MemberId = money.MemberId)

Are there any other (faster/smarter) options?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

避讳 2024-12-30 17:00:00

在我经历过的所有优化教程和截屏视频中，连接总是比子查询更受青睐。使用子查询时，每次比较都会执行子查询，而连接只执行一次。

SELECT * 
FROM money m
INNER JOIN (
    SELECT memberId, MAX(id) AS maxid
    FROM money
    GROUP BY memberId
) mmax ON mmax.maxid = m.id AND mmax.memberId = m.memberId

In all optimization tutorials and screencasts that I've endured through, joins are always favoured over subqueries. When using a sub-query the sub-query is executed for each comparison, where as with a join only once.

SELECT * 
FROM money m
INNER JOIN (
    SELECT memberId, MAX(id) AS maxid
    FROM money
    GROUP BY memberId
) mmax ON mmax.maxid = m.id AND mmax.memberId = m.memberId

回复收藏 0 原文

扎心 2024-12-30 17:00:00

加入并不是解决此问题的最佳方法。考虑使用 GROUP BY 子句筛选每个成员的最后一笔交易，如下所示：

~~SELECT MemberId, MAX(Id), TransactionDate, Balance FROM Money GROUP BY MemberId~~

UPDATE

正如库尔德工人党指出的，平衡将是随机选择的。看来您毕竟必须执行某种连接。考虑这个选项：

SELECT MemberId, Id, TransactionDate, Balance FROM money WHERE Id IN (
    SELECT MAX(Id) FROM money GROUP BY MemberId
)

JOINing is not the best way to go about this. Consider using a GROUP BY clause to sift out the last transaction for each member, like this:

~~SELECT MemberId, MAX(Id), TransactionDate, Balance FROM money GROUP BY MemberId~~

UPDATE

as PKK pointed out, balance will be chosen randomly. It looks like you'll have to perform some sort of join after all. Consider this option:

SELECT MemberId, Id, TransactionDate, Balance FROM money WHERE Id IN (
    SELECT MAX(Id) FROM money GROUP BY MemberId
)

回复收藏 0 原文

过期以后 2024-12-30 17:00:00

另一种选择是在左连接中查找 NULL 值：

SELECT m1.*
  FROM money m1
  LEFT JOIN money m2 ON m2.memberId = m1.memberId AND m2.id > m1.id
 WHERE m2.memberId IS NULL

但是当然 Umbrella 的答案更好。

Other option is to lookup for NULL values in a left join:

SELECT m1.*
  FROM money m1
  LEFT JOIN money m2 ON m2.memberId = m1.memberId AND m2.id > m1.id
 WHERE m2.memberId IS NULL

But of course Umbrella's answer is better.

回复收藏 0 原文

~没有更多了~

关于作者

霓裳挽歌倾城醉

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

连接表本身 - 性能

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

连接表本身 - 性能

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。