在 1 个查询中更新多行及其所有父行的多对多计数器缓存

类别表有一个 post_count 字段,用于缓存分配给特定类别的帖子数量。它还具有 MPTT 的 parent_idlftrght 列。

但它还有一个 under_post_count 字段,用于缓存分配给它或其任何子类别的不同帖子的数量。这很有用,因此您可以显示类别的分层列表,并在其旁边显示分配给该类别或其子级之一的帖子数量

我的应用程序已经达到这样的程度:在创建带有类别的帖子、编辑其类别或删除具有类别的帖子后,我有一个新旧类别的类别 ID 列表,其 post_count 字段需要更新。我希望接下来可以做的是在一个查询中,更新所有已识别类别及其所有父类别的 under_post_count 字段,以及分配给每个类别的不同帖子的数量或它的任何一个孩子

以下是创建表和类别的一些测试数据所需的 SQL:

CREATE TABLE `categories` (
  `parent_id` int(11) DEFAULT NULL,
  `lft` int(11) DEFAULT NULL,
  `rght` int(11) DEFAULT NULL,
  `name` varchar(255) NOT NULL,
  `post_count` int(11) NOT NULL DEFAULT '0',
  `under_post_count` int(11) NOT NULL DEFAULT '0',
  PRIMARY KEY (`id`)

CREATE TABLE `categories_posts` (
  `category_id` int(11) NOT NULL,
  `post_id` int(11) NOT NULL,
  PRIMARY KEY (`category_id`,`post_id`)

INSERT INTO `categories` (`id`, `parent_id`, `lft`, `rght`, `name`) VALUES
(1, NULL, 1, 8, 'Cat 1'),
(4, 1, 2, 3, 'Cat 1.1'),
(5, 1, 4, 5, 'Cat 1.2'),
(6, 1, 6, 7, 'Cat 1.3'),
(2, NULL, 9, 16, 'Cat 2'),
(7, 2, 10, 11, 'Cat 2.1'),
(8, 2, 12, 13, 'Cat 2.2'),
(9, 2, 14, 15, 'Cat 2.3'),
(3, NULL, 17, 24, 'Cat 3'),
(10, 3, 18, 19, 'Cat 3.1'),
(11, 3, 20, 21, 'Cat 3.2'),
(12, 3, 22, 23, 'Cat 3.3');

运行几次,为 categories_posts 表创建一些测试数据:

INSERT IGNORE INTO `categories_posts` (`category_id`, `post_id`) 
SELECT `id`, CEILING(10 * RAND()) FROM `categories` ORDER BY RAND() LIMIT 6


新一帅帅 2024-10-11 01:08:39

好吧,这里有几种给猫剥皮的方法(假设是 5.1 和触发器)

  • 您可以从应用程序层更新所有内容

  • 您可以触发对 post_count 的更新categories_posts 并触发更新(级联)从 categories


  • 最后,您可以触发来自 的所有更新>categories_posts

另外,根据类别的实际数量,您可能不需要将 under_post_count 反规范化为获取它应该相当容易且便宜 获取

SELECT c.id, SUM(cc.post_count) 
FROM categories c 
LEFT JOIN categories cc ON c.lft <= cc.lft AND c.rght >= cc.rght 
GROUP BY c.id;


SELECT c.id, COUNT(*) 
FROM categories c 
LEFT JOIN categories_posts cp ON c.id = cp.post_id 
GROUP BY c.id;


SELECT c.id, COUNT(*) 
FROM categories c 
LEFT JOIN categories cc ON c.lft <= cc.lft AND c.rght >= cc.rght 
LEFT JOIN categories_posts cp ON cc.id = cp.post_id
GROUP BY c.id;



UPDATE categories 
SET post_count = (SELECT COUNT(*) 
                  FROM categories_posts cp 
                  WHERE cp.post_id = categories.id)


under_post_count 的情况有所不同,因为 mysql 不喜欢听到在 where 部分提到目标表,因此你必须做一些像这样的怪物

UPDATE categories LEFT JOIN 
       (SELECT c.id, COUNT(*) AS result 
        FROM categories c 
        LEFT JOIN categories cc ON c.lft <= cc.lft AND c.rght >= cc.rght 
        INNER JOIN categories_posts cp ON cc.id = cp.post_id
        GROUP BY c.id) AS x ON categories.id = x.id
SET under_post_count = x.result

实际上,上述所有查询都存在错误 - 每当我加入类别和帖子时,我应该加入 cc.id = cp.category_id 而不是 cp.post_id,然后我没有检查。不想纠正...但仅限于最后一个查询

UPDATE categories LEFT JOIN 
       (SELECT c.id, COUNT(*) AS result 
        FROM categories c 
        LEFT JOIN categories cc ON c.lft <= cc.lft AND c.rght >= cc.rght 
        INNER JOIN categories_posts cp ON cc.id = cp.category_id
        INNER JOIN posts p ON cp.post_id = p.id
        WHERE p.status = 'published'
        GROUP BY c.id) AS x ON categories.id = x.id
SET under_post_count = x.result,
    post_count = (SELECT COUNT(*) 
                  FROM categories_posts cp 
                  WHERE cp.category_id = categories.id)


  • 上面的查询将修复 under_post_countpost_count 无论数据的状态如何,
  • 如果数据访问层被正确抽象,有些查询会更便宜,安全并且如果您可以保证原子性 - 这些查询只会对状态中的适当记录执行 post_count = post_count +/- 1 (类似于 under_post_count),
  • 以防您无法可靠地从应用程序级别模拟触发器,检查是否需要运行上述查询可能仍然更便宜(尽管 mysql 在这方面相当好,但如果您想与数据库无关),或者采用您需要的某些策略通常只需递增/递减计数器并仅定期重新计算数字。

