Knapsack

发布于 2025-02-22 13:01:21 字数 10573 浏览 0 评论 0 收藏 0

在一次抢珠宝店的过程中，抢劫犯只能抢走以下三种珠宝，其重量和价值如下表所述。

Item(jewellery)	Weight	Value
1	6	23
2	3	13
3	4	11

抢劫犯这次过来光顾珠宝店只带了一个最多只能承重 17 kg 的粉红色小包，于是问题来了，怎样搭配这些不同重量不同价值的珠宝才能不虚此行呢？哎，这年头抢劫也不容易啊...

用数学语言来描述这个问题就是：背包最多只能承重 WWW kg, 有 nnn 种珠宝可供选择，这 nnn 种珠宝的重量分别为 ω1,⋯,ωn\omega_1,\cdots,\omega_nω1,⋯,ωn, 相应的价值为 v1,⋯,vnv_1,\cdots,v_nv1,⋯,vn. 问如何选择这些珠宝使得放进包里的珠宝价值最大化？

Knapsack with repetition - 物品重复可用的背包问题

由于这类背包问题中，同一物品可以被多次选择，因此称为 Knapsack with repetition, 又称 Unbounded knapsack problem(无界背包问题).

动态规划是解决背包问题的有力武器，而在动态规划中，主要的问题之一就是——状态（子问题) 是什么？在本题中我们可以从两个方面对原始问题进行化大为小：要么是是更小的背包容量 ω≤W\omega \leq Wω≤W, 要么尝试更少的珠宝数目（如珠宝 1,2,⋯,j, for j≤n1, 2, \cdots , j, ~for~ j \leq n1,2,⋯,j, for j≤n). 这两个状态（子问题) 究竟哪个对于解题更为方便，还需进一步论证——能否根据状态（子问题) 很方便地写出状态转移方程。

先来看看第一种状态： 在背包容量为 ω\omegaω 时抢劫犯所能获得的最优值为 K(ω)K(\omega)K(ω). 对应此状态的状态转移方程并不是那么直观，先从 K(ω)K(\omega)K(ω) 所包含的信息出发，K(ω)>0K(\omega) > 0K(ω)>0 时，背包中必然含有某件值钱的珠宝，不妨假设最优值 K(ω)K(\omega)K(ω) 包含某珠宝 iii, 那么将珠宝 iii 从背包中移除后，背包中剩余珠宝的价值加上珠宝 iii 的价值即为 K(ω)K(\omega)K(ω). 哪尼？这不就是个天然的状态转移方程么？抢劫犯灵机一动，立马想出了如下状态转移方程： K(ω)=F(ω−ωi)+vi (ωi∈Ω)K(\omega) = F(\omega - \omega_i) + v_i ~(\omega_i \in \Omega)K(ω)=F(ω−ωi)+vi (ωi∈Ω)

其中 F(ω−ωi)F(\omega - \omega_i)F(ω−ωi) 为拿出珠宝 iii 后的价值映射函数（用人话来说就是把粉红色小包里剩下的珠宝价值加起来)，取出来的珠宝重量 ωi<ω\omega_i < \omegaωi<ω(总不能取出大于背包重量的珠宝吧...), Ω\OmegaΩ 即为 K(ω)K(\omega)K(ω) 中 ωi\omega_iωi 的所有可能取值。想了想好像哪里不对劲，K(ω)K(\omega)K(ω) 的转移关系没鼓捣出来，反而新添了个 F(ω−ωi)F(\omega - \omega_i)F(ω−ωi), 真是旧爱未了又添新欢... 别急，再仔细瞅瞅以上等式两端，拿出珠宝 iii 后，其价值 viv_ivi 就可以认为是一个定值了，故要想 K(ω)K(\omega)K(ω) 为最大值，F(ω−ωi)F(\omega - \omega_i)F(ω−ωi) 也理应是背包容量为 ω−ωi\omega - \omega_iω−ωi 时的包内珠宝的最大价值，如若不是，则必然存在 F(ω−ωi)<K(ω−ωi)F(\omega - \omega_i) < K(\omega - \omega_i)F(ω−ωi)<K(ω−ωi), 即有 K(ω)=F(ω−ωi)+vi<K(ω−ωi)+vi=K′(ω)K(\omega) = F(\omega - \omega_i) + v_i < K(\omega - \omega_i) + v_i = K^{\prime}(\omega)K(ω)=F(ω−ωi)+vi<K(ω−ωi)+vi=K′(ω) 与 K(ω)K(\omega)K(ω) 为在背包容量为 ω\omegaω 时的最大值的定义不符，故假设不成立，F(ω−ωi)=K(ω−ωi)F(\omega - \omega_i) = K(\omega - \omega_i)F(ω−ωi)=K(ω−ωi). 千斤顶终于成功上位——变成了备胎... 新的状态转移方程可改写为： K(ω)=K(ω−ωi)+viK(\omega) = K(\omega - \omega_i) + v_iK(ω)=K(ω−ωi)+vi

嗯，好像还是有哪里不对劲，千斤顶虽然已晋级为备胎，可备胎这个身份实在是不怎么好听，这不还有下标 iii 这个标记嘛，我们给抢劫犯想想法子，怎么才能让备胎尽快转正呢？！仔细分析发现我们刚才取出 d 的价值 viv_ivi 是从已知背包容量为 ω\omegaω 时取出来的珠宝 iii, 重量为 ωi\omega_iωi. 那么到底那几个珠宝才是可能被取出来的呢？答案不得而知，只知道肯定是小于背包容量 ω\omegaω 中的某一个。既然是这样，我们把所有小于背包容量 ω\omegaω 的珠宝挨个拿出来比一比不就完了么？但这样一来又有了新的问题：取出来的珠宝 ωi\omega_iωi 不一定是最大值 K(ω)K(\omega)K(ω) 中所包含的珠宝，那假如我们一定要拿出来比一比呢？得到的结果自然是不大于最大值 K(ω)K(\omega)K(ω)(如果不是，反证法证之), 用数学语言表示就是： K(ω)≥K(ω−ωj)+vj (ωj∉Ω)K(\omega) \geq K(\omega - \omega_j) + v_j ~(\omega_j \notin \Omega)K(ω)≥K(ω−ωj)+vj (ωj∉Ω)

整理一下思路，用优雅的数学语言来表示就是： K(ω)=maxi: ωi≤ω{K(ω−ωi)+vi}K(\omega) = \max_{i:~\omega_i \leq \omega} \{K(\omega - \omega_i) + v_i\}K(ω)=maxi: ωi≤ω{K(ω−ωi)+vi}

备胎终于得以登堂入室，警察叔叔，就是她了... 状态转移方程终于完整的找到了，千斤顶窃喜道：皇天不负有心人，我也有转正的一天，蛤蛤蛤...

令 dp[i + 1][j] 表示从前 i 种物品中选出总重量不超过 j 时总价值的最大值。那么有转移方程：

dp[i + 1][j] = max{dp[i][j - k × w[i]] + k × v[i] | 0 ≤ k}

最坏情况下时间复杂度为 O(kW2)O(kW^2)O(kW2). 对上式进一步变形可得：

dp[i + 1][j] = max{dp[i][j - k × w[i]] + k × v[i] | 0 ≤ k}
       = max{dp[i][j], max{dp[i][j - k × w[i]] + k × v[i] | 1 ≤ k}}
       = max{dp[i][j], max{dp[i][(j - w[i]) - k × w[i]] + k × v[i] | 0 ≤ k} + v[i]}
       = max{dp[i][j], dp[i + 1][j - w[i]] + v[j]}

注意等式最后一行，咋看和 01 背包一样，实际上区别在于 dp[i + 1][] , 01 背包中为 dp[i][] . 此时时间复杂度简化为 O(nW)O(nW)O(nW).

Knapsack without repetition - 01 背包问题

上节讲述的是最原始的背包问题，这节我们探讨条件受限情况下的背包问题。若一件珠宝最多只能带走一件，请问现在抢劫犯该如何做才能使得背包中的珠宝价值总价最大？

显然，无界背包中的状态及状态方程已经不适用于 01 背包问题，那么我们来比较这两个问题的不同之处，无界背包问题中同一物品可以使用多次，而 01 背包问题中一个背包仅可使用一次，区别就在这里。我们将 K(ω)K(\omega)K(ω) 改为 K(i,ω)K(i,\omega)K(i,ω) 即可， 新的状态表示前 iii 件物品放入一个容量为 ω\omegaω 的背包可以获得的最大价值。

现在从以上状态定义出发寻找相应的状态转移方程。K(i−1,ω)K(i-1, \omega)K(i−1,ω) 为 K(i,ω)K(i, \omega)K(i,ω) 的子问题，如果不放第 iii 件物品，那么问题即转化为「前 i−1i-1i−1 件物品放入容量为 ω\omegaω 的背包」，此时背包内获得的总价值为 K(i−1,ω)K(i-1, \omega)K(i−1,ω)；如果放入第 iii 件物品，那么问题即转化为「前 i−1i-1i−1 件物品放入容量为 ω−ωi\omega - \omega_iω−ωi 的背包」，此时背包内获得的总价值为 K(i−1,ω−ωi)+viK(i-1, \omega - \omega_i) + v_iK(i−1,ω−ωi)+vi. 新的状态转移方程用数学语言来表述即为： K(i,ω)=max{K(i−1,ω),K(i−1,ω−ωi)+vi}K(i,\omega) = \max \{K(i-1, \omega), K(i-1, \omega - \omega_i) + v_i\}K(i,ω)=max{K(i−1,ω),K(i−1,ω−ωi)+vi}

这里的分析是以容量递推的，但是在容量特别大时，我们可能需要以价值作为转移方程。定义状态 dp[i + 1][j] 为前 i 个物品中挑选出价值总和为 j 时总重量的最小值（所以对于不满足条件的索引应该用充分大的值而不是最大值替代，防止溢出）。相应的转移方程为：前 i - 1 个物品价值为 j , 要么为 j - v[i] (选中第 i 个物品). 即 dp[i + 1][j] = min{dp[i][j], dp[i][j - v[i]] + w[i]} . 最终返回结果为 dp[n][j] ≤ W 中最大的 j.

扩展

以上我们只是求得了最终的最大获利，假如还需要输出选择了哪些项如何破？

以普通的 01 背包为例，如果某元素被选中，那么其必然满足 w[i] > j 且大于之前的 dp[i][j] , 这还只是充分条件，因为有可能被后面的元素代替。保险起见，我们需要跟踪所有可能满足条件的项，然后反向计算有可能满足条件的元素，有可能最终输出不止一项。

Java

import java.util.*;

public class Backpack {
  // 01 backpack with small datasets(O(nW), W is small)
  public static int backpack(int W, int[] w, int[] v, boolean[] itemTake) {
    int N = w.length;
    int[][] dp = new int[N + 1][W + 1];
    boolean[][] matrix = new boolean[N + 1][W + 1];
    for (int i = 0; i < N; i++) {
      for (int j = 0; j <= W; j++) {
        if (w[i] > j) {
          // backpack cannot hold w[i]
          dp[i + 1][j] = dp[i][j];
        } else {
          dp[i + 1][j] = Math.max(dp[i][j], dp[i][j - w[i]] + v[i]);
          // pick item i and get value j
          matrix[i][j] = (dp[i][j - w[i]] + v[i] > dp[i][j]);
        }
      }
    }

    // determine which items to take
    for (int i = N - 1, j = W; i >= 0; i--) {
      if (matrix[i][j]) {
        itemTake[i] = true;
        j -= w[i];
      } else {
        itemTake[i] = false;
      }
    }

    return dp[N][W];
  }

  // 01 backpack with big datasets(O(n\sigma{v}), W is very big)
  public static int backpack2(int W, int[] w, int[] v) {
    int N = w.length;
    // sum of value array
    int V = 0;
    for (int i : v) {
      V += i;
    }
    // initialize
    int[][] dp = new int[N + 1][V + 1];
    for (int[] i : dp) {
      // should avoid overflow for dp[i][j - v[i]] + w[i]
      Arrays.fill(i, Integer.MAX_VALUE >> 1);
    }
    dp[0][0] = 0;
    for (int i = 0; i < N; i++) {
      for (int j = 0; j <= V; j++) {
        if (v[i] > j) {
          // value[i] > j
          dp[i + 1][j] = dp[i][j];
        } else {
          // should avoid overflow for dp[i][j - v[i]] + w[i]
          dp[i + 1][j] = Math.min(dp[i][j], dp[i][j - v[i]] + w[i]);
        }
      }
    }

    // search for the largest i dp[N][i] <= W
    for (int i = V; i >= 0; i--) {
      // if (dp[N][i] <= W) return i;
      if (dp[N][i] <= W) return i;
    }
    return 0;
  }

  // repeated backpack
  public static int backpack3(int W, int[] w, int[] v) {
    int N = w.length;
    int[][] dp = new int[N + 1][W + 1];
    for (int i = 0; i < N; i++) {
      for (int j = 0; j <= W; j++) {
        if (w[i] > j) {
          // backpack cannot hold w[i]
          dp[i + 1][j] = dp[i][j];
        } else {
          dp[i + 1][j] = Math.max(dp[i][j], dp[i + 1][j - w[i]] + v[i]);
        }
      }
    }

    return dp[N][W];
  }

  public static void main(String[] args) {
    int[] w1 = new int[]{2, 1, 3, 2};
    int[] v1 = new int[]{3, 2, 4, 2};
    int W1 = 5;
    boolean[] itemTake = new boolean[w1.length + 1];
    System.out.println("Testcase for 01 backpack.");
    int bp1 = backpack(W1, w1, v1, itemTake); // bp1 should be 7
    System.out.println("Maximum value: " + bp1);
    for (int i = 0; i < itemTake.length; i++) {
      if (itemTake[i]) {
        System.out.println("item " + i + ", weight " + w1[i] + ", value " + v1[i]);
      }
    }

    System.out.println("Testcase for 01 backpack with large W.");
    int bp2 = backpack2(W1, w1, v1); // bp2 should be 7
    System.out.println("Maximum value: " + bp2);

    int[] w3 = new int[]{3, 4, 2};
    int[] v3 = new int[]{4, 5, 3};
    int W3 = 7;
    System.out.println("Testcase for repeated backpack.");
    int bp3 = backpack3(W3, w3, v3); // bp3 should be 10
    System.out.println("Maximum value: " + bp3);
  }
}