返回介绍

solution / 1600-1699 / 1698.Number of Distinct Substrings in a String / README

发布于 2024-06-17 01:03:15 字数 5163 浏览 0 评论 0 收藏 0

1698. 字符串的不同子字符串个数

English Version

题目描述

给定一个字符串 s,返回 s 的不同子字符串的个数。

字符串的 子字符串 是由原字符串删除开头若干个字符(可能是 0 个)并删除结尾若干个字符(可能是 0 个)形成的字符串。

 

示例 1:

输入:s = "aabbaba"
输出:21
解释:不同子字符串的集合是 ["a","b","aa","bb","ab","ba","aab","abb","bab","bba","aba","aabb","abba","bbab","baba","aabba","abbab","bbaba","aabbab","abbaba","aabbaba"]

示例 2:

输入:s = "abcdefg"
输出:28

 

提示:

  • 1 <= s.length <= 500
  • s 由小写英文字母组成。

进阶:你可以以 O(n) 时间复杂度解决此问题吗?

解法

方法一:暴力枚举

枚举所有子串,使用哈希表记录不同子串的个数。

时间复杂度 $O(n^3)$,空间复杂度 $O(n^2)$。其中 $n$ 为字符串长度。

class Solution:
  def countDistinct(self, s: str) -> int:
    n = len(s)
    return len({s[i:j] for i in range(n) for j in range(i + 1, n + 1)})
class Solution {
  public int countDistinct(String s) {
    Set<String> ss = new HashSet<>();
    int n = s.length();
    for (int i = 0; i < n; ++i) {
      for (int j = i + 1; j <= n; ++j) {
        ss.add(s.substring(i, j));
      }
    }
    return ss.size();
  }
}
class Solution {
public:
  int countDistinct(string s) {
    unordered_set<string_view> ss;
    int n = s.size();
    string_view t, v = s;
    for (int i = 0; i < n; ++i) {
      for (int j = i + 1; j <= n; ++j) {
        t = v.substr(i, j - i);
        ss.insert(t);
      }
    }
    return ss.size();
  }
};
func countDistinct(s string) int {
  ss := map[string]struct{}{}
  for i := range s {
    for j := i + 1; j <= len(s); j++ {
      ss[s[i:j]] = struct{}{}
    }
  }
  return len(ss)
}

方法二:字符串哈希

字符串哈希是把一个任意长度的字符串映射成一个非负整数,并且其冲突的概率几乎为 0。字符串哈希用于计算字符串哈希值,快速判断两个字符串是否相等。

取一固定值 BASE,把字符串看作是 BASE 进制数,并分配一个大于 0 的数值,代表每种字符。一般来说,我们分配的数值都远小于 BASE。例如,对于小写字母构成的字符串,可以令 a=1, b=2, …, z=26。取一固定值 MOD,求出该 BASE 进制对 M 的余数,作为该字符串的 hash 值。

一般来说,取 BASE=131 或者 BASE=13331,此时 hash 值产生的冲突概率极低。只要两个字符串 hash 值相同,我们就认为两个字符串是相等的。通常 MOD 取 2^64,C++ 里,可以直接使用 unsigned long long 类型存储这个 hash 值,在计算时不处理算术溢出问题,产生溢出时相当于自动对 2^64 取模,这样可以避免低效取模运算。

除了在极特殊构造的数据上,上述 hash 算法很难产生冲突,一般情况下上述 hash 算法完全可以出现在题目的标准答案中。我们还可以多取一些恰当的 BASE 和 MOD 的值(例如大质数),多进行几组 hash 运算,当结果都相同时才认为原字符串相等,就更加难以构造出使这个 hash 产生错误的数据。

时间复杂度 $O(n^2)$,空间复杂度 $O(n^2)$。其中 $n$ 为字符串长度。

class Solution:
  def countDistinct(self, s: str) -> int:
    base = 131
    n = len(s)
    p = [0] * (n + 10)
    h = [0] * (n + 10)
    p[0] = 1
    for i, c in enumerate(s):
      p[i + 1] = p[i] * base
      h[i + 1] = h[i] * base + ord(c)
    ss = set()
    for i in range(1, n + 1):
      for j in range(i, n + 1):
        t = h[j] - h[i - 1] * p[j - i + 1]
        ss.add(t)
    return len(ss)
class Solution {
  public int countDistinct(String s) {
    int base = 131;
    int n = s.length();
    long[] p = new long[n + 10];
    long[] h = new long[n + 10];
    p[0] = 1;
    for (int i = 0; i < n; ++i) {
      p[i + 1] = p[i] * base;
      h[i + 1] = h[i] * base + s.charAt(i);
    }
    Set<Long> ss = new HashSet<>();
    for (int i = 1; i <= n; ++i) {
      for (int j = i; j <= n; ++j) {
        long t = h[j] - h[i - 1] * p[j - i + 1];
        ss.add(t);
      }
    }
    return ss.size();
  }
}
class Solution {
public:
  int countDistinct(string s) {
    using ull = unsigned long long;
    int n = s.size();
    ull p[n + 10];
    ull h[n + 10];
    int base = 131;
    p[0] = 1;
    for (int i = 0; i < n; ++i) {
      p[i + 1] = p[i] * base;
      h[i + 1] = h[i] * base + s[i];
    }
    unordered_set<ull> ss;
    for (int i = 1; i <= n; ++i) {
      for (int j = i; j <= n; ++j) {
        ss.insert(h[j] - h[i - 1] * p[j - i + 1]);
      }
    }
    return ss.size();
  }
};
func countDistinct(s string) int {
  n := len(s)
  p := make([]int, n+10)
  h := make([]int, n+10)
  p[0] = 1
  base := 131
  for i, c := range s {
    p[i+1] = p[i] * base
    h[i+1] = h[i]*base + int(c)
  }
  ss := map[int]struct{}{}
  for i := 1; i <= n; i++ {
    for j := i; j <= n; j++ {
      ss[h[j]-h[i-1]*p[j-i+1]] = struct{}{}
    }
  }
  return len(ss)
}

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文