当前位置：文江博客话题详情

现实生活中，在 Java 中使用 String.intern() 的实际例子？

发布于 2024-09-15 00:41:31 字数 266 浏览 16 评论 0原文

我见过许多描述 String intern()'ing 如何工作的原始示例，但我还没有看到可以从中受益的实际用例。

我能想到的唯一情况是拥有一个接收大量请求的 Web 服务，由于严格的模式，每个请求在本质上都非常相似。在这种情况下，通过对请求字段名称进行 intern() 操作，可以显着减少内存消耗。

任何人都可以提供在生产环境中使用 intern() 并取得巨大成功的示例吗？也许是流行的开源产品中的一个例子？

编辑：我指的是手动实习，而不是字符串文字等的保证实习。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风吹短裙飘 2024-09-22 00:41:38

永远不要对用户提供的数据使用 intern，因为这可能会导致拒绝服务攻击（因为 intern()ed 字符串永远不会被释放）。您可以对用户提供的字符串进行验证，但话又说回来，您已经完成了 intern() 所需的大部分工作。

回复收藏 0 原文

邮友 2024-09-22 00:41:37

不是一个完整的答案，但值得深思（在这里找到）：

因此，这种情况下的主要好处是，对内部化字符串使用 == 运算符比使用 equals() 方法[对于未内部化的字符串]要快得多。字符串]。因此，如果您要比较字符串超过一三次，请使用 intern() 方法。

回复收藏 0 原文

如何视而不见 2024-09-22 00:41:36

驻留有益的示例涉及大量字符串，其中：

字符串可能会在多个 GC 周期中幸存下来，并且
可能存在大部分字符串的多个副本。

典型示例包括将文本拆分/解析为符号（单词、标识符、URI），然后将这些符号附加到长期存在的数据结构中。 XML 处理、编程语言编译和 RDF/OWL 三重存储作为实习可能有益的应用程序浮现在脑海中。

但驻留并非没有问题，特别是如果事实证明上述假设不正确：

用于保存驻留字符串的池数据结构需要额外的空间，
驻留需要时间，并且
驻留不会阻止重复的创建字符串放在第一位。

最后，实习可能会增加 GC 开销，因为它会增加需要跟踪和复制的对象数量以及需要处理的弱引用数量。开销的增加必须与有效驻留导致的 GC 开销的减少相平衡。

回复收藏 0 原文

笙痞 2024-09-22 00:41:35

如果您有 N 个字符串只能采用 K 个不同的值，其中 N 远远超过 K，那么实习会非常有益>。现在，您将只存储最多 K 字符串，而不是在内存中存储 N 个字符串。

例如，您可能有一个由 5 位数字组成的 ID 类型。因此，只能有 10^5 个不同的值。假设您现在正在解析一个大型文档，其中包含许多对 ID 值的引用/交叉引用。假设该文档总共有 10^9 个引用（显然有些引用在文档的其他部分中重复）。

因此，在本例中，N = 10^9 和 K = 10^5。如果您不保留字符串，您将在内存中存储 10^9 字符串，其中许多字符串是 equals （通过鸽洞原理）。如果您 intern() 解析文档时获得的 ID 字符串，并且不保留对从文档中读取的未驻留字符串的任何引用 (这样它们就可以被垃圾回收），那么您将永远不需要在内存中存储超过 10^5 字符串。