Firefox 中的大子字符串比 Chrome 快约 9000 倍：为什么？

发布于 2024-11-10 11:28:23 字数 983 浏览 3 评论 0原文

基准：http://jsperf.com/substringing

所以，我正在启动我的第一个 HTML5 浏览器基于客户端的项目。本质上，它必须将非常非常大的文本文件解析为一个或多个对象数组。我知道我将如何编码；我现在最关心的是尽快获得解析器代码，我的主要测试平台是 Chrome。然而，在查看子字符串方法之间的差异时（我已经很长一段时间没有接触过 JavaScript），我注意到与 FireFox 相比，Chrome 中的这个基准测试速度慢得令人难以置信。为什么？

我的第一个假设是，它与 FireFox 的 JS 引擎处理字符串对象的方式有关，对于 FireFox 来说，这个操作是简单的指针操作，而对于 Chrome 来说，它实际上是在进行硬拷贝。但是，我不确定为什么 Chrome 不会进行指针操作，或者为什么 FireFox 会。有人有一些见解吗？

JSPerf 似乎丢弃了我的 FireFox 结果，而不是在 BrowserScope 上显示它们。对我来说，我在 FF4 中的 .substr() 上获得了 9,568,203 ±1.44% Ops/sec。

编辑：所以我看到 FF3.5 的性能结果实际上低于 Chrome。所以我决定检验我的指针假设。这使我进入了子字符串测试的第二次修订，该测试正在执行FF4 中的 1,092,718±1.62% Ops/sec 与 Chrome 中的 1,195±3.81% Ops/sec，降至仅速度快了 1000 倍，但性能仍然存在难以解释的差异。

后记：不，我对 Internet Explorer 一点也不关心。我很关心如何提高自己的技能并更深入地了解这门语言。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

聽兲甴掵 2024-11-17 11:28:23

对于 Spidermonkey（Firefox 中的 JS 引擎），substring() 调用只是创建一个新的“依赖字符串”：一个字符串对象，它存储一个指向子字符串的指针，以及开始和结束偏移。这正是为了使 substring() 更快，并且对于不可变字符串来说这是一个明显的优化。

至于为什么 V8 不这样做...一种可能是 V8 试图节省空间：在依赖字符串设置中，如果您保留子字符串但忘记原始字符串，则原始字符串无法被 GC 处理，因为子字符串正在使用其字符串数据的一部分。

无论如何，我只是查看了 V8 源代码，看起来他们根本不做任何类型的依赖字符串；不过，这些评论并没有解释为什么他们不这样做。

[更新，12/2013]：在我给出上述答案几个月后，V8 添加了对依赖字符串的支持，正如 Paul Draper 指出的那样。

回复收藏 0 原文

败给现实 2024-11-17 11:28:23

您是否已从基准测试结果中消除了 .length 的读取？

我相信 V8 有几种字符串表示形式：

1. a sequence of ASCII bytes
2. a sequence of UTF-16 code units.
3. a slice of a string (result of substring)
4. a concatenation of two strings.

数字 4 使字符串 += 更加高效。

我只是猜测，但如果他们试图将两个字符串指针和一个长度打包到一个小空间中，他们可能无法使用指针缓存大长度，因此可能最终会遍历连接的链接列表以进行计算长度。当然，这假设 Array.prototype.join 从数组部分创建形式 (4) 的字符串。

它确实导致了一个可检验的假设，即使没有缓冲区副本，该假设也可以解释差异。

编辑：

我查看了 V8 源代码， StringBuilderConcat 是我想要的地方开始拉动，尤其是runtime.cc。

Have you eliminated the reading of .length from your benchmark results?

I believe V8 has a few representations of a string:

1. a sequence of ASCII bytes
2. a sequence of UTF-16 code units.
3. a slice of a string (result of substring)
4. a concatenation of two strings.

Number 4 is what makes string += efficient.

I'm just guessing but if they're trying to pack two string pointers and a length into a small space, they may not be able to cache large lengths with the pointers, so may end up walking the joined link list in order to compute the length. This assumes of course that Array.prototype.join creates strings of form (4) from the array parts.

It does lead to a testable hypothesis which would explain the discrepancy even absent buffer copies.

EDIT:

I looked through the V8 source code and StringBuilderConcat is where I would start pulling, especially runtime.cc.

回复收藏 0 原文

~没有更多了~