求教关于js内存释放的问题。
最近在写一个chrome
插件
有一个简单的功能分2步是这样:
- 从站点提取链接遍历所有详情页面(目前2000+ 每天几十个递增),提取关键数据生成数组对象。
- 从生成数组对象判断是否有
other_href
字段,如果有的话,请求这个other_href
解析返回的html
获得需要的数据,保存在对象上。
上面2步的请求都是用axios.get
,请求拿到的result.data
只进入一个解析函数返回解析对象,没有他用。
现在遇到的问题是第二步的other_href
是从第一步的result.data
解析出来,可能是这个原因导致第一步请求回来的html
不能从内存中释放,只开1000多个页面插件就因为内存溢出崩溃了。
打开内存快照里面堆满了<!DOCTYPE html> ...
,我测试过如果不对这个other_href
进行处理,内存会自动释放维持在300M左右。
我的解析函数只是对字符串进行截取处理
function parseDetailsHtml(html) {
function getOthersHref(htm) {
const index = htm.indexOf('name="description"'),
lastIndex = htm.indexOf('<', index),
match = (htm.substring(index, lastIndex + 1) || '').match(/>(.+?)</) || [];
return (match[1] || '').trim();
}
//... 其他提取函数
return {
others_href: getOthersHref(html),
...// 同getOthersHref的[字段名]:[函数名](html)
};
}
难道这样也能产生引用造成不能释放吗?
现在完全搞不懂应该怎么做了。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
还真有可能是返回的字符串在底层对原字符串进行了引用导致未被 GC。参见这篇文章 奇技淫巧学 V8 之六,字符串在 V8 内的表达,文中提到,对原 string 进行 substring/slice 底层依然会保留完整的原字符串在堆上的。
就这个问题有一个办法可以规避,用String.fromCharCode(str.charCodeAt(i))
转成每个字符的 unicode 再转回去。就这个问题有一个办法可以规避,可以获取每个字符然后重新造字符串来消除底层 SliceString 的结构。
还好你的 href 也不会很长,这样并不会影响性能。
做一个实验,证明 slice substring match trim 后最终返回的字符串仍然在底层引用了原字符串。
clone 后貌似还有俩内部的 regexp_last_match_info 在引用者。
随便运行一个正则,没了,貌似是系统内部保存了最后一次正则相关的内容?
...我看到你的对象占用的内存仅比字符串的大一点,这说明其实这个字符串是存在于对象里的,之所以字符串没被释放,是你的对象没被释放啊.window的内存看着也是比object大一点,这样就很明了了 string挂在object上,object挂在window上,所以都不能释放.
// 二次修改
指的是这里,这里的值代表如果对象被释放将会释放出多少内存.
明显它们都彼此依赖,而最底层是string,因为他的卷影大小跟保留大小是一致的,代表它它实际占用跟可被释放的内存大小是一致的.
但是令我疑惑的是string的距离竟然24,这代表者它上面还有很多层,他是通过多层依赖存活下来的.
题主采纳了上一位答者的答案,我看了之后验证,的确是有一定的道理,slicestring的确产生引用
可以看到实际占用仅是20 但可被释放的空间却很大,因为引用了一个完整的字符串
但是令我疑惑的是我这样仿照这答者的代码写了一个差不多的,并没有产生内存泄漏现象,会有slicestring,但仅有一个,所以我很疑惑答主的改法是啥?我们代码之间的差别又是啥?希望能解惑
JS 中字符串不可变。