V8 的正则 split 的实现?出现诡异的结果

发布于 2022-09-04 10:16:54 字数 1574 浏览 17 评论 0

理论上用正则对字符串进行 split 时,应是在匹配的每一个位置进行切割并扔掉匹配到的部分,然后以数组的形式返回

例如

',a,b,c,'.split(/,/) // return ['', 'a', 'b', 'c', '']
'abc'.split(/()/) // Expected to return ['', 'a', 'b', 'c', ''] as well

伪代码:

while (hasNextMatch()) {
  splitAt(matched().index)
  increaseLastIndex(matched().length || 1)
}

return calcResult()

完整实现:

function split(s, regex) {
  function implement() {
    while (hasNextMatch()) {
      splitAt(matched().index)
      increaseLastIndex(matched().length)
    }

    return calcResult()
  }

  function hasNextMatch() {
    return (lastMatch = regex.exec(s)) && (lastMatch = { index: lastMatch.index, length: lastMatch[0].length })
  }

  function matched() {
    return lastMatch
  }

  function increaseLastIndex(n) {
    regex.lastIndex += n || 1
    lastSplit += n
  }

  function splitAt(index) {
    result.push(s.substring(lastSplit, index))
    lastSplit = index
  }

  function calcResult() {
    result.push(s.substring(lastSplit, s.length))
    return result
  }

  var result = []
  var lastSplit = 0
  var lastMatch

  return implement()
}

console.log(split('abc', /()/g)) // [ '', 'a', 'b', 'c', '' ]

然而

'abc'.split(/()/g)

返回

['a', '', 'b', '', 'c']

图片描述

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

将军与妓 2022-09-11 10:16:54

'abc'.split(/(?:)/g)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文