JavaScript如何对后台utf8编码的字符串解码?

发布于 2022-08-24 01:30:55 字数 407 浏览 14 评论 0

为了防止xss以及csrf+xss的漏洞,后台统一对字符串进行了转码
结果如下:
原文: JavaScript高级程序设计
编码: JavaScript高级程序设计

前端写了一段如下代码:

function u2str(text){ // transform text in utf8 format to string
	return unescape(text.replace(/&#/g,'%u').replace(/;/g,''));
}

对普通的中文没问题,但是对上面的中英文加载的文本,这个函数就会返回乱码。
这种&#打头的utf8文本该怎么显示呀?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

三生殊途 2022-08-31 01:30:55

最后总算解决了,&#后面是5个数字,是10进制的= =b 所以不能直接用%替换

function u2str(text){ 
     return $('<p></p>').html(text).text();
}

这样转回来之后不能防xss漏洞,填入html之前仍然需要转义,不过总算可以和后台交流了。

黄昏下泛黄的笔记 2022-08-31 01:30:55

可以使用原生的Javascript代码来进行转义。该编码其实不是utf8,而是unicode编码。这里的字符实际上是html实体。

var decodeHtmlEntity = function(str) {
  return str.replace(/&#(\d+);/g, function(match, dec) {
    return String.fromCharCode(dec);
  });
};

输入:

var str = 'JavaScript高级程序设计';
console.log(decodeHtmlEntity(str));

输出:
JavaScript高级程序设计

以下代码用于将正常的字符转变为html实体

var encodeHtmlEntity = function(str) {
  var buf = [];
  for (var i=str.length-1;i>=0;i--) {
    buf.unshift(['&#', str[i].charCodeAt(), ';'].join(''));
  }
  return buf.join('');
};

输入:

var str = '高级程序设计';
console.log(encodeHtmlEntity(str));

输出:
高级程序设计

Github gist: https://gist.github.com/4174511

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文