当前位置：文江博客话题详情

nodejs 采集网页如何自动识别采集到的网页编码

发布于 2022-09-07 03:24:44 字数 170 浏览 21 评论 0

如题

在使用nodejs 采集网页时候如何自动识别获取到的网页编码。从而可以使用iconv-lite 进行对应的编码转换。

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

自由如风 2022-09-14 03:24:44

网页的编码就是根据head 中的
<meta charset="UTF-8"> 来规定的

你可以自动获取这个编码信息，来进行编码转换的

回复收藏 0

羁拥 2022-09-14 03:24:44

不是有charset吗‘’

回复收藏 0

太阳公公是暖光 2022-09-14 03:24:44

<meta charset="GBK">
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

我写了 (?<=(<meta.*?charset=\"|<meta.*?charset=)).*?(?=\") 获取到的是 ['','GBK','utf-8'] // 获取GBK 会获取到一个空的。有没有更好的写法

回复收藏 0

~没有更多了~

关于作者

北恋

暂无简介

0 文章

0 评论

22 人气

关注发私信

留蓝

文章 0 评论 0

关注

18790681156

文章 0 评论 0

关注

zach7772

文章 0 评论 0

关注

Wini

文章 0 评论 0

关注

ayeshaaroy

文章 0 评论 0

关注

初雪

文章 0 评论 0

友情链接

文江博客

nodejs 采集网页如何自动识别采集到的网页编码

如题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

nodejs 采集网页如何自动识别采集到的网页编码

如题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。