从字符串中去除 html 标签、css 和 js 代码
我正在使用 document.documentElement.textContent.toLowerCase()
读取网站文本内容,问题是该网站在任何实际文本之前有太多 css 和 js 代码,我什至没有得到完整的文本,它会集中在 css 的某些部分。
如何删除所有 css 和 js 代码以仅检索文本内容?
I am using document.documentElement.textContent.toLowerCase()
to read a website text content, the problem is this website has so many css and js code before any real text that I don't even get the complete text, it gets trunked in some part of the css.
How can I remove all the css and js code to retrieve only the text content?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
这又如何呢?
What about this?