当前位置：文江博客话题详情

使用 JavaScript 剥离标签并处理换行符

发布于 2024-11-26 12:45:48 字数 492 浏览 3 评论 0原文

我想从 html 中删除标签，但保留它的换行符。

我想要像在浏览器中复制文本并将其粘贴到记事本中这样的行为。

例如，将

x1 x2 转换为 x1\nx2
的代码;x1 x2 到 x1\nx2
x1x2 至 x1x2
x1 x2 至 x1\nx2

删除所有标签不起作用 (/<.*?>/g)。还创建一个虚拟

并设置它的 innertHTML 并读取它的 textContent 将删除换行符。

有帮助吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

如梦亦如幻 2024-12-03 12:45:48

这对你来说怎么样？这会将出现的所有、和

替换为 \ n，然后剥离剩余的标签。虽然很愚蠢，但至少是一个开始。

fixed = text_to_fix.replace(/<(?:br|\/div|\/p)>/g, "\n")
           .replace(/<.*?>/g, "");

然而，这并不适用于所有 HTML。只是你提到的标签。

How's this work for you? This will replace every occurrence of  , </div>, and  with a \n, and then strip the remaining tags. Its goofy, but its at least a start.

fixed = text_to_fix.replace(/<(?:br|\/div|\/p)>/g, "\n")
           .replace(/<.*?>/g, "");

This doesn't work for all HTML, however. Just the tags you mentioned.

回复收藏 0 原文

萧瑟寒风 2024-12-03 12:45:48

尝试：

function strip_tags(str){
    return str
             .replace(/(<(br[^>]*)>)/ig, '\n')
             .replace(/(<([^>]+)>)/ig,'');
}

var str = '<div>x1</div><div>x2</div><br>'+'<p>x1</p><p>x2</p>'+'<b>x1</b><i>x2</i>';

这将剥离标签并用新行替换或，但是为块元素添加新行需要相当长的时间想出一个解决办法。

这是一个演示

Try:

function strip_tags(str){
    return str
             .replace(/(<(br[^>]*)>)/ig, '\n')
             .replace(/(<([^>]+)>)/ig,'');
}

var str = '<div>x1</div><div>x2</div><br>'+'<p>x1</p><p>x2</p>'+'<b>x1</b><i>x2</i>';

This will strip the tags and replace   or   with new lines, but adding new lines for block elements requires quite some time to come up with a solution.

Here is a demo

回复收藏 0 原文

暮倦 2024-12-03 12:45:48

这是我在感到无聊之前所得到的……

const strip_tags = (html) => {
    let tmp = document.createElement("div");
    tmp.innerHTML = html
        .replace(/(<(br[^>]*)>)/ig, '\n')
        .replace(/(<(p[^>]*)>)/ig, '\n')
        .replace(/(<(div[^>]*)>)/ig, '\n')
        .replace(/(<(h[1-6][^>]*)>)/ig, '\n')
        .replace(/(<(li[^>]*)>)/ig, '\n')
        .replace(/(<(ul[^>]*)>)/ig, '\n')
        .replace(/(<(ol[^>]*)>)/ig, '\n')
        .replace(/(<(blockquote[^>]*)>)/ig, '\n')
        .replace(/(<(pre[^>]*)>)/ig, '\n')
        .replace(/(<(hr[^>]*)>)/ig, '\n')
        .replace(/(<(table[^>]*)>)/ig, '\n')
        .replace(/(<(tr[^>]*)>)/ig, '\n')
        .replace(/(<(td[^>]*)>)/ig, '\n')
        .replace(/(<(th[^>]*)>)/ig, '\n')
        .replace(/(<(caption[^>]*)>)/ig, '\n')
        .replace(/(<(dl[^>]*)>)/ig, '\n')
        .replace(/(<(dt[^>]*)>)/ig, '\n')
        .replace(/(<(dd[^>]*)>)/ig, '\n')
        .replace(/(<(address[^>]*)>)/ig, '\n')
        .replace(/(<(section[^>]*)>)/ig, '\n')
        .replace(/(<(article[^>]*)>)/ig, '\n')
        .replace(/(<(aside[^>]*)>)/ig, '\n');
    return tmp.textContent || tmp.innerText || "";
}

This is as far as I got before I got bored...

const strip_tags = (html) => {
    let tmp = document.createElement("div");
    tmp.innerHTML = html
        .replace(/(<(br[^>]*)>)/ig, '\n')
        .replace(/(<(p[^>]*)>)/ig, '\n')
        .replace(/(<(div[^>]*)>)/ig, '\n')
        .replace(/(<(h[1-6][^>]*)>)/ig, '\n')
        .replace(/(<(li[^>]*)>)/ig, '\n')
        .replace(/(<(ul[^>]*)>)/ig, '\n')
        .replace(/(<(ol[^>]*)>)/ig, '\n')
        .replace(/(<(blockquote[^>]*)>)/ig, '\n')
        .replace(/(<(pre[^>]*)>)/ig, '\n')
        .replace(/(<(hr[^>]*)>)/ig, '\n')
        .replace(/(<(table[^>]*)>)/ig, '\n')
        .replace(/(<(tr[^>]*)>)/ig, '\n')
        .replace(/(<(td[^>]*)>)/ig, '\n')
        .replace(/(<(th[^>]*)>)/ig, '\n')
        .replace(/(<(caption[^>]*)>)/ig, '\n')
        .replace(/(<(dl[^>]*)>)/ig, '\n')
        .replace(/(<(dt[^>]*)>)/ig, '\n')
        .replace(/(<(dd[^>]*)>)/ig, '\n')
        .replace(/(<(address[^>]*)>)/ig, '\n')
        .replace(/(<(section[^>]*)>)/ig, '\n')
        .replace(/(<(article[^>]*)>)/ig, '\n')
        .replace(/(<(aside[^>]*)>)/ig, '\n');
    return tmp.textContent || tmp.innerText || "";
}

回复收藏 0 原文

美人如玉 2024-12-03 12:45:48

现在，您可以使用此函数，

function stripTags(html) {
     return html.replace(/<[^>]+>/g, '').replace(/<\/[^>]+>/g, '\n').replace(/<br>/g, '\n');
}

该函数会将所有开始和结束标记替换为空，并将标记替换为换行符。这应该会给你想要的输出。

You can use this

function stripTags(html) {
     return html.replace(/<[^>]+>/g, '').replace(/<\/[^>]+>/g, '\n').replace(/<br>/g, '\n');
}

Now the function will replace all opening and closing tags with nothing, and   tags with line breaks. This should give you the desired output.

回复收藏 0 原文

~没有更多了~

关于作者

够钟

暂无简介

文章

513 人气

关注发私信

饮湿

文章 0 评论 0

关注

明月

文章 0 评论 0

关注

02

文章 0 评论 0

关注

hs1283

文章 0 评论 0

关注

风向决定发型

文章 0 评论 0

关注

落花浅忆

文章 0 评论 0

友情链接

文江博客

使用 JavaScript 剥离标签并处理换行符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

使用 JavaScript 剥离标签并处理换行符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

饮湿

明月

02

hs1283

风向决定发型

落花浅忆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。