Python split() 不删除分隔符

发布于 2024-12-11 14:02:20 字数 368 浏览 0 评论 0原文

这段代码几乎满足了我的需要......

for line in all_lines:
    s = line.split('>')

除了它删除了所有“>”分隔符。

那么，

<html><head>

有

['<html','<head']

没有办法使用 split() 方法，但保留分隔符，而不是删除它？

有了这些结果..

['<html>','<head>']

原文

This code almost does what I need it to..

for line in all_lines:
    s = line.split('>')

Except it removes all the '>' delimiters.

So,

<html><head>

Turns into

['<html','<head']

Is there a way to use the split() method but keep the delimiter, instead of removing it?

With these results..

['<html>','<head>']

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

蓝眼泪 2024-12-18 14:02:20

d = ">"
for line in all_lines:
    s =  [e+d for e in line.split(d) if e]

d = ">"
for line in all_lines:
    s =  [e+d for e in line.split(d) if e]

回复收藏 0 原文

池木 2024-12-18 14:02:20

如果您使用拆分来解析 HTML，那么您很可能会做错，除非您正在编写针对固定且安全的内容文件的一次性脚本。如果它应该适用于任何 HTML 输入，您将如何处理类似 ?

无论如何，以下内容对我有用：

>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']

If you are parsing HTML with splits, you are most likely doing it wrong, except if you are writing a one-shot script aimed at a fixed and secure content file. If it is supposed to work on any HTML input, how will you handle something like <a title='growth > 8%' href='#something'>?

Anyway, the following works for me:

>>> import re
>>> re.split('(<[^>]*>)', '<body><table><tr><td>')[1::2]
['<body>', '<table>', '<tr>', '<td>']

回复收藏 0 原文

陌路终见情 2024-12-18 14:02:20

这个怎么样：

import re
s = '<html><head>'
re.findall('[^>]+>', s)

How about this:

import re
s = '<html><head>'
re.findall('[^>]+>', s)

回复收藏 0 原文

睡美人的小仙女 2024-12-18 14:02:20

只需将其拆分，然后为数组/列表中的每个元素（除了最后一个元素）添加一个尾随“>”到它。

回复收藏 0 原文

~没有更多了~

关于作者

丑丑阿

暂无简介

0 文章

0 评论

23 人气

关注发私信

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

Python split() 不删除分隔符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

Python split() 不删除分隔符

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。