正则表达式求助,python的findall

发布于 2022-09-05 09:34:06 字数 736 浏览 17 评论 0

content = '[1502165009733][DEBUG][TID:140600116508416][asr_request_agent.cpp:219][ASRRequest::generate_asr_request] params json string: {"pam":"IDPAAS","idx":"2","pdt":"4006","glb":"e3dece1a-057f-4abe-94bc-46ebde36f844","enc":"utf-8","rtn":"json","ptc":"101","app":"com.baidu.aip.huatuo","fun":"262400"}'
# re.search()
print re.findall(reg, content)

正则是: ^\[(\d+)]|glb\":\"(.*)\",\"enc|\[(\d+)]|idx\":\"(.*)",\"pdt

可是为什么匹配的结果是
[('1502165009733', '', '', ''), ('', '', '', '2'), ('', 'e3dece1a-057f-4abe-94bc-46ebde36f844', '', '')]

数字里面有三个元素,而每个里面又有三个,但是想要的结果是
['1502165009733', 'e3dece1a-057f-4abe-94bc-46ebde36f844', '2']
想问一下是正则错误了还是确实这样?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

魔法唧唧 2022-09-12 09:34:06
import re

reg = '\[(\d+)\][\s\S]*?"idx":"(\d+)"[\s\S]*?"glb":"(.*?)"'
content = '[1502165009733][DEBUG][TID:140600116508416][asr_request_agent.cpp:219][ASRRequest::generate_asr_request] params json string: {"pam":"IDPAAS","idx":"2","pdt":"4006","glb":"e3dece1a-057f-4abe-94bc-46ebde36f844","enc":"utf-8","rtn":"json","ptc":"101","app":"com.baidu.aip.huatuo","fun":"262400"}'
g = re.search(reg, content)
a, b, c = g.groups()

print a, b, c
清浅ˋ旧时光 2022-09-12 09:34:06

感觉你好像没想清楚要怎么用正则。
目前贴出来了正则是4个部分的关系,也就是说任何4个中的任何一个匹配,就会认为匹配到了。由于是findall,所以会从匹配结束点的位置继续向后找,看有没有和4个里的任何一个匹配的字符串。
由于正则里有4个捕获组( ),所以匹配结果会是个数组。而由于这4个组出于或关系的4段里,所以永远最多只会有一个匹配。
我猜测你是想按照字符串顺序匹配这4部分,那么应该写作:

^\[(\d+)].*idx\":\"(.*)\",\"pdt.*glb\":\"(.*)\",\"enc.*(?:\[(\d+)])?
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文