在python字符串中解码特定的逃脱字符
我有一个 Python 变量(名为 var
),其中包含一个具有以下文字数据的字符串:
day\r\n\\night
以十六进制表示,它是:
64 61 79 5C 72 5C 6E 5C 5C 6E 69 67 68 74 07
d a y \ r \ n \ \ n i g h t BEL
我需要解码 \\
, \r
和 \n
仅。
所需的输出(十六进制):
64 61 79 0D 0A 5C 6E 69 67 68 74 07
d a y CR LF \ n i g h t BEL
使用 decode
不起作用:
>>> print(var.decode('ascii'))
AttributeError: 'str' object has no attribute 'decode'. Did you mean: 'encode'?
使用正则表达式查找并替换 \\
、\r
和 \n
及其转义值是不成功的,因为 \night
中的 \n
被视为 0x0A。
是否可以指定我想要解码哪些字符,或者是否有更合适的模块?我正在使用Python 3.10.2。
I have a Python variable (named var
) containing a string with the following literal data:
day\r\n\\night
in hex, it is:
64 61 79 5C 72 5C 6E 5C 5C 6E 69 67 68 74 07
d a y \ r \ n \ \ n i g h t BEL
I need to decode \\
, \r
and \n
only.
The desired output (in hex):
64 61 79 0D 0A 5C 6E 69 67 68 74 07
d a y CR LF \ n i g h t BEL
Using decode
doesn't work:
>>> print(var.decode('ascii'))
AttributeError: 'str' object has no attribute 'decode'. Did you mean: 'encode'?
Using regex to find and replace \\
, \r
and \n
with their escaped values is unsuccessful, as the \n
in \night
is treated as a 0x0A.
Is it possible to specify which characters I want to decode
, or is there a more appropriate module? I'm using Python 3.10.2.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
data:image/s3,"s3://crabby-images/d5906/d59060df4059a6cc364216c4d63ceec29ef7fe66" alt="扫码二维码加入Web技术交流群"
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
假设
var
是这样的字符串:64617905C725C6E5C5C6E69676877407
(不含空格),您应该尝试:
它将用以下内容替换
\r \n \\
对应的字符(CR LF \
)。稍后我将在
day\r\l\\night
和64617905C725C6E5C5C6E696768774
之间添加转换器。编辑:转换器就在这里!
每次转换后的字符串都是
r
。它处理
input()
的结果,但对于硬编码字符串,您必须输入:var = 'day\\r\\l\\\\night'
这样代码就会将其理解为“day”,然后是“\”,然后是“r”,然后是“\”,然后是“n”,然后是“\”,然后是“\”,然后是“night”< /strong> 而不是'day',然后 CR,然后 LF,然后 '\',然后 'night';因此
打印(var)
将会打印
白天\r\n\\夜晚
而不是
Assuming
var
is a string like this:64617905C725C6E5C5C6E69676877407
(without spaces)you should try:
It will replace the
\r \n \\
by the characters corresponding (CR LF \
).I'll later add converters between
day\r\l\\night
and64617905C725C6E5C5C6E696768774
.EDIT: Converters are here!
The converted string is
r
each time.It handles the results of
input()
but for hard-coded strings you'll have to enter:var = 'day\\r\\l\\\\night'
so that the code will understand it as 'day', then '\', then 'r', then '\', then 'n', then '\', then '\', then 'night' and not 'day', then CR, then LF, then '\', then 'night'; so that upon
print(var)
there will be printed
day\r\n\\night
and not
此处查找类似问题。根据这个你可以做以下
Find similar question here. According to this you can do following
非常感谢每个提供答案的人,但他们似乎都没有完全解决我的问题。经过长时间的研究,我发现这个sahil Kothiya 的解决方案 (mirror) -- 我修改了它来解决我的具体问题:
IDLE 中的演示:
Notepad++ 中显示的特殊字符:
输出字符串的十六进制转储:
它甚至可以使用 Unicode 字符(这是我的 脚本)。
IDLE 中的演示:
Notepad++ 中显示的特殊字符:
输出字符串的十六进制转储:
Many thanks to everyone that contributed their answers, but none of them seemed to solve my issue completely. After long time of research I found this solution from sahil Kothiya (mirror) -- I modified it to resolve my specific issue:
Demonstration in IDLE:
Special characters shown in Notepad++:
Hex dump of output string:
It even works with Unicode characters (an important component to my script).
Demonstration in IDLE:
Special characters shown in Notepad++:
Hex dump of output string: