如何打开带有非 utf-8 参数的 URL
使用 Python,我需要通过查询字符串将非 utf-8 编码数据(特别是 shift-jis)传输到 URL。 我应该如何传输数据?引用一下?编码为utf-8?
谢谢
Using Python I need to transfer non utf-8 encoded data (specifically shift-jis) to a URL via the query string.
How should I transfer the data? Quote it? Encode in utf-8?
Thanks
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
查询字符串参数是基于字节的。虽然 IRI 到 URI 和键入的非 ASCII 字符通常使用 UTF-8,但没有什么强制您以该编码发送或接收自己的参数。
因此,对于 Shift-JIS(实际上通常是 cp932,该编码的 Windows 扩展):
在 Python 3 中,您可以在 quote 函数本身中执行此操作:
Query string parameters are byte-based. Whilst IRI-to-URI and typed non-ASCII characters will typically use UTF-8, there is nothing forcing you to send or receive your own parameters in that encoding.
So for Shift-JIS (actually typically cp932, the Windows extension of that encoding):
In Python 3 you do it in the quote function itself:
我不知道 unicode 与此有什么关系,因为查询字符串是一串字节。您可以使用 urllib 中的引用函数来引用纯字符串,以便它们可以被传递在查询字符串中。
I don't know what unicode has to do with this, since the query string is a string of bytes. You can use the quoting functions in urllib to quote plain strings so that they can be passed within query strings.
通过“查询字符串”,您的意思是像
http:/{URL}?data=XYZ
? 中的 HTTP GET?您可以使用
-_
作为替代字符,通过base64.b64encode
对您拥有的数据进行编码,以确保 URL 安全。请参阅此处。By the »query string« you mean HTTP GET like in
http:/{URL}?data=XYZ
?You have encoding what ever data you have via
base64.b64encode
using-_
as alternative character to be URL safe as an option. See here.