URI 转义 C++字符串

发布于 2024-08-09 18:48:37 字数 420 浏览 5 评论 0原文

我正在寻找一种在 C++ 中进行 URI 转义的好方法，这对于跨平台项目来说是合理的。

我想要一个函数，它需要这样的字符串：

L"jiayou加油"

并返回：

L"jiayou%E5%8A%A0%E6%B2%B9"

我考虑使用类似 this 的东西，稍作修改即可使用 wchar_t。但是，这需要在 printf 调用之前从 utf-16 转换为 utf-8。这让我陷入了字符编码的地狱。

这种方法以及我研究过的所有其他方法都感觉是错误的方法。有没有一种好方法可以在 C++ 中转义 URI wstring？

原文

I am looking for a good way to do a URI Escape in C++ that would be reasonable for a cross platform project.

I would like a function that would take a string like this:

L"jiayou加油"

And return:

L"jiayou%E5%8A%A0%E6%B2%B9"

I looked at using some thing like this, with minor modifacations to use wchar_t. However that would require converting from utf-16 to utf-8 before the printf call. This has lead me down character encoding hell.

This and all the other approaches I have looked into just feel like the wrong way. Is there a good way to URI Escape a wstring in C++?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

无风消散 2024-08-16 18:48:37

无论你做什么，你都会陷入某种字符编码地狱（这就是字符编码的方式）。

来自 http://labs.apache.org/webarch/uri/rfc /rfc3986.html#字符：

URI 语法提供了一种将数据编码为字符序列的方法，大概是为了识别资源。 URI 字符又经常被编码为八位字节以供传输或表示。本规范不强制要求任何特定的字符编码用于 URI 字符和用于存储或传输这些字符的八位字节之间的映射。当 URI 出现在协议元素中时，字符编码由该协议定义；如果没有这样的定义，则假定 URI 与周围文本采用相同的字符编码。

因此，在某些时候，您需要将 URI 转换为适合您将 URI 发送到的目标的编码。如果是 UTF8，那么您最好在执行百分比编码之前进行转换，以便可以使用已经找到的库例程。如果它不是 UTF8 那么你需要知道 URI 的接收者期望什么（同样，这就是字符集编码的方式 - 你必须知道另一个人期望什么，或者能够告诉他），这样你就可以对期望的字符集中的字符进行百分比编码。

回复收藏 0 原文

~没有更多了~