非罗马 Unicode 字符如何在域名中编码?

发布于 2024-10-11 06:59:27 字数 309 浏览 3 评论 0原文

假设我有一个 URL,例如:

http://ほっけがおいしい.com

如果我将其放入任何浏览器中,我会神奇地得到:

http://xn--n8jaqhy3b1euj.com/

将 Unicode 字符转码为拉丁字符的算法是什么?这看起来应该很容易通过谷歌搜索,但我似乎找不到任何东西。

我想扭转它——考虑到后者,我想得到前者。

用例是我想使用 URL 处理程序在 iPhone 上的应用程序之间传递一些信息,但我不能保证内容是拉丁字符。

Say I have a URL such as:

http://ほっけがおいしい.com

If I put this in any browser, I insto-magically get:

http://xn--n8jaqhy3b1euj.com/

What is the algorithm to transcode the Unicode characters into mere latin ones? This seems like it should be easily Google-able but I really can't seem to find anything.

I want to reverse it -- given the latter, I want to get the former.

The use case is that I want to pass some information on the iPhone between apps using URL handlers, but I can't guarantee that the content will be Latin characters.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

她说她爱他 2024-10-18 06:59:27

我不确定这是否涵盖了所有内容,我还没有通读所有 RFC,但这可能是一个不错的起点:与 IDN 相关的 RFC

I'm not sure if this covers it all, I've not read through all the RFCs but it might be a good place to start: RFCs Related to IDN

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文