非罗马 Unicode 字符如何在域名中编码?
假设我有一个 URL,例如:
http://ほっけがおいしい.com
如果我将其放入任何浏览器中,我会神奇地得到:
http://xn--n8jaqhy3b1euj.com/
将 Unicode 字符转码为拉丁字符的算法是什么?这看起来应该很容易通过谷歌搜索,但我似乎找不到任何东西。
我想扭转它——考虑到后者,我想得到前者。
用例是我想使用 URL 处理程序在 iPhone 上的应用程序之间传递一些信息,但我不能保证内容是拉丁字符。
Say I have a URL such as:
http://ほっけがおいしい.com
If I put this in any browser, I insto-magically get:
http://xn--n8jaqhy3b1euj.com/
What is the algorithm to transcode the Unicode characters into mere latin ones? This seems like it should be easily Google-able but I really can't seem to find anything.
I want to reverse it -- given the latter, I want to get the former.
The use case is that I want to pass some information on the iPhone between apps using URL handlers, but I can't guarantee that the content will be Latin characters.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我不确定这是否涵盖了所有内容,我还没有通读所有 RFC,但这可能是一个不错的起点:与 IDN 相关的 RFC
I'm not sure if this covers it all, I've not read through all the RFCs but it might be a good place to start: RFCs Related to IDN