从任何 URL 获取准确的域名
我需要从任何 URL 中提取准确的域名。
例如,
网址:http://www.google.com -->域名:google.com
网址:http://www.google.co.uk/path1/path2< /a>-->域名:google.co.uk
这在 C# 中怎么可能?是否有完整的 TLD 列表或用于该任务的解析器?
I need to extract the exact domain name from any Url.
For example,
Url : http://www.google.com --> Domain : google.com
Url : http://www.google.co.uk/path1/path2 --> Domain : google.co.uk
How can this is possible in c# ? Is there a complete TLD list or a parser for that task ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(5)
您可以使用 Uri 类 访问 URI 的所有组成部分:
但是,有没有内置方法可以将子域“www”从“www.google.co.uk”中剥离。您需要实现自己的逻辑,例如
You can use the Uri Class to access all components of an URI:
However, there is no built-in way to strip the sub-domain "www" off "www.google.co.uk". You need to implement your own logic, e.g.
用途:
输入:
输出:
也适用于以下情况。
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co.uk
http://localhost.intranet:88/path1/path2 → localhost.intranet:88
http://www2.google.com → www2.google.com
Use:
Input:
Output:
Also works for the following.
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co.uk
http://localhost.intranet:88/path1/path2 → localhost.intranet:88
http://www2.google.com → www2.google.com
尝试 System.Uri 类。
http://msdn.microsoft.com/en-us/library/system .uri.aspx
返回“www.google.co.uk”。从那里开始进行字符串操作。 :/
Try the System.Uri class.
http://msdn.microsoft.com/en-us/library/system.uri.aspx
which returns "www.google.co.uk". From there it's string manipulation. :/
使用:
输入:
结果:
use:
Input:
Result:
另一种变体,没有依赖项:
示例:
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co .uk
http://localhost.intranet:88/path1/path2 → localhost.intranet:88
http://www2.google.com → www2.google.com
Another variant, without dependencies:
Examples:
http://www.google.com → google.com
http://www.google.co.uk/path1/path2 → google.co.uk
http://localhost.intranet:88/path1/path2 → localhost.intranet:88
http://www2.google.com → www2.google.com