从 URL 中清理并提取域名

发布于 2025-01-13 01:24:47 字数 639 浏览 0 评论 0原文

我正在尝试从 URL 列表中提取并清理域。我读了这篇文章
如何从网址中提取域名?
到目前为止我可以做到这一点

$ URI="http://user:[email protected]:80/"
$ echo $URI | sed -e 's/[^/]*\/\/\([^@]*@\)\?\([^:/]*\).*/\2/'
example.com

但是在我的 URL 列表中也有一些像下面这样的情况

example1.comDNT:
example2.comContent-Length:

我想要如下的输出

example1.com
example2.com

我可以使用 python 来解决这个问题
任何建议将不胜感激
多谢

I am trying to extract and clean the domains from a list of URLs. I read the post
How to extract domain name from url?
So far I can do this

$ URI="http://user:[email protected]:80/"
$ echo $URI | sed -e 's/[^/]*\/\/\([^@]*@\)\?\([^:/]*\).*/\2/'
example.com

But in my list of URLS there are also some cases like below

example1.comDNT:
example2.comContent-Length:

I want to have output as below

example1.com
example2.com

Can I use python to solve this
Any advice would be appreciated
Thanks alot

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

留一抹残留的笑 2025-01-20 01:24:47

你能试试这个吗:

echo $URI | awk -F'http://user:pw@' '{print $2}' | sed 's/\.com.*/.com/'

Could you try this:

echo $URI | awk -F'http://user:pw@' '{print $2}' | sed 's/\.com.*/.com/'
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文