URL C# 的正则表达式

发布于 2024-10-03 14:35:16 字数 378 浏览 7 评论 0原文

在我的 C# 程序中，我编写了一个 Google 搜索函数，它的工作原理是从每个页面获取源代码并通过正则表达式获取 URL。

我的实际正则表达式是：

(?:(?:(?:http)://)(?:w{3}\\.)?(?:[a-zA-Z0-9/;\\?&=:\\-_\\$\\+!\\*'\\(\\|\\\\~\\[\\]#%\\.])+)

目前效果很好，但我得到的 URL 例如 http://www.example.com/forums/arcade.php?efdf=332

我只想得到在本例中，URL 末尾不带 ?efdf=332。

那么我应该如何更改正则表达式？

原文

In my C# program I wrote a Google Search Function, which works by fetching the source from each page and getting the URLs via regex.

My actual Regex is:

(?:(?:(?:http)://)(?:w{3}\\.)?(?:[a-zA-Z0-9/;\\?&=:\\-_\\$\\+!\\*'\\(\\|\\\\~\\[\\]#%\\.])+)

This works good at the moment, but I get for example URLs like http://www.example.com/forums/arcade.php?efdf=332

I just want to get in this case the URL without the ?efdf=332 at the end.

So how should I change the regex?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

草莓酥 2024-10-10 14:35:16

http://(?:www\.)?[a-zA-Z0-9/;&=:_$+!*'()|~\[\]#%.\\-]+

与您的正则表达式相同（我删除了很多不必要的垃圾），但停止匹配 ? 之前的链接。

在 C# 中：

Regex regexObj = new Regex(@"http://(?:www\.)?[a-zA-Z0-9/;&=:_$+!*'()|~\[\]#%.\\-]+")

也就是说，我不确定这是匹配 URL 的好方法（https、ftp、mailto 等怎么样？ .?)

http://(?:www\.)?[a-zA-Z0-9/;&=:_$+!*'()|~\[\]#%.\\-]+

does the same as your regex (I've removed a lot of unnecessary cruft) but stops matching a link before a ?.

In C#:

Regex regexObj = new Regex(@"http://(?:www\.)?[a-zA-Z0-9/;&=:_$+!*'()|~\[\]#%.\\-]+")

That said, I'm not sure this is such a good way of matching URLs (what about https, ftp, mailto etc.?)

回复收藏 0 原文

羁绊已千年 2024-10-10 14:35:16

您可以使用 Uri 类访问 URL 的各个部分，并从末尾删除查询字符串，或连接所需的部分。

回复收藏 0 原文

~没有更多了~

关于作者

涫野音

暂无简介

0 文章

0 评论

23 人气

关注发私信

苦中寻乐

文章 0 评论 0

关注

lueluelue

文章 0 评论 0

关注

嗼ふ静

文章 0 评论 0

关注

王权女流氓

文章 0 评论 0

关注

与花如笺

文章 0 评论 0

关注

残酷

文章 0 评论 0

友情链接

文江博客

URL C# 的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

URL C# 的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

苦中寻乐

lueluelue

嗼ふ静

王权女流氓

与花如笺

残酷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。