http 的正则表达式模式匹配

发布于 2024-08-31 20:04:50 字数 343 浏览 4 评论 0原文

我想从网页的 href 中提取 url...为此，我使用正则表达式模式作为 "(?(http:[/][/]|www.)([az]|[AZ]|[0-9]|[/.]|[~])*)"

从 html i 中提取 href使用了这个模式 @"href=\""(?[^\""#]?(?=[\""#]))(?(?#{2}[^#]?#{ 2})*)(?#[^""]+)?"""

但问题是...它不会从 href 中提取网址，而是提取像“www.seo-sem.com”这样的网址..并且在我只得到的结果..“www.seo”...在连字符之后它被截断...请你建议一个更好的正则表达式模式来从 href 中提取 url..将感谢你...

需要登录才能够评论，你可以免费注册一个本站的账号。

少跟Wǒ拽 2024-09-07 20:04:50

使用 HTML Agility Pack 解析您的 HTML。您可以使用 Xpath 查询它，因为它将 HTML 解析为类似 XmlDocument 的对象。

请参阅此了解不这样做的原因使用正则表达式解析 HTML。

~没有更多了~

暂无简介

0 文章

0 评论

23 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0