当前位置：文江博客话题详情

用于提取具有指定属性的链接的正则表达式

发布于 2024-10-29 11:24:57 字数 281 浏览 9 评论 0原文

我正在尝试构建正则表达式来从没有 rel="nofollow" 的文本中提取链接。

示例：

aiusdiua asudauih aguuia

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

流年里的时光 2024-11-05 11:24:57

以下正则表达式将完成这项工作：

<a (?![^>]*?rel="nofollow")[^>]*?href="(.*?)"

所需的 url 将位于捕获组 #1 中。例如，在 Ruby 中，它会是：

if input =~ /<a (?![^>]*?rel="nofollow")[^>]*?href="(.*?)"/
    match = $~[1]
end

由于它在负向先行中的 rel 之前接受 [^>]*?，href< /code> 或其他任何内容都可以出现在 rel 之前。如果href出现在rel之后，当然也可以。

The following regex will do the job:

<a (?![^>]*?rel="nofollow")[^>]*?href="(.*?)"

The wanted urls will be in the capture group #1. E.g. in Ruby it would be:

if input =~ /<a (?![^>]*?rel="nofollow")[^>]*?href="(.*?)"/
    match = $~[1]
end

Since it accepts [^>]*? before rel in the negative lookahead, href or anything else can come before rel. If href comes after rel, it'll of course also be ok.

回复收藏 0 原文

生生漫 2024-11-05 11:24:57

试试这个
<(?:A|AREA)\b[^<>]*?(?!rel="nofollow")[^<>]*?href=['"]([^ >"]*)[^>]*?>

如果您使用 .net 正则表达式，则

<(?:A|AREA)\b[^<>]*?(?!rel="nofollow")[^<>]*?href=['"](?<URL>[^>"]*)[^>]*?>

数据位于名为 URL 的组或组 1 中

Try this
<(?:A|AREA)\b[^<>]*?(?!rel="nofollow")[^<>]*?href=['"]([^>"]*)[^>]*?>

if you are using .net regex then

<(?:A|AREA)\b[^<>]*?(?!rel="nofollow")[^<>]*?href=['"](?<URL>[^>"]*)[^>]*?>

data lies in group named URL or group 1

回复收藏 0 原文

~没有更多了~

关于作者

情未る

暂无简介

文章

26 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

用于提取具有指定属性的链接的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

用于提取具有指定属性的链接的正则表达式

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。