PHP爬行获取电子邮件模式

发布于 2024-12-20 16:30:59 字数 613 浏览 0 评论 0原文

可能的重复:
用于提取 mailto: 地址的正则表达式

我想获取带有页面的电子邮件通过以下脚本,但我不确定 preg_match_all 中使用的模式。

 $original_file = file_get_contents("http://www.example.com/");
 $stripped_file = strip_tags($original_file, "<a>");
 preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);

 header("Content-type: text/plain"); 
 print_r($matches); //View the array to see if it worked

Possible Duplicate:
Regexp for extracting a mailto: address

I want to fetch the emails withing a page through the following scrip, but i am not sure about the pattern to use in preg_match_all.

 $original_file = file_get_contents("http://www.example.com/");
 $stripped_file = strip_tags($original_file, "<a>");
 preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);

 header("Content-type: text/plain"); 
 print_r($matches); //View the array to see if it worked

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

撞了怀 2024-12-27 16:30:59

您可能会更幸运地使用 HTML 解析器,例如 PHP Simple HTML Dom Parser,它可以让您解析 HTML 文档以更自然的方式,例如:

// Find all anchors, returns a array of element objects
$ret = $html->find('a');

然后循环返回元素的数组并检查 href 中是否有类似 @ 符号的内容。

You might have more luck using an HTML parser such as PHP Simple HTML Dom Parser which will let you parse the HTML document in a more natural way such as:

// Find all anchors, returns a array of element objects
$ret = $html->find('a');

Then loop through the array of returned elements and check the href for something like the @ symbol.

我不在是我 2024-12-27 16:30:59

编辑:我刚刚意识到你的意思是 mailto: links

在这里回答:

用于提取 mailto: 地址的正则表达式

Edit: I've just realised you meant mailto: links

Answer here:

Regexp for extracting a mailto: address

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文