当前位置：文江博客话题详情

从 Google 搜索中获取 URL 和标题

发布于 2024-10-17 07:51:28 字数 317 浏览 3 评论 0原文

从给定的 Google 搜索词获取 URL 和标题的最简单方法是什么？我只想使用特定术语执行一次此操作，并且我想获取所有 URL/标题，而不是前 10 个。如果有一种方法可以获取分隔的响应（例如，以 CSV 格式），那就太理想了。

我并不是想重新发明轮子，但如果有必要，我愿意这样做（我在 Windows 机器上，我可以用 PHP 编写脚本）。我只是在寻找最快、最可靠、最常见的方法。

更新：到目前为止，这些建议似乎需要适量的编码，既可以解析 HTML/XML，也可以循环通过结果集（增加开始变量，单击“下一步”）。没有现有的程序可以快速做到这一点吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笑脸一如从前 2024-10-24 07:51:28

有很多方法可以做到这一点。你说你懂PHP，那为什么不使用cURL和一些正则表达式呢？

<?php
$c = curl_init();
curl_setopt($c, CURLOPT_URL, "http://www.google.com/search?q=[search term here]&start=0");
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($c);
curl_close($c);
?>

生成的源将位于 $data 中。从那时起，您可以使用 preg_match() 来收集您想要的 URL需要并将它们存储在数组中。或者，您可以尝试使用 XML 解析器更清洁的方法。

请注意，您可以修改 start=0 以返回其他结果。

There are many ways to do this. You say you know PHP, so why not use cURL and some regular expressions?

<?php
$c = curl_init();
curl_setopt($c, CURLOPT_URL, "http://www.google.com/search?q=[search term here]&start=0");
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($c);
curl_close($c);
?>

The resulting source will be in $data. From that point you can use preg_match() to gather the URLs you need and store them in an array. Alternatively, you could try an XML parser for a cleaner approach.

Note that you can modify the start=0 to return additional results.

回复收藏 0 原文