PHP应用程序设计

发布于 2024-10-10 17:17:00 字数 189 浏览 7 评论 0原文

我必须做一个将废弃大约 100 个 URL 的 Scraper，该 Scraper 必须在由 CronJob 调用的 PHP CLI 中运行。我完全不知道如何管理这个...对于每个 URL，我正在考虑创建一个新文件，以便在必须更新特定 URL 的代码时让事情变得清晰。

这可能是一个不错的选择？那么，可以从单个 CronJob 调用所有这些文件吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

挽手叙旧 2024-10-17 17:17:00

您希望通过将这 100 个 URL 存储在数据库或文本文件中来轻松管理它们。
然后只需加载所有网址，循环遍历它们并调用您的抓取函数即可。

回复收藏 0 原文

坠似风落 2024-10-17 17:17:00

您可以做的是，

维护所有 100 个网址的列表以及别名（可以是任何名称，例如 http://google.com）。

使用以下命名约定“别名.php”为每个 URL 创建文件，编写代码来解析该文件中的 URL。

现在，您可以调用一个 Cronjob，它将从数据库中检索您的所有 URL。您可以循环遍历每个 URL，并使用相应的别名执行文件。

例如。
如果您的网址是：http://google.com，别名是Google。为此，您需要创建名为 Google.php 的文件，编写 Scrapping 代码。在 cron 作业中，您将拥有类似

$urls = getAllURLs();    
foreach($urls as $url){

include_once($url['alias'].".php");

}

希望这会有所帮助的代码。

谢谢！

侯赛因

What you can do is,

Maintain the list of all 100 URLs along with the Alias name (could by anything, say 'Google' for http://google.com) in Database.

Create file for each URL with following naming conventions 'Alias name.php', Write code to parse URL in that file.

Now you can invoke one Cronjob which will retrieve all of your URLs from the Database. You can loop through each URL an execute the file with corresponding Alias name.

For example.
If your URL is : http://google.com and Alias for it is Google. For that you need to create file named Google.php, Write the code for Scrapping. In cron job you will have code something like

$urls = getAllURLs();    
foreach($urls as $url){

include_once($url['alias'].".php");

}

Hope this will help.

Thanks!

Hussain

回复收藏 0 原文

~没有更多了~

关于作者

太阳男子

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

PHP应用程序设计

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

PHP应用程序设计

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。