安排向特定站点发送 http 请求

发布于 2024-11-07 14:30:29 字数 186 浏览 9 评论 0原文

我希望每当特定站点中的搜索查询出现新结果时都能收到通知。该网站不为此提供任何功能（通过 RSS、警报等）。我认为实现此目的的一种方法是发送http请求（用于搜索）并处理http响应以发送邮件以获取出现的任何新结果。搜索参数可以是静态的，也可以更好地从源（如csv文件）中获取。有谁知道现有的解决方案（最好是在线）可以实现这一点。

谢谢，杰特

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

仅一夜美梦 2024-11-14 14:30:29

尝试 iHook，它允许您安排（频率为 1 分钟）对公共 Web 资源的 HTTP 请求，并接收规则 -基于电子邮件的通知。您可以围绕响应状态代码和响应正文创建通知规则（通过 JSON 表达式和 CSS 选择器）。

回复收藏 0 原文

生生漫 2024-11-14 14:30:29

这取决于您要查询的特定站点。

回复收藏 0 原文

请爱~陌生人 2024-11-14 14:30:29

我知道没有“开箱即用”的开源解决方案可以做到这一点，所以我相信您需要编写一个自定义蜘蛛/爬行器来完成您的任务；它需要提供以下服务：

调度 - 何时进行爬网。通常使用类 Unix 系统中的“cron”系统服务或 Windows 中的任务计划程序。
检索 - 检索目标页面。使用 Perl 等脚本语言或“curl”或“wget”等专用系统工具。
提取/规范化 - 从目标（检索的页面）中删除除感兴趣内容之外的所有内容。需要补偿与任务无关的目标部分的变化，例如日期或广告。通常通过支持正则表达式（对于简单情况）的脚本语言或 HTML 解析器库（对于更专业的提取）来完成。
校验和 - 将目标转换为由其内容确定的唯一标识符。用于确定自上次爬网以来目标的更改。通过系统工具（例如Linux“cksum”命令）或脚本语言来完成。
更改检测 - 将上次检索的目标的先前保存的校验和与当前检索的新计算的校验和进行比较。同样，通常使用脚本语言。
警报 - 通知用户已识别的更改。通常通过电子邮件或短信。
状态管理 - 存储上次运行的目标 URI、提取规则、用户首选项和目标校验和。使用配置文件或数据库（如 Mysql）。

请注意，此服务列表试图抽象地描述系统，因此听起来比您创建的实际工具复杂得多。我之前已经编写过几个类似的系统，因此我预计一个用 Perl 编写的简单解决方案（利用标准 Perl 模块）并在 Linux 上运行，对于几个目标站点来说需要一百行左右，具体取决于提取的复杂性。