当前位置：文江博客话题详情

亚马逊网络服务的后台工作

发布于 2024-11-27 14:28:55 字数 266 浏览 1 评论 0原文

我是 AWS 新手，因此我需要一些有关如何正确创建后台作业的建议。我有一些数据（大约 30GB），我需要：

a）从其他服务器下载；它是一组 zip 存档，其中包含 RSS 提要中的链接

b) 解压缩到 S3

c) 处理每个文件或有时一组解压缩文件，执行数据转换，并将其存储到 SimpleDB/S3

d) 根据 RSS 更新永久重复

有人可以建议 AWS 上正确解决方案的基本架构吗？

谢谢。

丹尼斯

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

若沐 2024-12-04 14:28:56

我认为在 Elasticbeanstalk 实例上部署您的代码将可以大规模地为您完成这项工作。因为我看到您正在此处处理大量数据，并且使用普通的 EC2 实例可能会耗尽资源（主要是内存）。此外，AWS SQS 批量处理的想法也将有助于优化流程并有效管理服务器端的超时

回复收藏 0 原文

倒带 2024-12-04 14:28:55

我认为您应该运行一个 EC2 实例来执行您需要的所有任务，并在完成后将其关闭。这样您只需为 EC2 的运行时间付费。然而，根据您的架构，您可能需要一直运行它，但是小型实例非常便宜。

回复收藏 0 原文

我做我的改变 2024-12-04 14:28:55

从其他服务器下载；它是一组 zip 存档，其中包含 RSS 提要中的链接

您可以使用 wget

解压到S3

尝试使用s3-tools (github.com/timkay/aws/raw/master/aws)

处理每个文件或有时一组解压文件，执行数据转换，并将其存储到 SimpleDB/S3

编写您自己的 bash 脚本

根据 RSS 更新永远重复

又一个 bash 脚本来检查更新 + 通过 Cron 运行脚本

回复收藏 0 原文

抠脚大汉 2024-12-04 14:28:55

首先，编写一些执行 a) 到 c) 的代码。测试它等等。

如果您想定期运行代码，那么它是使用后台进程工作流的良好候选者。将作业添加到队列中；当它被认为完成时，将其从队列中删除。大约每隔一小时就会向队列添加一个新作业，这意味着“获取 RSS 更新并解压缩它们”。

您可以使用 AWS Simple Queue Service 或任何其他后台作业处理服务/库手动完成此操作。您可以在 EC2 或任何其他托管解决方案上设置一个工作实例，该实例将轮询队列、执行任务并再次轮询，直到永远。

使用 Amazon Simple Workflow Service 可能更容易，它似乎适合您正在尝试的用途要做（自动化工作流程）。注意：我从未真正使用过它。

回复收藏 0 原文

~没有更多了~

关于作者

一个人的夜不怕黑

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

亚马逊网络服务的后台工作

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

亚马逊网络服务的后台工作

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。