当前位置：文江博客话题详情

在 S3 到 EC2 之间复制数据的最快/最佳方式？

发布于 2024-07-16 23:12:01 字数 218 浏览 3 评论 0原文

我有相当大量的数据（约 30G，分成约 100 个文件），我想在 S3 和 EC2 之间传输：当我启动 EC2 实例时，我想将数据从 S3 复制到 EC2 本地磁盘尽快，当我完成处理后，我想将结果复制回 S3。

我正在寻找一种可以来回快速/并行复制数据的工具。我已经破解了几个脚本，其中一个做得很好，所以我不是在寻找指向基本库的指针；而是在寻找指向基本库的指针。我正在寻找快速且可靠的东西。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你丑哭了我 2024-07-23 23:12:02

我认为您最好使用弹性块存储来存储文件而不是 S3。 EBS 类似于 S3 上的“驱动器”，可以安装到 EC2 实例中，而无需每次复制数据，从而允许您在 EC2 实例之间保留数据，而无需每次都写入 S3 或从 S3 读取。

http://aws.amazon.com/ebs/

回复收藏 0 原文

朕就是辣么酷 2024-07-23 23:12:02

安装s3cmd软件包作为

yum install s3cmd

或

sudo apt-get install s3cmd

根据您的操作系统

，然后复制数据，这

s3cmd get s3://tecadmin/file.txt

也可以列出文件。

有关更多详细信息，请参阅此

Install s3cmd Package as

yum install s3cmd

sudo apt-get install s3cmd

depending on your OS

then copy data with this

s3cmd get s3://tecadmin/file.txt

also ls can list the files.

for more detils see this

回复收藏 0 原文

小ぇ时光︴ 2024-07-23 23:12:02

对我来说最好的形式是：

wget http://s3.amazonaws.com/my_bucket/my_folder/my_file.ext

来自 PuTTy

For me the best form is:

wget http://s3.amazonaws.com/my_bucket/my_folder/my_file.ext

from PuTTy

回复收藏 0 原文

木格 2024-07-23 23:12:01

不幸的是，Adam的建议不会起作用，因为他对EBS的理解是错误的（尽管我希望他是对的，并且经常认为自己应该这样工作）...因为EBS与S3无关，但它只会给你EC2 实例的“外部驱动器”是独立的，但可连接到实例。即使两者之间没有数据传输成本，您仍然需要在 S3 和 EC2 之间进行复制。

您没有提到您的实例的操作系统，因此我无法提供定制信息。我使用的一个流行的命令行工具是 http://s3tools.org/s3cmd ...它基于 Python，因此，根据根据其网站上的信息，它应该可以在 Win 和 Linux 上运行，尽管我一直在 Linux 上使用它。您可以轻松地创建一个快速脚本，该脚本使用其内置的“sync”命令，其工作原理与 rsync 类似，并在每次处理完数据时触发它。您还可以使用递归 put 和 get 命令仅在需要时获取和放置数据。

Cloudberry Pro 等图形工具也有一些适用于 Windows 的命令行选项，您可以设置计划命令。 http://s3tools.org/s3cmd 可能是最简单的。

回复收藏 0 原文