将微小文件直接传输到S3中，然后使用多个lambda使用nodejs使用并行多个lambda s上载。

发布于 2025-01-30 16:34:38 字数 1336 浏览 6 评论 0 原文

我将需要100或1000的微小PDF文件，我需要将其拉动到一个大型ZIP文件中并上传到S3。我目前的解决方案如下：

nodejs服务发送请求，其中包含我需要创建的所有PDF文件的JSON数据，然后zip缩回到lambda函数
lambda函数处理数据，将每个PDF文件创建为缓冲区，将缓冲区推入Zip Archiver，最终确定存档，然后最终Zip Archive Archive Archive Archive Archive Archive使用块中的Passhroughstream流到S3。

我基本上复制了以下解决方案。

现在尽管这是一个有效的解决方案，但它不可扩展，并且所有创建PDF buffer，归档zip并上传到S3中发生在单个lambda执行中，该执行时间为20-30秒或更多，取决于20-30秒最终存档的邮政编码文件的大小。我已经设置了具有10GB内存的lambda和最大15分钟的超时。因为在每100MB的ZIP中，它需要1GB的资源，否则由于使用的最大资源而耗尽。我的邮政编码可能是800MB或更多，这意味着它需要8GB内存或更多。

我想使用AWS Multipart上传，并以某种方式调用多个并行Lambda函数来实现这一目标。如果我必须将创建PDF缓冲区的创建，拉链和S3上传到其他lambdas，那就可以了。但是我需要以某种方式优化它并使其平均运行。

我看到了这篇文章的答案，其中包含一些不错的细节和示例，但似乎是一个大文件。

stream> stream> stream，然后从AWS lambda node.js < /a>

我可以优化这个？任何想法和建议都会很棒。请记住，最终结果需要是一个大型ZIP文件。谢谢

原文