使用 Amazon S3 作为后端对文件系统进行版本控制

发布于 2024-11-17 20:08:12 字数 496 浏览 5 评论 0原文

我正在尝试在我的 Debian 计算机和一台 OS X 笔记本电脑上完成以下工作。

我想要的是某种使用 Amazon S3 作为后端的版本控制文件系统。

我的想法是使用 s3fs （使用 FUSE）挂载存储桶，然后创建一个使用 GIT 的文件系统，每次写入文件时都会进行新的提交（我想要长达 x 天的完整版本历史记录）。然后，安装的文件夹应该显示文件的最新版本。我不知道如何解决的问题之一（我认为是由于缺乏经验）是我想将文件与本地文件夹同步。当然，我可以下载所有文件，但这对带宽不友好。

另一个问题是当前版本的 s3fs 似乎无法与 MacFUSE 配合使用。

此外，这种情况可能不会发生，但我想防止两台计算机同时写入文件时文件损坏。如果我理解正确的话，git 本身实现了某种文件锁定，并且不依赖于操作系统的文件锁定。

使这项工作可行的大纲是什么？我想以这种方式存储的文件只是 .tex 文件和矢量图像。

我知道存在一些解决方案（例如 dropbox），但我真的不喜欢它是闭源的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

笑看君怀她人 2024-11-24 20:08:12

首先，我要说的是，我不建议盲目地在 s3 上运行 git。 git在运行过程中会产生很多小文件；当处理大量非常小的对象时，S3 很昂贵（而且很慢）。正如您所猜测的，S3 也没有机制锁定；最终一致性使这成为不可能。最后，git 依赖于对其对象数据库的快速随机访问； S3 无法提供此功能，因此无论如何您都需要整个存储库的本地镜像。

相反，我建议您扩展现有的 git http 后端以推送到 S3。这不会推送松散的文件，而是推送单个包文件。这将利用 S3 的优势——大量加载大型对象。您仍然没有锁定，但是由于您决定何时手动推送，因此您可以找到其他一些方法来轻松协调事情。

回复收藏 0 原文

~没有更多了~