当前位置：文江博客话题详情

如果像 Dropbox 这样的服务的文件存储在云中，它们如何实现增量编码？

发布于 2024-11-10 10:01:28 字数 395 浏览 2 评论 0 原文

Dropbox 声称，在同步过程中，仅将更改的文件部分传输回主服务器，这显然是一个很棒的功能，但它们如何对存储在 Amazon S3 云中的文件进行更改？举例来说，假设用户桌面上的一个 30 页文档仅包含对第 4 页的更改。Dropbox 现在会同步代表更改的块，如果他们存储的文件存储在云中，后端会发生什么情况？这是否意味着他们必须将存储在 S3 中的 30 页文档下载到他们的服务器，然后执行代表第 4 页的块的替换，然后上传回云端？我怀疑情况会是这样，因为这会有些低效。我能想到的另一个选择是，Amazon S3 是否根据字节范围提供存储在云中的文件的更新，例如，向文件 X 从字节 100-200 发出 PUT 请求，这将替换从 100 到 200 的所有字节与 PUT 请求的值。所以我很好奇使用亚马逊等其他云服务的公司如何实现这种类型的同步。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

柠檬 2024-11-17 10:01:28

由于 S3 和类似的存储不提供文件系统功能，因此任何假装存储文件和目录的东西都需要模拟文件系统。在执行此操作时，文件通常会被分割为一定大小的页面，其中每个页面都存储在存储中的单独文件中。这样，更改的块只需要上传一页（例如），而不是整个文件。我应该注意，对于像 Office 文档这样的文件，如果文件大小发生更改，这种方法可能会出错 - 例如，如果您在开头插入页面或删除页面，则整个文件将被更改，并且需要完整的文件需要重新上传。我们没有具体分析 Dropbox 是如何完成他的工作的，我只是描述了常见的场景。还存在不同的“补丁算法”，可以在本地创建补丁（如果 Dropbox 在缓存中有较旧的本地副本），然后将其应用于服务器上的一个或多个块。

回复收藏 0 原文

撞了怀 2024-11-17 10:01:28

有几种通过线路传输增量的同步工具，如 rsync、rdiff、rdiff-backup 等。对于与 S3 的双向同步，有付费服务，如 s3rsync 例如。对于纯粹的客户端同步，可以考虑像 zsync 这样的工具（这是许多人用来滚动的工具） - 输出应用程序更新）。

另一种方法是对目录进行压缩包，生成增量文件（使用 rdiff 或 xdelta3），然后使用时间戳作为密钥的一部分来上传增量文件。为了同步，您需要做的就是在客户端执行这两项检查：

您拥有 S3 中的所有增量文件。如果没有，则拉取它们并应用它们以生成最新的备份状态。
您上次的备份状态对应于您的当前目录。如果没有生成新的增量文件并推送到 S3。

这里涉及的因素是客户端至少 100% 的额外空间利用率。但这种方法将帮助您在需要时恢复更改。

回复收藏 0 原文

~没有更多了~

关于作者

一个人练习一个人

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

如果像 Dropbox 这样的服务的文件存储在云中，它们如何实现增量编码？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如果像 Dropbox 这样的服务的文件存储在云中，它们如何实现增量编码？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

游缘惊梦

小兔几

Glik

生生漫

Luxian

Champion-Ming

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。