保持多个 Linux 服务器同步的最佳方法是什么？

发布于 2024-07-05 21:37:55 字数 437 浏览 10 评论 0原文

我在相当广阔的区域内有几个不同的地点，每个地点都有一个 Linux 服务器来存储公司数据。这些数据每天在不同的地点以不同的方式发生变化。我需要一种方法来使这些数据保持最新并在所有这些位置之间同步。

例如：

在一个位置，有人将一组图像放置在其本地服务器上。在另一个位置，其他人将一组文档放置在其本地服务器上。第三个位置向其服务器添加了一些图像和文档。在另外两个位置，其本地服务器根本没有进行任何更改。到第二天早上，我需要所有五个地点的服务器来保存所有这些图像和文档。

我的第一反应是使用 rsync 和 cron 作业在夜间（凌晨 1 点到 6 点左右）进行同步，此时我们所在位置的带宽都没有被使用。在我看来，最好让一台服务器作为“中央”服务器，首先从其他服务器拉取所有文件。然后它将这些更改推送回每个远程服务器？或者还有其他更好的方法来执行此功能吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一张白纸 2024-07-12 21:37:55

您可以（理论上）做的一件事是使用 Python 或其他东西以及 inotify 内核功能（例如，通过 pyinotify 包）创建一个脚本。

您可以运行该脚本，该脚本注册以接收某些树上的事件。然后，您的脚本可以监视目录，然后在每台服务器上的情况发生变化时更新所有其他服务器。

例如，如果有人将 spreadsheet.doc 上传到服务器，脚本会立即看到它；如果文档在 5 分钟内没有被修改或删除，脚本可以将其复制到其他服务器（例如通过 rsync）。

理论上，这样的系统可以实现一种从一台机器到另一台机器的有限“文件系统复制”。其他。这是一个不错的主意，但您可能必须自己编写代码。

回复收藏 0 原文

|煩躁 2024-07-12 21:37:55

如果 rsync 不是最佳解决方案，则另一种选择是 Unison。 Unison 在 Windows 下工作，并且它具有一些用于处理双方发生更改时的功能（不一定需要像您所建议的那样选择一台服务器作为主服务器）。

根据任务的复杂程度，两者都可以。

回复收藏 0 原文

爱的那么颓废 2024-07-12 21:37:55

我的做法（在 Debian/Ubuntu 机器上）：

使用 dpkg --get-selections 获取已安装的软件包
使用 dpkg --set-selections 来安装这些软件包从创建的列表中
使用源代码控制解决方案来管理配置文件。我以集中方式使用 git，但使用 subversion 也同样容易。

回复收藏 0 原文

夕色琉璃 2024-07-12 21:37:55

AFAIK，rsync 是您的最佳选择，它支持部分文件更新以及各种其他功能。一旦设置，它就非常可靠。您甚至可以使用带时间戳的日志文件设置 cron，以跟踪每次运行中更新的内容。

回复收藏 0 原文

蒲公英的约定 2024-07-12 21:37:55

我不知道这有多实用，但源代码控制系统可能在这里起作用。在白天的某个时刻（也许每小时？），一个 cron 作业运行一次提交，而在夜间，每台机器运行一次结帐。当需要运行签出时，您可能会遇到长时间提交未完成的问题，并且本质上可以通过 rsync 完成相同的事情。

我想我的想法是，中央服务器将使您的同步操作变得更容易 - 冲突可以在中央处理一次，然后推送到其他机器。

回复收藏 0 原文

夏日落 2024-07-12 21:37:55

rsync 将是您的最佳选择。但是您需要仔细考虑如何解决不同站点上相同数据的更新之间的冲突。如果 site-1 已更新
“customers.doc”和 site-2 对同一文件有不同的更新，您将如何解决它？

回复收藏 0 原文

时光无声 2024-07-12 21:37:55

我必须同意 Matt McMinn 的观点，特别是因为它是公司数据，我会使用源代码控制，并根据更改率更频繁地运行它。

我认为中央票据交换所是个好主意。

回复收藏 0 原文

农村范ル 2024-07-12 21:37:55

取决于以下
* 需要同步多少台服务器/计算机？
** 如果使用rsync的服务器太多就会出现问题
** 您可以使用线程并同时或一个接一个地同步到多个服务器。
因此，在后一种情况下，您会在给定时间点看到源计算机上的高负载或服务器（集群中）上不一致的数据

需要同步的文件夹的大小及其更改频率
- 如果数据量很大，那么 rsync 会花费一些时间。
文件数量
- 如果文件数量很大，特别是小文件，rsync 将再次花费大量时间

所以一切都取决于场景是否使用 rsync ， NFS ，版本控制

如果服务器较少并且只是如果数据量较小，则每小时运行一次 rysnc 是有意义的。
如果数据偶尔发生变化，您还可以将内容打包到 RPM 中。

根据所提供的信息，IMO 版本控制将最适合您。

如果两个人上传同名的不同文件，Rsync/scp 可能会出现问题。
多个位置上的 NFS 需要进行完美的架构设计

为什么不拥有一个/多个存储库，并且每个存储库都只提交到这些存储库。
您所需要做的就是保持存储库同步。
如果数据庞大且更新频繁，那么您的存储库服务器将需要大量 RAM 和良好的 I/O 子系统

回复收藏 0 原文

~没有更多了~

关于作者

药祭#氼

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

保持多个 Linux 服务器同步的最佳方法是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

保持多个 Linux 服务器同步的最佳方法是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

束缚ｍ

alipaysp_VP2a8Q4rgx

α

一口甜

厌味

转身泪倾城

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。