简单的版本控制系统或版本控制文件系统或版本控制数据库

发布于 2024-10-31 07:27:43 字数 982 浏览 6 评论 0原文

我正在寻找一个用于大量记录或文件的简单版本控制系统（约 5000 万条，约 100GB 未打包，约 20MB 打包）。每个文件只有几千字节，并且具有唯一的 ID，因此我不介意它们是否存储在平面结构（表、目录...）中。平均而言，每条记录每月更改一次，但大多数更改的差异小于千字节，因此应该很容易压缩版本。然而，每个版本只有一个条目的原始数据库会增长得太快。我需要以下操作：

基本 CRUD 操作：创建、读取、更新、删除
最近更改的快速列表
特定记录的最近更改的快速列表
查询给定时间段内的更改
查询给定用户的更改（每次编辑与某个用户 ID 相关联，并且可以选择将提交消息作为注释）
对于写入操作，必须有一个提交挂钩来验证和拒绝格式不正确的记录。

简而言之，我正在寻找一个类似 Wiki 的软件，用于简单的记录或文件。

我考虑了可能的解决方案：

将文件放入版本控制系统中。这为我提供了复制和许多可用的访问工具，因此它是我的首选解决方案。但数据量对于git这样的分布式系统来说太大了。有人使用 Subversion 成功完成类似任务吗？
在数据库或文件系统中实现我自己的版本控制。我可能只需要存储压缩的记录和差异，会有更多的工作并学习一些东西。如果只是为了好玩，这将是我的首选解决方案。
使用版本控制文件系统。这将使设置、复制和访问变得更加困难。也许我需要在文件系统之上实现我自己的访问 API。
使用版本控制数据库系统。您能建议一些吗？
使用一些其他现有数据存储进行版本控制（MediaWiki？、Amazon Cloud Drive？...）

显然有很多路径。其他人已成功使用哪些路径来处理类似或大量数据？

原文