当前位置：文江博客话题详情

从 svn 存储库中删除包含所有历史记录的文件

发布于 2024-08-17 09:52:00 字数 270 浏览 2 评论 0原文

有什么方法可以从 svn 存储库中删除文件（包括其所有历史记录）吗？当我想删除存储库中的大型二进制文件时，就会出现此问题。

我知道只有一种方法可能在这种情况下有所帮助：

在 svnadmin 实用程序的帮助下转储所有存储库。
使用grep过滤转储文件。 Grep 应该使用文件名并写入另一个转储文件
使用 svnadmin 导入最后一个转储文件

但这太复杂且不可靠。也许还有另一种解决方案？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风筝有风，海豚有海 2024-08-24 09:52:00

最近使用命令 svndumpfilter 变得更加简单。详细信息可在 Subversion 文档此处。基本上，为了避免冲突（此处进行了解释），它需要一个存储库转储并重做每个提交，包括或排除给定的文件前缀。基本语法：

svndumpfilter exclude yourfileprefix < yourdump > yournewdump

排除可能是提问者正在寻找的内容，但您也可以使用包含来提取存储库的子树，以便将其分离为自己的存储库。

subversion 中的 subversion 的最新版本（非常元）也可以采用 glob 模式。我最近不得不从存储库中删除所有 pdf，这很容易完成，如下所示：

svndumpfilter exclude --pattern '*.pdf' < dump > dump_nopdfs

可以通过调用 svndumpfilter help 和 svndumpfilter help except 找到更多使用信息。

This has recently become much more straightforward with the command svndumpfilter. Details are available in the subversion documentation here. Basically, to avoid conflicts (explained here), it takes a repo dump and redoes each commit, either including or excluding a given file prefix. Basic syntax:

svndumpfilter exclude yourfileprefix < yourdump > yournewdump

Exclude is probably what the question asker is looking for, but you can also use include to, say, extract a subtree of the repo so as to spin it off as its own repository.

The latest revision of subversion in subversion (very meta) can also take glob patterns. I recently had to remove all pdfs from a repo and it was very easily done like so:

svndumpfilter exclude --pattern '*.pdf' < dump > dump_nopdfs

Further usage information can be found by calling svndumpfilter help and svndumpfilter help exclude.

回复收藏 0 原文

浮生面具三千个 2024-08-24 09:52:00

但这太复杂而且不可靠。

我不知道为什么这不应该被认为是可靠的。但是，如果您想完全删除该文件、历史记录等等，无论该文件对以前的修订有什么影响，只有一种方法可以做到这一点，而且这种方法确实很复杂。确实如此。 SVN 是一款只有一个目标的工具：永远不会丢失任何文件，即使在删除文件之后也是如此。强迫它做其他事情应该很困难。

回复收藏 0 原文

心头的小情儿 2024-08-24 09:52:00

我遇到了类似的问题，除了我需要删除多个文件，而不仅仅是一个文件，而且我们使用的是 Subversion 1.6，它不支持 --patern 指令。

-- 备份当前 SVN

$ cp -R /svn  /svnSAVE

-- 转储存储库

$ svnadmin dump /svn/root > svnDump

-- 创建新转储，同时排除非常大的文件

$ svndumpfilter exclude "/path/file.csv" < svnDump > newSvnDump0
-- {note: should see a message like this}:
--          Dropped 1 node:
--                  '/path/file.csv'

-- 创建另一个新转储，同时排除另一个非常大的文件

$ svndumpfilter exclude "/path/anotherFile.csv" < newSvnDump0 > newSvnDump1

-- 删除旧的 svn

$ rm -rf /svn

-- 重新创建 svn 目录

$ mkdir -p /svn/root

-- 重新创建 SVN

$ svnadmin create /svn/root

- - 使用转储重新填充新存储库

$ cat newSvnDump1 | svnadmin load /svn/root

- 将保存的副本中的conf文件更新到新副本...

$ cp /svnSAVE/root/conf/* /svn/root/conf

现在存储库不应包含2个大文件“file.csv”和“anotherFile.csv”

I was facing a similar issue, except that I needed to remove multiple files, not just one file, and also we are on Subversion 1.6 which doesn't support the --patern directive.

-- backup current SVN

$ cp -R /svn  /svnSAVE

-- dump repository

$ svnadmin dump /svn/root > svnDump

-- create new dump while excluding the very large file

$ svndumpfilter exclude "/path/file.csv" < svnDump > newSvnDump0
-- {note: should see a message like this}:
--          Dropped 1 node:
--                  '/path/file.csv'

-- create another new dump while excluding another very large file

$ svndumpfilter exclude "/path/anotherFile.csv" < newSvnDump0 > newSvnDump1

-- remove the old svn

$ rm -rf /svn

-- recreate the svn directories

$ mkdir -p /svn/root

-- recreate the SVN

$ svnadmin create /svn/root

-- repopulate the fresh repository with the dump

$ cat newSvnDump1 | svnadmin load /svn/root

-- update the conf files from the saved copy into the new copy...

$ cp /svnSAVE/root/conf/* /svn/root/conf

Now the repository should not contain the 2 large files "file.csv" and "anotherFile.csv"

回复收藏 0 原文

陌伤ぢ 2024-08-24 09:52:00

我同意 McDowell 的提议，但建议您考虑将大文件替换为仅包含已删除条目的文件哈希的文本文件。

例如，如果您因意外签入构建目录而产生大量 .o 文件，则这可能不合适。但是，如果您要从包含一堆您确实想要的二进制工件的目录中删除一堆您不想要的二进制工件，那么您就很有可能犯下代价高昂的错误。至少，考虑从主干和大多数分支中删除它们，但保留一个充满占位符文本文件的功能分支以及原始二进制文件的哈希值。这至少足以弄清楚以后发生了什么，验证不应该删除的杂散副本实际上是正确的文件，并将其放回修订控制之下。

并且，显然，在您考虑执行任何此类操作之前，请将整个存储库备份为只读状态，例如几个 M-Disc 或其他东西。

回复收藏 0 原文

~没有更多了~