当前位置：文江博客话题详情

自动生成文件名，无冲突

发布于 2024-07-16 07:02:11 字数 227 浏览 4 评论 0原文

我正在编写一个“文件共享托管”，我想在上传到唯一名称时重命名所有文件，并以某种方式跟踪数据库上的名称。由于我不希望两个或多个文件具有相同的名称（这肯定是不可能的），因此我正在寻找一种基于密钥或其他东西为我生成随机名称的算法。

此外，我不想生成名称并搜索数据库以查看该文件是否已存在。我想确保 100% 或 99% 生成的文件名从未由我的应用程序之前创建过。

知道如何编写这样的应用程序吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

金橙橙 2024-07-23 07:02:12

您可以根据文件内容本身生成哈希值。这样做有两个很好的理由：

允许您永远不会存储同一文件两次 - 例如，如果您有一个音乐文件的两个副本，且内容相同，您可以检查是否已存储该文件文件，然后只存储一次。
您将元数据（文件名只是元数据）与 blob 分开。因此，您将拥有一个通过文件内容的哈希进行索引的存储系统，然后将文件元数据与该哈希查找代码相关联。

找到两个计算相同散列的文件的风险实际上并不相同，具体取决于散列的大小，并且您可以通过将文件散列成块来有效地缓解这种风险（这可能会导致一些有趣的存储优化场景：P)。

回复收藏 0 原文

战皆罪 2024-07-23 07:02:12

GUID 是一种方法。基本上可以保证不会出现任何重复（如果您有适当的随机生成器）。

回复收藏 0 原文

吃不饱 2024-07-23 07:02:12

您还可以附加自纪元以来的时间。

回复收藏 0 原文

旧故 2024-07-23 07:02:12

最佳解决方案已经提到过。我只是想补充一些想法。

最简单的解决方案是在每个新文件上都有一个计数器和增量。只要只有一个线程创建新文件，这种方法就非常有效。如果多个线程、进程甚至系统添加新文件，事情就会变得更加复杂。您必须使用锁定或任何类似的同步方法来协调新 ID 的创建。您还可以为每个进程分配 ID 范围以减少同步工作，或通过唯一的进程 ID 扩展文件 ID。

更好的解决方案可能是在这种情况下使用 GUID，并且不必关心进程之间的同步。

最后，您可以为每个标识符添加一些随机数据，以使它们更难以猜测这是否是一个要求。

此外，常见的是将文件存储在目录结构中，其中文件的位置取决于其名称。文件 abcdef1234.xyz 可能存储为 /ab/cd/ef/1234.xyz。这避免了包含大量文件的目录。我不太清楚为什么这样做——可能是文件系统限制、性能问题——但这很常见。我不知道如果文件直接存储在数据库中，类似的事情是否常见。

回复收藏 0 原文

榕城若虚 2024-07-23 07:02:12

最好的方法是简单地使用计数器。第一个文件是 1，下一个是 2，另一个是 3，依此类推...

但是，看来您想要随机。要快速执行此操作，您可以确保随机数大于最后创建的文件。您可以缓存最后一个文件，然后将随机数与其姓氏相抵消。

file = last_file + random(1 through 10)

The best way is to simply use a counter. The first file is 1, the next is 2, another is 3, and so on...

But, it seems you want random. To quickly do this, you could make sure that your random number is greater than the last file created. You can cache the last file and then just offset your random number with its last name.