当前位置：文江博客话题详情

2 个文件，一半内容与 1 个文件，两倍内容，哪个更大？

发布于 2024-08-27 05:59:19 字数 281 浏览 5 评论 0原文

如果我有 2 个文件，每个文件都包含以下内容：

“你好世界”（x 1000）

是否比 1 个文件占用更多空间：

“你好世界”（x 2000）

将内容划分为多个较小的文件有哪些缺点（假设有理由将它们划分为更多文件，而不是像这个示例）？

更新：

我使用的是 Macbook Pro，10.5。但我也想知道 Ubuntu Linux 的情况。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

久伴你 2024-09-03 05:59:19

马塞洛斯给出了一般表现情况。我认为担心这一点是不成熟的优化。您应该将内容拆分为不同的文件，其中拆分它们是合乎逻辑的。

另外，如果您确实关心此类重复文件的文件大小，那么您可以压缩它们。
的简单游程长度编码

你的例子甚至暗示了这一点， “Hello World”x1000

比实际写出 1000 次“hello world”要节省空间得多。

回复收藏 0 原文

新雨望断虹 2024-09-03 05:59:19

文件在磁盘上以簇的形式占用空间。簇由多个扇区组成，其大小取决于磁盘的格式化方式。

集群的典型大小为 8 KB。这意味着两个较小的文件将各自使用两个簇（16 KB），而较大的文件将使用三个簇（24 KB）。

一个文件平均会使用比其大小多一半的簇。因此，簇大小为 8 KB 时，每个文件的平均开销为 4 KB。

回复收藏 0 原文

云醉月微眠 2024-09-03 05:59:19

大多数文件系统使用固定大小的簇（典型的为 4 kB，但不通用）来存储文件。低于此簇大小的文件将占用相同的最小数量。

即使超过此大小，当您有大量小文件时，比例浪费往往会很高。忽略大小分布的偏度（这会使事情变得更糟），总体浪费大约是集群大小乘以文件数量的一半，因此对于给定的数据量，您拥有的文件越少，存储数据的效率就越高。

另一个考虑因素是元数据操作（尤其是文件删除）可能非常昂贵，因此较小的文件也不是您的朋友。 ReiserFS 在这方面做了一些有趣的工作，直到作者因谋杀妻子而入狱（我不知道该项目的当前状态）。

如果可以的话，您还可以调整文件大小以始终填满整个簇，这样小文件就不会成为问题。但这通常太挑剔了，不值得，而且还有其他成本。对于大容量吞吐量，目前最佳文件大小在 64 MB 到 256 MB 之间（我认为）。

实用建议：将您的内容保存在数据库中，除非有充分的理由不这样做。 SQLite 大幅减少了数量的原因。

回复收藏 0 原文

天气好吗我好吗 2024-09-03 05:59:19

我认为要根据 API 和用于读/写它们的语言（以及最终的 API 限制）来考虑文件的使用。
如果您一次读取一个大文件，则磁盘碎片往往会减少，如果您一次读取一个大文件，则数据访问将会受到影响，而对小文件的多次访问间隔时间不会受到碎片的影响。

回复收藏 0 原文

陌伤浅笑 2024-09-03 05:59:19

大多数文件系统以大于字节的单位分配空间（现在通常为 4KB）。有效文件大小“四舍五入”为该“簇大小”的下一个倍数。因此，分割文件几乎总是会消耗更多的总空间。当然，目录中还有一个额外的条目，这可能会导致它消耗更多的空间，并且许多文件系统都有一个额外的中间层 inode，每个文件消耗一个条目。

分割有什么缺点
内容分成多个较小的文件
（假设有理由划分
它们进入更多文件，而不是像这样
示例）？

更多浪费的空间
可能会耗尽索引节点（在极端情况下）
在某些文件系统上：当目录包含许多文件时性能非常差（因为它们实际上是无序列表）
单个文件中的内容通常可以按顺序读取（即无需从HD上移动读/写头），这是最有效的方法。当它跨越多个文件时，这种理想情况的可能性就变得不大。

回复收藏 0 原文

~没有更多了~

关于作者

独﹏钓一江月

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

2 个文件，一半内容与 1 个文件，两倍内容，哪个更大？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

2 个文件，一半内容与 1 个文件，两倍内容，哪个更大？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。