快速磁盘存储 (SSD) 的优化算法？

发布于 2024-07-24 07:24:51 字数 347 浏览 7 评论 0原文

鉴于固态硬盘 (SSD) 的价格正在下降，并且很快将作为系统驱动器变得更加普遍，并且其访问率明显高于旋转磁性介质，哪些标准算法将通过使用 SSD 进行本地存储来提高性能贮存？例如，SSD 的高随机读取速度使得基于磁盘的哈希表之类的东西成为大型哈希表的可行性； 4GB 的磁盘空间随时可用，这使得对 32 位整数的整个范围进行散列变得可行（不过，更多的是用于查找而不是填充，这仍然需要很长时间）；虽然由于访问速度的原因，这种大小的哈希表无法与旋转介质一起使用，但对于 SSD 来说这不应该是一个问题。

即将过渡到 SSD 是否会在其他领域带来算法性能的潜在提升？我宁愿看到关于一件事如何运作的推理，而不是意见；我不希望这件事引起争议。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

ㄖ落Θ余辉 2024-07-31 07:24:51

您的哈希表示例确实是受益的关键数据库结构。无需将整个 4GB 或更多文件加载到内存中来探测值，而是可以直接探测 SSD。 SSD 仍然比 RAM 慢几个数量级，但是在磁盘上有一个 50GB 的哈希表是相当合理的，但不在 RAM 中，除非你花大钱买大铁。

一个例子是国际象棋位置数据库。我有超过 50GB 的哈希位置。有复杂的代码来尝试将哈希中彼此靠近的相关位置分组，因此我可以一次分页表的 10MB，并希望将其中的一些重用于多个类似的位置查询。为了提高效率，需要大量的代码和复杂性。

更换为 SSD 后，我能够降低集群的所有复杂性，只使用非常愚蠢的随机散列。我的性能也得到了提高，因为我只从磁盘获取所需的数据，而不是 10MB 的大块。延迟确实更大，但净加速是显着的..并且超级干净的代码（20 行，而不是 800+），也许更好。

回复收藏 0 原文

东走西顾 2024-07-31 07:24:51

SSD 的随机访问速度明显更快。对磁盘的顺序访问，它们的性能仅是主流旋转驱动器的两倍。许多 SSD 在许多情况下性能较差，导致其性能较差，如所述此处。

虽然 SSD 确实取得了很大进展，但它们仍然比 CPU 操作和物理内存慢得多。对于 4GB 哈希表示例，您可以通过 SSD 维持 250+ MB/s 的速度来访问随机哈希表存储桶。对于旋转驱动器，如果能突破个位数 MB/s 就已经很幸运了。如果您可以将这个 4 GB 哈希表保留在内存中，那么您可以每秒千兆字节的速度访问它 - 甚至比非常快的 SSD 还要快得多。

引用的文章列出了微软在 SSD 上运行时对 Windows 7 所做的几项更改，这可以让您了解可以考虑进行哪些更改。首先，用于从磁盘预取数据的 SuperFetch 被禁用 - 它旨在解决缓慢的磁盘随机访问时间，而 SSD 可以缓解这一问题。碎片整理已禁用，因为将文件分散在磁盘上不会影响 SSD 的性能。

回复收藏 0 原文