对调用者来说看起来很纯粹但内部使用突变的函数

发布于 2024-09-19 01:58:39 字数 431 浏览 13 评论 0原文

我刚刚拿到了 Expert F# 2.0 的副本，并发现了这样的说法，这让我有些惊讶：

例如，当需要时，您可以对私有数据使用副作用开始时分配的结构一个算法，然后丢弃这些返回之前的数据结构结果;那么总体结果是有效无副作用功能。分离的一个例子来自 F# 库的是该库的 List.map 的实现，它使用内部突变；写入发生基于内部的、分离的数据其他代码无法实现的结构访问。

现在，显然这种方法的优点是性能。我只是好奇是否有任何缺点——可能带来副作用的任何陷阱都适用于此吗？并行性是否受到影响？

换句话说，如果抛开性能，用纯粹的方式实现List.map会更好吗？

（显然这特别涉及 F#，但我也对一般哲学感到好奇）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

对你的占有欲 2024-09-26 01:58:39

我认为副作用的几乎所有缺点都与“与程序其他部分的交互”有关。副作用本身并不坏（正如 @Gabe 所说，即使是纯功能程序也会不断改变 RAM），而是效果的常见副作用（非本地交互）导致问题（调试/性能/可理解性） /ETC。）。因此，对纯局部状态（例如，对不转义的局部变量）的影响是很好的。

（我能想到的唯一缺点是，当人类看到这样的局部可变变量时，他们必须推理它是否可以逃逸。在 F# 中，局部可变变量永远无法逃逸（闭包无法捕获可变变量），因此唯一的潜力是“心理税”来自于对可变引用类型的推理。）

摘要：使用效果是可以的，只要很容易让自己相信效果只发生在非逃逸的当地人身上。（在其他情况下使用效果也是可以的，但我忽略了其他情况，因为在这个问题线程上，我们是开明的函数式程序员，在合理的情况下试图避开效果。:)）

（如果你想要非常深层的局部效果（如 F# 的 List.map 实现中的效果）不仅不会妨碍并行性，而且实际上是一个好处，从更高效的实现分配更少的角度来看，因此也更少对 GC 的共享资源造成压力。）

回复收藏 0 原文

满栀 2024-09-26 01:58:39

您可能对 Simon Peyton Jones 的 “惰性功能状态线程”。我只浏览了前几页，内容非常清晰（我确信其余部分也非常清晰）。

重要的一点是，当您在 Haskell 中使用 Control.Monad.ST 执行此类操作时，类型系统本身会强制执行封装。在 Scala（也可能是 F#）中，方法更多的是“相信我们，我们不会在您的 map 中使用这个 ListBuffer 做任何偷偷摸摸的事情”。

回复收藏 0 原文

緦唸λ蓇 2024-09-26 01:58:39

如果函数使用本地、私有（对于函数而言）可变数据结构，则并行化不受影响。因此，如果 map 函数在内部创建一个与列表大小相同的数组，并迭代填充该数组的元素，您仍然可以在同一台机器上同时运行 map 100 次不用担心，因为 map 的每个实例都有自己的私有数组。由于您的代码在填充数组之前无法看到数组的内容，因此它实际上是纯粹的（请记住，在某种程度上，您的计算机必须实际改变 RAM 的状态）。

另一方面，如果函数使用全局可变数据结构，并行化可能会受到影响。例如，假设您有一个 Memoize 函数。显然，它的全部要点是维护某种全局状态（尽管“全局”是指它不是函数调用的本地状态，但它仍然是“私有”，因为它在函数外部不可访问），以便它不必使用相同的参数多次运行一个函数，但它仍然是纯粹的，因为相同的输入总是会产生相同的输出。如果您的缓存数据结构是线程安全的（例如ConcurrentDictionary），那么您仍然可以与其自身并行运行您的函数。如果不是，那么您可能会认为该函数不是纯粹的，因为它具有并发运行时可以观察到的副作用。

我应该补充一点，F# 中的一种常见技术是从纯函数例程开始，然后在分析显示速度太慢时利用可变状态（例如缓存、显式循环）对其进行优化。

回复收藏 0 原文