返回介绍

17.5. plural.py, 第 4 阶段

发布于 2019-09-14 13:30:59 字数 6408 浏览 758 评论 0 收藏 0

17.5. plural.py, 第 4 阶段

让我们精炼出代码中的重复之处,以便更容易地定义新规则。

例 17.9. plural4.py

import re
def buildMatchAndApplyFunctions((pattern, search, replace)):  
    matchFunction = lambda word: re.search(pattern, word)      1
    applyFunction = lambda word: re.sub(search, replace, word) 2
    return (matchFunction, applyFunction)                      3
1buildMatchAndApplyFunctions 是一个动态生成其它函数的函数。 它将 pattern, search 和 replace (实际上是一个元组,但很快就会变得不止于此),通过使用 lambda 语法构建一个接受单参数(word)并以传递给 buildMatchAndApplyFunctions 的 pattern 和 传递给新函数的 word 调用 re.search 的匹配函数! 哇塞!
2构建应用规则函数的方法相同。 应用规则函数是一个接受单参数并以传递给 buildMatchAndApplyFunctions 的 search 和 replace 以及传递给这个应用规则函数的 word 调用 re.sub 的函数。在一个动态函数中应用外部参数值的技术被称作 闭合(closures)。你实际上是在应用规则函数中定义常数:接受一个参数(word),但随后它与定义应用规则函数时设置的另外两个值 (search 和 replace)一起工作。
3最终, buildMatchAndApplyFunctions 函数返回一个包含两个值的元组:你刚刚创建的两个函数。你在这些函数中定义的(matchFunction 中的 pattern 以及 applyFunction 中的 search 和 replace) 保留在这些函数中,由 buildMatchAndApplyFunctions 一同返回。 这简直太酷了。

如果这太费解(它应该是这样,这是个怪异的东西),可能需要通过了解它的使用来搞明白。

例 17.10. plural4.py 继续

patterns = \
  (
    ('[sxz]$', '$', 'es'),
    ('[^aeioudgkprt]h$', '$', 'es'),
    ('(qu|[^aeiou])y$', 'y$', 'ies'),
    ('$', '$', 's')
  )                                                 1
rules = map(buildMatchAndApplyFunctions, patterns)  2
1我们的复数化规则现在被定义成一组字符串(不是函数)。 第一个字符串是你在调用 re.search 时使用的正则表达式;第二个和第三个字符串是你在通过调用 re.sub 来应用规则将名词变为复数时使用的搜索和替换表达式。
2这很神奇。 把传进去的 patterns 字符串转换为传回来的函数。 如何做到的呢? 将这些字符串映射给 buildMatchAndApplyFunctions 函数之后,三个字符串参数转换成了两个函数组成的元组。 这意味着 rules 被转换成了前面范例中相同的内容:由许多调用 re.search 函数的匹配函数和调用 re.sub 的规则应用函数构成的函数组组成的一个元组。

我发誓这不是我信口雌黄:rules 被转换成了前面范例中相同的内容。 剖析 rules 的定义,你看到的是:

例 17.11. 剖析规则定义

rules = \
  (
    (
     lambda word: re.search('[sxz]$', word),
     lambda word: re.sub('$', 'es', word)
    ),
    (
     lambda word: re.search('[^aeioudgkprt]h$', word),
     lambda word: re.sub('$', 'es', word)
    ),
    (
     lambda word: re.search('[^aeiou]y$', word),
     lambda word: re.sub('y$', 'ies', word)
    ),
    (
     lambda word: re.search('$', word),
     lambda word: re.sub('$', 's', word)
    )
   )                                          

例 17.12. plural4.py 的完成

def plural(noun):                                  
    for matchesRule, applyRule in rules:            1
        if matchesRule(noun):                      
            return applyRule(noun)                 
1由于 rules 列表和前面的范例是相同的, plural 函数没有变化也就不另人诧异了。 记住,这没什么特别的,按照顺序调用一系列函数。 不必在意规则是如何定义的。 在 第 2 阶段,它们被定义为各具名称的函数。 在 第 3 阶段, 他们被定义为匿名的 lambda 函数。 现在第 4 阶段,它们通过 buildMatchAndApplyFunctions 映射原始的字符串列表被动态创建。 无所谓, plural 函数的工作方法没有变。

还不够兴奋吧!我必须承认,在定义 buildMatchAndApplyFunctions 时我跳过了一个微妙之处。 让我们回过头再看一下。

例 17.13. 回头看 buildMatchAndApplyFunctions

def buildMatchAndApplyFunctions((pattern, search, replace)):   1
1注意到双括号了吗? 这个函数并不是真的接受三个参数,实际上只接受一个参数:一个三元素元组。但是在函数被调用时元组概念被展开了,元组的三个元素也被赋予了不同的变量: pattern, search 和 replace。 乱吗?让我们在使用中理解。

例 17.14. 调用函数时展开元组

>>> def foo((a, b, c)):
...     print c
...     print b
...     print a
>>> parameters = ('apple', 'bear', 'catnap')
>>> foo(parameters) 1
catnap
bear
apple
1调用 foo 的正确方法是使用一个三元素元组。 函数被调用时,元素被分别赋予 foo 中的多个局部变量。

现在,让我们回过头看一看这个元组自动展开技巧的必要性。 patterns 是一个元组列表,并且每个元组都有三个元素。调用 map(buildMatchAndApplyFunctions, patterns),这并不 意味着是以三个参数调用 buildMatchAndApplyFunctions。 使用 map 映射一个列表到函数时,通常使用单参数:列表中的每个元素。 就 patterns 而言, 列表的每个元素都是一个元组,所以 buildMatchAndApplyFunctions 经常是以元组来调用,在 buildMatchAndApplyFunctions 中使用元组自动展开技巧将元素赋值给可以被使用的变量。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文