Python 实用技巧

发布于 2021-04-09 12:22:36 字数 9769 浏览 1231 评论 0

本文整理自SO上的热门问答 hidden features of python,早期有人做过类似的整理,但是内容比较旧而且比较粗糙,因此笔者在原文基础上加入自己的一些理解,另外那些高质量的评论也引入进来了。总之这是一篇用心之作,希望你可以喜欢。

链式比较操作

>>> x = 5
>>> 1 < x < 10
True
>>> 10 < x < 20 
False
>>> x < 10 < x*10 < 100
True
>>> 10 > x <= 9
True
>>> 5 == x > 4
True

你可能认为它执行的过程先是:1 < x,返回True,然后再比较True < 10,当然这么做也是返回True,比较表达式True < 10,因为解释器会把True转换成1False转换成0。但这里的链式比较解释器在内部并不是这样干的,它会把这种链式的比较操作转换成:1 < x and x < 10,不信你可以看看最后一个例子。这样的链式操作本可以值得所有编程语言拥有,但是很遗憾

枚举

>>> a = ['a', 'b', 'c', 'd', 'e']
>>> for index, item in enumerate(a): print index, item
...
0 a
1 b
2 c
3 d
4 e
>>>

用enumerate包装一个可迭代对象,可以同时使用迭代项和索引,如果你不这么干的话,下面有一种比较麻烦的方法:

for i in range(len(a)):
    print i, a[i]

enumerate 还可以接收一个可选参数start,默认start等于0。enumerate(list, start=1),这样index的起始值就是1

生成器对象

x=(n for n in foo if bar(n))  #foo是可迭代对象
>>> type(x)
<type 'generator'>

你可以把生成器对象赋值给x,意味着可以对x进行迭代操作:

for n in x:
    pass

它的好处就是不需要存储中间结果,也许你会使用(列表推倒式):

x = [n for n in foo if bar(n)]
>>> type(x)
<type 'list'>

它比生成器对象能带来更快的速度。相对地,生成器更能节省内存开销,它的值是按需生成,不需要像列表推倒式一样把整个结果保存在内存中,同时它不能重新迭代,列表推倒式则不然。

iter() 可接收 callable 参数

iter() 内建函数接收的参数分为两种,第一种是:

iter(collection)---> iterator

参数collection必须是可迭代对象或者是序列 ,第二种是:

iter(callable, sentinel) --> iterator

callable函数会一直被调用,直到它的返回结果等于sentinel,例如:

def seek_next_line(f):
    #每次读一个字符,直到出现换行符就返回
    for c in iter(lambda: f.read(1),'\n'):  
        pass

小心可变的默认参数

>>> def foo(x=[]):
...     x.append(1)
...     print x
... 
>>> foo()
[1]
>>> foo()
[1, 1]
>>> foo()
[1, 1, 1]

取而代之的是你应该使用一个标记值表示“没有指定”来替换可变值,如:

>>> def foo(x=None):
...     if x is None:
...         x = []
...     x.append(1)
...     print x
>>> foo()
[1]
>>> foo()
[1]

发送值到生成器函数在中

def mygen():
    """Yield 5 until something else is passed back via send()"""
    a = 5
    while True:
        f = (yield a) #yield a and possibly get f in return
        if f is not None: 
            a = f  #store the new value

你可以:

>>> g = mygen()
>>> g.next()
5
>>> g.next()
5
>>> g.send(7)  #we send this back to the generator
7
>>> g.next() #now it will yield 7 until we send something else
7

如果你不喜欢使用空格缩进,那么可以使用C语言花括号{}定义函数:

>>> from __future__ import braces   #这里的braces 指的是:curly braces(花括号)
  File "<stdin>", line 1
SyntaxError: not a chance

当然这仅仅是一个玩笑,想用花括号定义函数?没门。感兴趣的还可以了解下:

from __future__ import barry_as_FLUFL

不过这是python3里面的特性,http://www.python.org/dev/peps/pep-0401/

切片操作中的步长参数

a = [1,2,3,4,5]
>>> a[::2]  # iterate over the whole list in 2-increments
[1,3,5]

还有一个特例:x[::-1],反转列表:

>>> a[::-1]
[5,4,3,2,1]

有关反转,还有两个函数reverse、reversed,reverse是list对象的方法,没有返回值,而reversed是内建方法,可接收的参数包括tuple、string、list、unicode,以及用户自定义的类型,返回一个迭代器。

>>> l = range(5)
>>> l
[0, 1, 2, 3, 4]
>>> l.reverse()
>>> l
[4, 3, 2, 1, 0]
>>> l2 = reversed(l)
>>> l2
<listreverseiterator object at 0x99faeec>

装饰器

装饰器使一个函数或方法包装在另一个函数里头,可以在被包装的函数添加一些额外的功能,比如日志,还可以对参数、返回结果进行修改。装饰器有点类似Java中的AOP。下面这个例子是打印被装饰的函数里面的参数的装饰器,

>>> def print_args(function):
>>>     def wrapper(*args, **kwargs):
>>>         print 'Arguments:', args, kwargs
>>>         return function(*args, **kwargs)
>>>     return wrapper

>>> @print_args
>>> def write(text):
>>>     print text

>>> write('foo')
Arguments: ('foo',) {}
foo

@是语法糖,它等价于:

>>> write = print_args(write)
>>> write('foo')
arguments: ('foo',) {}
foo

for ... else 语法

for i in foo:
    if i == 0:
        break
else:
    print("i was never 0")

else代码块只有在for循环正常结束后执行如果遇到break语句那么不会执行else语句块,等价于下面:

found = False
for i in foo:
    if i == 0:
        found = True
        break
if not found: 
    print("i was never 0")

不过这种语法看起来怪怪地,让人感觉是else块是在for语句块没有执行的时候执行的,很容易让人去类比 if else 的语法,如果是把else换成finally或许更容易理解

python 2.5 有个 __missing__ 方法

dict 的子类如果定义了方法 __missing__(self, key),如果key不再dict中,那么d[key]就会调用 __missing__ 方法,而且 d[key] 的返回值就是 __missing__ 的返回值。

>>> class MyDict(dict):
...  def __missing__(self, key):
...   self[key] = rv = []
...   return rv
... 
>>> m = MyDict()
>>> m["foo"].append(1)
>>> m["foo"].append(2)
>>> dict(m)
{'foo': [1, 2]}

在 collections 模块下有一个叫 defaultdict 的 dict 子类,它与missing非常类似,但是对于不存在的项不需要传递参数。

>>> from collections import defaultdict
>>> m = defaultdict(list)
>>> m["foo"].append(1)
>>> m["foo"].append(2)
>>> dict(m)
{'foo': [1, 2]}

变量值交换

>>> a = 10
>>> b = 5
>>> a, b
(10, 5)

>>> a, b = b, a
>>> a, b
(5, 10)

等号右边是一个创建元组的表达式,等号左边解压(没有引用的)元组分别赋给名称(变量)a和b。赋完值后因为没有被其他名字引用,因此被标记之后被垃圾收集器回收,而绑定到a和b的值已经被交换了。
注意:多值赋值其实仅仅就是元组打包和序列解包的组合的过程

可读的正则表达式

在Python中你可以把正则表达式分割成多行写,还可以写注释

>>> pattern = """
... ^                   # beginning of string
... M{0,4}              # thousands - 0 to 4 M's
... (CM|CD|D?C{0,3})    # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's),
...                     #            or 500-800 (D, followed by 0 to 3 C's)
... (XC|XL|L?X{0,3})    # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's),
...                     #        or 50-80 (L, followed by 0 to 3 X's)
... (IX|IV|V?I{0,3})    # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's),
...                     #        or 5-8 (V, followed by 0 to 3 I's)
... $                   # end of string
... """
>>> re.search(pattern, 'M', re.VERBOSE)

函数参数解包(unpacking)

分别使用***解包列表和字典,这是一种非常实用的快捷方式,因为list,tuple,dict作为容器被广泛使用

def draw_point(x, y):
    # do some magic

point_foo = (3, 4)
point_bar = {'y': 3, 'x': 2}

draw_point(*point_foo)
draw_point(**point_bar)

动态地创建新类型

动态创建新类型虽不是实用功能,但了解一下也是有好处的

>>> NewType = type("NewType", (object,), {"x": "hello"})
>>> n = NewType()
>>> n.x
"hello"

type的第一个参数就是类名,第二个参数是继承的父类,第三个参数是类的属性.它完全等同于:

>>> class NewType(object):
>>>     x = "hello"
>>> n = NewType()
>>> n.x
"hello"

上下文管理器与 with 语句

上下文管理器(context manager)用于规定某个对象的使用范围,进入或退出该范围时,特殊的操作会被执行(比如关闭连接,释放内存等等),语法是:with... as ...,该特性在python2.5引入的. 上下文管理器协议有两个方法组成contextmanager.__enter__()contextmanager.__exit__(),任何实现了这两个方法的对象都称之为上下文管理器对象,比如文件对象就默认实现了该协议.

with open('foo.txt', 'w') as f:
    f.write('hello!')

字典的 get() 方法

字典的get()方法用来替换d['key'],后者如果是遇到key不存在会有异常,如果使用的d.get('key'),key不存在时它返回的是None,你可以指定两个参数如:d.get('key',0)来用0取代返回的None

sum[value] = sum.get(value, 0) + 1

还有一个类似的方法 setdefault(key, value),如果字典中存在 key,那么就直接返回 d[key],否则设置 d[key]=value,并返回该值。

>>> d = {'key':123}
>>> d.setdefault('key',456)
123
>>> d['key']
123
>>> d.setdefault('key2',456)
456
>>> d['key2']
456

collections.Counter 是 dict 的子类,用来统计可哈稀对象。

>>> cnt = Counter('helloworld')
>>> cnt
Counter({'l': 3, 'o': 2, 'e': 1, 'd': 1, 'h': 1, 'r': 1, 'w': 1})
>>> cnt['l']
3
>>> cnt['x'] = 10
>>> cnt.get('y')

描述符 (Descriptors)

描述符是 python 的核心特新之一,当你使用 . 访问成员时,(如:x.y),python 首先在实例字典中查找该成员,如果没有发现再从类字典中查找,如果这个对象实现了描述符(实现了 __get__,__set__,__delete__),那么优先返回 __get__ 方法的返回值。

条件赋值

为什么python中没有类c语言的三目运算符,Guido van Rossum 说过了,条件赋值更容易理解。

x = 3 if (y == 1) else 2

这个表达式的意思就是:如果y等于那么就把 3 赋值给x,否则把 2 赋值给 x,条件中的括号是可选的,为了可读性可以考虑加上去。if else 中的表达式可以是任何类型的,既可以函数,还可以类。

(func1 if y == 1 else func2)(arg1, arg2) 

如果 y 等于1,那么调用 func1(arg1,arg2) 否则调用 func2(arg1, arg2)。

x = (class1 if y == 1 else class2)(arg1, arg2)

class1,class2 是两个类

异常 else 语句块

try:
   try_this(whatever)
except SomeException, exception:
   #Handle exception
else:
    # do something
finally:
    #do something

else 语句块会在没有异常的情况下执行,先于 finally,它的好处就是你可以明确知道它会在没有异常的情况下执行,如果是把 else 语句块放在 try 语句块里面就达不到这种效果。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据

关于作者

JSmiles

生命进入颠沛而奔忙的本质状态,并将以不断告别和相遇的陈旧方式继续下去。

文章
评论
84963 人气
更多

推荐作者

饮湿

文章 0 评论 0

明月

文章 0 评论 0

02

文章 0 评论 0

hs1283

文章 0 评论 0

风向决定发型

文章 0 评论 0

落花浅忆

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文