关于HTMLParser爬虫问题
我的python版本:
# python -V
Python 2.4.3
有一个程序:
#!/usr/bin/python #-*- encoding: gb2312 -*- import HTMLParser class MyParser(HTMLParser.HTMLParser): def __init__(self): HTMLParser.HTMLParser.__init__(self) def handle_starttag(self, tag, attrs): if tag == 'a': for name,value in attrs: if name == 'href': print value if __name__ == '__main__': a = '<html><head><title>test</title><body><a href="http: //www.163.com"> Á´½Óµ½163</a></body></html>' my = MyParser() my.feed(a)执行的时候报错:
# ./test1.py Traceback (most recent call last): File "./test1.py", line 18, in ? my = MyParser() File "./test1.py", line 7, in __init__ HTMLParser.HTMLParser.__init__(self) TypeError: __init__() takes at least 2 arguments (1 given)typeerror显示需要至少两个参数,而程序只给了1个,这里头需要怎么修改代码?3Q
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
Win 7/Python 2.7.2,没有问题
是的
程序本身其实没问题,换了测试平台,就OK了