python怎么给原有模块添加自定义方法?

发布于 2022-09-04 00:03:25 字数 473 浏览 29 评论 0

from bs4 import BeautifulSoup as bs
soup=bs(html_code) #伪代码
text=soup.get_text()       #这个get_text()方法是bs定义好了的方法
my_text=soup.my_get_text() #这个my_get_text()方法是bs没有的方法,会报异常

如上代码,比如bs中本来没有my_get_text()这个方法,
我是否可以写一个自定义模块,比如叫做'my_bs',

import my_bs

当如上导入自定义的模块后,
就能正常运行如下代码:my_text=soup.my_get_text()
说白了,我就是想给已有的bs4包添加一个我自己定义的方法.
但是不是通过修改bs4的源代码,而是自定义一个模块,
在自己的代码中导入自定义模块来达到目的.
多谢!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

镜花水月 2022-09-11 00:03:25
# 如果是类, 试试
# 让bs继承my_bs的方法
my_bs.register(bs)

# for module
# setattr(module, attr, newitem)
setattr(bs, "my_get_text", my_bs.my_get_text)
俯瞰星空 2022-09-11 00:03:25

继承

class mybs(bs):
    def my_get_text(self):
        pass
旧街凉风 2022-09-11 00:03:25

新建myBS.py文件,内容如下:

import bs4

def getTextWithoutScript(self, separator=u"", strip=False,
                                     withoutScript=True, withoutComment=True):
    """获取网页文本,不包含html源码中的script脚本的内容"""
    return separator.join([s for s in self._all_strings(strip) if s.parent.name.lower() != 'script'])

bs4.Tag.getTextWithoutScript = getTextWithoutScript

使用方法:
首先导入myBS.py,其他使用方法就是直接调用,与bs的原生方法一样:

import myBS
from bs4 import BeautifulSoup as bs

s=bs(html_code,'html5lib')
s.getTextWithoutScript()

不方便的地方:在pycharm下该新加入BS的方法不能智能提示!
感谢诸位老师!

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文