返回介绍

第11章

发布于 2024-01-22 21:44:06 字数 1107 浏览 0 评论 0 收藏 0

1.webbrowser模块有一个open() 方法,它启动web浏览器,打开指定的URL,就这样。Requests模块可以从网上下载文件和页面。BeautifulSoup模块解析HTML。最后,selenium模块可以启动并控制浏览器。

2.requests.get() 函数返回一个Response对象,它有一个text属性,包含下载内容的字符串。

3.如果下载有问题,raise_for_status() 方法将抛出异常,如果下载成功,什么也不做。

4.Response对象的status_code属性包含了HTTP状态码。

5.以'wb',即“写二进制”模式在你的计算机上打开新文件后,利用一个 for循环迭代遍历Response对象的iter_content() 方法,将各段写入该文件。下面是例子:

saveFile = open('filename.html', 'wb')
for chunk in res.iter_content(100000):
     saveFile.write(chunk)

6.F12在Chrome中打开开发者工具。按下Ctrl-Shift-C(在Windows和Linux上)或⌘-Option-C(在OS X),在Firefox中打开开发者工具。

7.右键点击页面上的元素,并从菜单中选择Inspect Element。

8.'#main'

9.'.highlight'

10.'div div'

11.'button[value="favorite"]'

12.spam.getText()

13.linkElem.attrs

14.selenium模块是通过from selenium import webdriver导入的。

15.findelement 方法将第一个匹配的元素返回,作为一个 WebElement对象。findelements 方法返回所有匹配的元素,作为一个WebElement对象列表。

16.click() 和send_keys() 方法分别模拟鼠标点击和键盘按键。

17.对表单中的任意对象调用submit() 方法将提交该表单。

18.forward()、back() 和refresh() 等WebDriver对象方法模拟了这些浏览器按钮。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文