- 内容提要
- 作者简介
- 技术评审者简介
- 致谢
- 译者序 会编程的人不一样
- 前言
- 本书的读者对象
- 编码规范
- 什么是编程
- 本书简介
- 下载和安装 Python
- 启动 IDLE
- 如何寻求帮助
- 聪明地提出编程问题
- 小结
- 第一部分 Python 编程基础
- 第1章 Python 基础
- 第2章 控制流
- 第3章 函数
- 第4章 列表
- 第5章 字典和结构化数据
- 第6章 字符串操作
- 第二部分 自动化任务
- 第7章 模式匹配与正则表达式
- 第8章 读写文件
- 第9章 组织文件
- 第10章 调试
- 第11章 从 Web 抓取信息
- 第12章 处理 Excel 电子表格
- 第13章 处理 PDF 和 Word 文档
- 第14章 处理 CSV 文件和 JSON 数据
- 第15章 保持时间、计划任务和启动程序
- 第16章 发送电子邮件和短信
- 第17章 操作图像
- 第18章 用 GUI 自动化控制键盘和鼠标
- 附录A 安装第三方模块
- 附录B 运行程序
- 附录C 习题答案
第11章
1.webbrowser模块有一个open() 方法,它启动web浏览器,打开指定的URL,就这样。Requests模块可以从网上下载文件和页面。BeautifulSoup模块解析HTML。最后,selenium模块可以启动并控制浏览器。
2.requests.get() 函数返回一个Response对象,它有一个text属性,包含下载内容的字符串。
3.如果下载有问题,raise_for_status() 方法将抛出异常,如果下载成功,什么也不做。
4.Response对象的status_code属性包含了HTTP状态码。
5.以'wb',即“写二进制”模式在你的计算机上打开新文件后,利用一个 for循环迭代遍历Response对象的iter_content() 方法,将各段写入该文件。下面是例子:
saveFile = open('filename.html', 'wb') for chunk in res.iter_content(100000): saveFile.write(chunk)
6.F12在Chrome中打开开发者工具。按下Ctrl-Shift-C(在Windows和Linux上)或⌘-Option-C(在OS X),在Firefox中打开开发者工具。
7.右键点击页面上的元素,并从菜单中选择Inspect Element。
8.'#main'
9.'.highlight'
10.'div div'
11.'button[value="favorite"]'
12.spam.getText()
13.linkElem.attrs
14.selenium模块是通过from selenium import webdriver导入的。
15.findelement 方法将第一个匹配的元素返回,作为一个 WebElement对象。findelements 方法返回所有匹配的元素,作为一个WebElement对象列表。
16.click() 和send_keys() 方法分别模拟鼠标点击和键盘按键。
17.对表单中的任意对象调用submit() 方法将提交该表单。
18.forward()、back() 和refresh() 等WebDriver对象方法模拟了这些浏览器按钮。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论