内容提要
作者简介
技术评审者简介
致谢
译者序会编程的人不一样
前言
本书的读者对象
编码规范
什么是编程
本书简介
下载和安装 Python
启动 IDLE
如何寻求帮助
聪明地提出编程问题
小结
第一部分 Python 编程基础
第1章 Python 基础
- 1.1 在交互式环境中输入表达式
- 1.2 整型、浮点型和字符串数据类型
- 1.3 字符串连接和复制
- 1.4 在变量中保存值
- 1.5 第一个程序
- 1.6 程序剖析
- 1.7 小结
- 1.8 习题
第2章控制流
- 2.1 布尔值
- 2.2 比较操作符
- 2.3 布尔操作符
- 2.4 混合布尔和比较操作符
- 2.5 控制流的元素
- 2.6 程序执行
- 2.7 控制流语句
- 2.8 导入模块
- 2.9 用 sys.exit() 提前结束程序
- 2.10 小结
- 2.11 习题
第3章函数
- 3.1 def 语句和参数
- 3.2 返回值和 return 语句
- 3.3 None 值
- 3.4 关键字参数和 print()
- 3.5 局部和全局作用域
- 3.6 global 语句
- 3.7 异常处理
- 3.8 一个小程序：猜数字
- 3.9 小结
- 3.10 习题
- 3.11 实践项目
第4章列表
- 4.1 列表数据类型
- 4.2 使用列表
- 4.3 增强的赋值操作
- 4.4 方法
- 4.5 例子程序：神奇8球和列表
- 4.6 类似列表的类型：字符串和元组
- 4.7 引用
- 4.8 小结
- 4.9 习题
- 4.10 实践项目
第5章字典和结构化数据
- 5.1 字典数据类型
- 5.2 漂亮打印
- 5.3 使用数据结构对真实世界建模
- 5.4 小结
- 5.5 习题
- 5.6 实践项目
第6章字符串操作
- 6.1 处理字符串
- 6.2 有用的字符串方法
- 6.3 项目：口令保管箱
- 6.4 项目：在 Wiki 标记中添加无序列表
- 6.5 小结
- 6.6 习题
- 6.7 实践项目
第二部分自动化任务
第7章模式匹配与正则表达式
- 7.1 不用正则表达式来查找文本模式
- 7.2 用正则表达式查找文本模式
- 7.3 用正则表达式匹配更多模式
- 7.4 贪心和非贪心匹配
- 7.5 findall() 方法
- 7.6 字符分类
- 7.7 建立自己的字符分类
- 7.8 插入字符和美元字符
- 7.9 通配字符
- 7.10 正则表达式符号复习
- 7.11 不区分大小写的匹配
- 7.12 用sub()方法替换字符串
- 7.13 管理复杂的正则表达式
- 7.14 组合使用 re.IGNOREC ASE、re.DOTALL 和 re.VERBOSE
- 7.15 项目：电话号码和 E-mail 地址提取程序
- 7.16 小结
- 7.17 习题
- 7.18 实践项目
第8章读写文件
- 8.1 文件与文件路径
- 8.2 文件读写过程
- 8.3 用 shelve 模块保存变量
- 8.4 用 pprint.pformat() 函数保存变量
- 8.5 项目：生成随机的测验试卷文件
- 8.6 项目：多重剪贴板
- 8.7 小结
- 8.8 习题
- 8.9 实践项目
第9章组织文件
- 9.1 shutil 模块
- 9.2 遍历目录树
- 9.3 用 zipfile 模块压缩文件
- 9.4 项目：将带有美国风格日期的文件改名为欧洲风格日期
- 9.5 项目：将一个文件夹备份到一个ZIP文件
- 9.6 小结
- 9.7 习题
- 9.8 实践项目
第10章调试
- 10.1 抛出异常
- 10.2 取得反向跟踪的字符串
- 10.3 断言
- 10.4 日志
- 10.5 IDLE的调试器
- 10.6 小结
- 10.7 习题
- 10.8 实践项目
第11章从 Web 抓取信息
- 11.1 项目：利用 webbrowser 模块的 mapIt.py
- 11.2 用 requests 模块从 Web 下载文件
- 11.3 将下载的文件保存到硬盘
- 11.4 HTML
- 11.5 用 BeautifulSoup 模块解析 HTML
- 11.6 项目：I’m Feeling Lucky Google 查找
- 11.7 项目：下载所有 XKCD 漫画
- 11.8 用 selenium 模块控制浏览器
- 11.9 小结
- 11.10 习题
- 11.11 实践项目
第12章处理 Excel 电子表格
- 12.1 Excel 文档
- 12.2 安装 openpyxl 模块
- 12.3 读取 Excel 文档
- 12.4 项目：从电子表格中读取数据
- 12.5 写入 Excel 文档
- 12.6 项目：更新一个电子表格
- 12.7 设置单元格的字体风格
- 12.8 Font 对象
- 12.9 公式
- 12.10 调整行和列
- 12.11 小结
- 12.12 习题
- 12.13 实践项目
第13章处理 PDF 和 Word 文档
- 13.1 PDF 文档
- 13.2 项目：从多个 PDF 中合并选择的页面
- 13.3 Word 文档
- 13.4 小结
- 13.5 习题
- 13.6 实践项目
第14章处理 CSV 文件和 JSON 数据
- 14.1 csv 模块
- 14.2 项目：从 CSV 文件中删除表头
- 14.3 JSON 和 API
- 14.4 json 模块
- 14.5 项目：取得当前的天气数据
- 14.6 小结
- 14.7 习题
- 14.8 实践项目
第15章保持时间、计划任务和启动程序
- 15.1 time 模块
- 15.2 数字四舍五入
- 15.3 项目：超级秒表
- 15.4 datetime 模块
- 15.5 回顾 Python 的时间函数
- 15.6 多线程
- 15.7 项目：多线程 XKCD 下载程序
- 15.8 从 Python 启动其他程序
- 15.9 项目：简单的倒计时程序
- 15.10 小结
- 15.11 习题
- 15.12 实践项目
第16章发送电子邮件和短信
- 16.1 SMTP
- 16.2 发送电子邮件
- 16.3 IMAP
- 16.4 用 IMAP 获取和删除电子邮件
- 16.5 项目：向会员发送会费提醒电子邮件
- 16.6 用 Twilio 发送短信
- 16.7 项目：只给我发短信模块
- 16.8 小结
- 16.9 习题
- 16.10 实践项目
第17章操作图像
- 17.1 计算机图像基础
- 17.2 用 Pillow 操作图像
- 17.3 项目：添加徽标
- 17.4 在图像上绘画
- 17.5 小结
- 17.6 习题
- 17.7 实践项目
第18章用 GUI 自动化控制键盘和鼠标
- 18.1 安装 pyautogui 模块
- 18.2 走对路
- 18.3 控制鼠标移动
- 18.4 项目：现在鼠标在哪里？
- 18.5 控制鼠标交互
- 18.6 处理屏幕
- 18.7 项目：扩展 mouseNow 程序
- 18.8 图像识别
- 18.9 控制键盘
- 18.10 复习 PyAutoGUI 的函数
- 18.11 项目：自动填表程序
- 18.12 小结
- 18.13 习题
- 18.14 实践项目
附录A 安装第三方模块
- A.1 pip 工具
- A.2 安装第三方模块
附录B 运行程序
- B.1 第一行
- B.2 在 Windows 上运行 Python 程序
- B.3 在 OS X 和 Linux 上运行 Python 程序
- B.4 运行 Python 程序时禁用断言
附录C 习题答案
- 第1章
- 第2章
- 第3章
- 第4章
- 第5章
- 第6章
- 第7章
- 第8章
- 第9章
- 第10章
- 第11章
- 第12章
- 第13章
- 第14章
- 第15章
- 第16章
- 第17章
- 第18章

文江博客开发文档 Python 编程快速上手 - 让繁琐工作自动化文章详情

文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

18.8 图像识别

发布于 2024-01-22 21:44:06 字数 1264 浏览 0 评论 0 收藏 0

但是，如果事先不知道应该点击哪里，怎么办？可以使用图像识别。向PyAutoGUI提供希望点击的图像，让它去弄清楚坐标。

例如，如果你以前获得了屏幕快照，截取了提交按钮的图像，保存为submit.png，那么 locateOnScreen() 函数将返回图像所在处的坐标。要了解 locateOnScreen()函数的工作方式，请获取屏幕上一小块区域的屏幕快照，保存该图像，并在交互式环境中输入以下内容，用你的屏幕快照文件名代替 'submit. png'：

>>> import pyautogui
>>> pyautogui.locateOnScreen('submit.png')
(643, 745, 70, 29)

locateOnScreen() 函数返回４个整数的元组，是屏幕上首次发现该图像时左边的x坐标、顶边的y坐标、宽度以及高度。如果你用自己的屏幕快照，在你的计算机上尝试，那么返回值会和这里显示的不一样。

如果屏幕上找不到该图像，locateOnScreen() 函数将返回None。请注意要成功识别，屏幕上的图像必须与提供的图像完全匹配。即使只差一个像素，locateOn Screen() 函数也会返回None。

如果该图像在屏幕上能够找到多处，locateAllOnScreen() 函数将返回一个Generator对象。可以将它传递给list() ，返回一个4整数元组的列表。继续在交互式环境的例子中输入以下内容（用你自己的图像文件名取代 'submit.png'）：

>>> list(pyautogui.locateAllOnScreen('submit.png'))
[(643, 745, 70, 29), (1007, 801, 70, 29)]

每个４整数元组代表了屏幕上的一个区域。如果图像只找到一次，返回的列表就只包含一个元组。

在得到图像所在屏幕区域的4整数元组后，就可以点击这个区域的中心。将元组传递给center() 函数，它将返回该区域中心的x、y坐标。在交互式环境中输入以下内容，用你自己的文件名、4整数元组和坐标对，来取代参数：

>>> pyautogui.locateOnScreen('submit.png')
(643, 745, 70, 29)
>>> pyautogui.center((643, 745, 70, 29))
(678, 759)
>>> pyautogui.click((678, 759))

用center() 得到中心坐标后，将click() 坐标传递给函数，就会点击屏幕上该区域的中心，这个区域匹配你传递给locateOnScreen() 函数的图像。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文