计算机视觉与深度学习实战:以 MATLAB、Python 为工具 PDF 文档
本书详细讲解了 36 个计算机视觉与深度学习实战案例(含可运行程序),涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织提取、全景图像拼接、小波图像融合、基于语音识别的音频信号模拟灯控、路面裂缝检测识别、视频运动估计追踪、Simulink 图像处理、胸片及肝脏分割、基于深度学习的汽车目标检测和视觉场景识别、基于计算机视觉的自动驾驶应用、基于 YOLO 的车辆及交通标志检测,以及基于 CNN 的手写字符识别、普适物体识别、图像倾斜矫正、以图搜画,还讲解了深度神经网络的拆分、编辑、重构等多项重要技术及应用,涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习的理论及其应用方面。
工欲善其事,必先利其器,本书对每个数字图像处理的知识点都提供了丰富、生动的案例素材,并以MATLAB、Python 为工具详细讲解了实验的核心程序,涉及 DeepLearning Toolbox、TensorFlow、Keras、Java Zxing 等工具环境。通过对这些程序的阅读、理解和仿真运行,读者可以更加深刻地理解图像处理的内容,并且更加熟练地掌握计算机视觉及深度学习在不同实际领域中的用法。
本书以案例为基础,结构布局紧凑,内容深入浅出,实验简捷高效,适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及从事数字图像处理的广大工程研发人员阅读和参考。
目录
第 1 章 基于直方图优化的图像去雾技术
1.1 案例背景
1.2 理论基础
1.2.1 空域图像增强
1.2.2 直方图均衡化
1.3 程序实现
1.3.1 设计 GUI 界面
1.3.2 全局直方图处理
1.3.3 局部直方图处理
1.3.4 Retinex 增强处理
1.4 延伸阅读
第 2 章 基于形态学的权重自适应图像去噪
2.1 案例背景
2.2 理论基础
2.2.1 图像去噪的方法
2.2.2 数学形态学的原理
2.2.3 权重自适应的多结构形态学去噪
2.3 程序实现
2.4 延伸阅读
第 3 章 基于多尺度形态学提取眼前节组织
3.1 案例背景
3.2 理论基础
3.3 程序实现
3.3.1 多尺度结构设计
3.3.2 多尺度边缘提取
3.3.3 多尺度边缘融合
3.4 延伸阅读
第 4 章 基于 Hough 变化的答题卡识别
4.1 案例背景
4.2 理论基础
4.2.1 图像二值化
4.2.2 倾斜校正
4.2.3 图像分割
4.3 程序实现
4.3.1 图像灰度化
4.3.2 灰度图像二值化
4.3.3 图像平滑滤波
4.3.4 图像矫正
4.3.5 完整性核查
4.4 延伸阅读
第 5 章 基于阈值分割的车牌定位识别
5.1 案例背景
5.2 理论基础
5.2.1 车牌图像处理
5.2.2 车牌定位原理
5.2.3 车牌字符处理
5.2.4 车牌字符识别
5.3 程序实现
5.4 延伸阅读
第 6 章 基于分水岭分割进行肺癌诊断
6.1 案例背景
6.2 理论基础
6.2.1 模拟浸水的过程
6.2.2 模拟降水的过程
6.2.3 过度分割问题
6.2.4 标记分水岭分割算法
6.3 程序实现
6.4 延伸阅读
第 7 章 基于主成分分析的人脸二维码识别
7.1 案例背景
7.2 理论基础
7.2.1 QR 二维码简介
7.2.2 QR 二维码的编码和译码流程
7.2.3 主成分分析方法
7.3 程序实现
7.3.1 人脸建库
7.3.2 人脸识别
7.3.3 人脸二维码
7.4 延伸阅读
第 8 章 基于知识库的手写体数字识别
8.1 案例背景
8.2 理论基础
8.2.1 算法流程
8.2.2 特征提取
8.2.3 模式识别
8.3 程序实现
8.3.1 图像处理
8.3.2 特征提取
8.3.3 模式识别
8.4 延伸阅读
8.4.1 识别器选择
8.4.2 特征库改善
第 9 章 基于特征匹配的英文印刷字符识别
9.1 案例背景
9.2 理论基础
9.2.1 图像预处理
9.2.2 图像识别技术
9.3 程序实现
9.3.1 界面设计
9.3.2 回调识别
9.4 延伸阅读
第 10 章 基于不变矩的数字验证码识别
10.1 案例背景
10.2 理论基础
10.3 程序实现
10.3.1 设计 GUI 界面
10.3.2 载入验证码图像
10.3.3 验证码图像去噪
10.3.4 验证码数字定位
10.3.5 验证码归一化
10.3.6 验证码数字识别
10.3.7 手动确认并入库
10.3.8 重新生成模板库
10.4 延伸阅读
第 11 章 基于小波技术进行图像融合
11.1 案例背景
11.2 理论基础
11.3 程序实现
11.3.1 设计 GUI 界面
11.3.2 图像载入
11.3.3 小波融合
11.4 延伸阅读
第 12 章 基于块匹配的全景图像拼接
12.1 案例背景
12.2 理论基础
12.2.1 图像匹配
12.2.2 图像融合
12.3 程序实现
12.3.1 设计 GUI 界面
12.3.2 载入图片
12.3.3 图像匹配
12.3.4 图像拼接
12.4 延伸阅读
第 13 章 基于霍夫曼图像编码的图像压缩和重建
13.1 案例背景
13.2 理论基础
13.2.1 霍夫曼编码的步骤
13.2.2 霍夫曼编码的特点
13.3 程序实现
13.3.1 设计 GUI 界面
13.3.2 压缩和重建
13.3.3 效果对比
13.4 延伸阅读
第 14 章 基于主成分分析的图像压缩和重建
14.1 案例背景
14.2 理论基础
14.2.1 主成分降维分析原理
14.2.2 由得分矩阵重建样本
14.2.3 主成分分析数据压缩比
14.2.4 基于主成分分析的图像压缩
14.3 程序实现
14.3.1 主成分分析的源代码
14.3.2 图像数组和样本矩阵之间的转换
14.3.3 基于主成分分析的图像压缩
14.4 延伸阅读
第 15 章 基于小波的图像压缩技术
15.1 案例背景
15.2 理论基础
15.3 程序实现
15.4 延伸阅读
第 16 章 基于融合特征的以图搜图技术
16.1 案例背景
16.2 理论基础
16.3 程序实现
16.3.1 图像预处理
16.3.2 计算特征
16.3.3 图像检索
16.3.4 结果分析
16.4 延伸阅读
第 17 章 基于 Harris 的角点特征检测
17.1 案例背景
17.2 理论基础
17.2.1 Harris 的基本原理
17.2.2 Harris 算法的流程
17.2.3 Harris 角点的性质
17.3 程序实现
17.3.1 Harris 算法的代码
17.3.2 角点检测实例
17.4 延伸阅读
第 18 章 基于 GUI 搭建通用视频处理工具
18.1 案例背景
18.2 理论基础
18.3 程序实现
18.3.1 设计 GUI 界面
18.3.2 实现 GUI 界面
18.4 延伸阅读
第 19 章 基于语音识别的信号灯图像模拟控制技术
19.1 案例背景
19.2 理论基础
19.3 程序实现
19.4 延伸阅读
第 20 章 基于帧间差法进行视频目标检测
20.1 案例背景
20.2 理论基础
20.2.1 帧间差分法
20.2.2 背景差分法
20.2.3 光流法
20.3 程序实现
20.4 延伸阅读
第 21 章 路面裂缝检测系统设计
21.1 案例背景
21.2 理论基础
21.2.1 图像灰度化
21.2.2 图像滤波
21.2.3 图像增强
21.2.4 图像二值化
21.3 程序实现
21.4 延伸阅读
第 22 章 基于 K-means 聚类算法的图像分割
22.1 案例背景
22.2 理论基础
22.2.1 K-means 聚类算法的原理
22.2.2 K-means 聚类算法的要点
22.2.3 K-means 聚类算法的缺点
22.2.4 基于 K-means 聚类算法进行图像分割
22.3 程序实现
22.3.1 样本间的距离
22.3.2 提取特征向量
22.3.3 图像聚类分割
22.4 延伸阅读
第 23 章 基于光流场的车流量计数应用
23.1 案例背景
23.2 理论基础
23.2.1 基于光流法检测运动的原理
23.2.2 光流场的主要计算方法
23.2.3 梯度光流场约束方程
23.2.4 Horn-Schunck 光流算法
23.3 程序实现
23.3.1 计算视觉系统工具箱简介
23.3.2 基于光流法检测汽车运动
23.4 延伸阅读
第 24 章 基于 Simulink 进行图像和视频处理
24.1 案例背景
24.2 模块介绍
24.2.1 分析和增强模块库(Analysis 和 Enhancement)
24.2.2 转化模块库(Conversions)
24.2.3 滤波模块库(Filtering)
24.2.4 几何变换模块库(Geometric Transformations)
24.2.5 形态学操作模块库(Morphological Operations)
24.2.6 输入模块库(Sources)
24.2.7 输出模块库(Sinks)
24.2.8 统计模块库(Statistics)
24.2.9 文本和图形模块库(Text 和 Graphic)
24.2.10 变换模块库(Transforms)
24.2.11 其他工具模块库(Utilities)
24.3 仿真案例
24.3.1 搭建组织模型
24.3.2 仿真执行模型
24.3.3 自动生成报告
24.4 延伸阅读
第 25 章 基于小波变换的数字水印技术
25.1 案例背景
25.2 理论基础
25.2.1 数字水印技术的原理
25.2.2 典型的数字水印算法
25.2.3 数字水印攻击和评价
25.2.4 基于小波的水印技术
25.3 程序实现
25.3.1 准备载体和水印图像
25.3.2 小波数字水印的嵌入
25.3.3 小波数字水印的提取
25.3.4 小波水印的攻击试验
25.4 延伸阅读
第 26 章 基于最小误差法的胸片分割技术
26.1 案例背景
26.2 理论基础
26.2.1 图像增强
26.2.2 区域选择
26.2.3 形态学滤波
26.2.4 基于最小误差法进行胸片分割
26.3 程序实现
26.3.1 设计 GUI 界面
26.3.2 图像预处理
26.3.3 基于最小误差法进行图像分割
26.3.4 形态学后处理
26.4 延伸阅读
第 27 章 基于区域生长的肝脏影像分割系统
27.1 案例背景
27.2 理论基础
27.2.1 阈值分割
27.2.2 区域生长
27.2.3 基于阈值预分割的区域生长
27.3 程序实现
27.4 延伸阅读
第 28 章 基于计算机视觉的自动驾驶应用
28.1 案例背景
28.2 理论基础
28.2.1 环境感知
28.2.2 行为决策
28.2.3 路径规划
28.2.4 运动控制
28.3 程序实现
28.3.1 传感器数据载入
28.3.2 追踪器创建
28.3.3 碰撞预警
28.4 延伸阅读
第 29 章 基于深度学习的汽车目标检测
29.1 案例背景
29.2 理论基础
29.2.1 基本架构
29.2.2 卷积层
29.2.3 池化层
29.3 程序实现
29.3.1 加载数据
29.3.2 构建 CNN
29.3.3 训练 CNN
29.3.4 评估训练效果
29.4 延伸阅读
第 30 章 基于深度学习的视觉场景识别
30.1 案例背景
30.2 理论基础
30.3 程序实现
30.3.1 环境配置
30.3.2 数据集制作
30.3.3 网络训练
30.3.4 网络测试
30.4 延伸阅读
第 31 章 深度学习综合应用
31.1 应用背景
31.2 理论基础
31.2.1 分类识别
31.2.2 目标检测
31.3 案例实现 1:基于 CNN 的数字识别
31.3.1 自定义 CNN
31.3.2 AlexNet
31.3.3 基于 MATLAB 进行实验设计
31.3.4 基于 TensorFlow 进行实验设计
31.3.5 实验小结
31.4 案例实现 2:基于 CNN 的物体识别
31.4.1 CIFAR-10 数据集
31.4.2 VggNet
31.4.3 ResNet
31.4.4 实验设计
31.4.5 实验小结
31.5 案例实现 3:基于 CNN 的图像矫正
31.5.1 倾斜数据集
31.5.2 自定义 CNN 回归网络
31.5.3 AlexNet 回归网络
31.5.4 实验设计
31.5.5 实验小结
31.6 案例实现 4:基于 LSTM 的时间序列分析
31.6.1 厄尔尼诺南方涛动指数数据
31.6.2 样条拟合分析
31.6.3 基于 MATLAB 进行 LSTM 分析
31.6.4 基于 Keras 进行 LSTM 分析
31.6.5 实验小结
31.7 案例实现 5:基于深度学习的以图搜图技术
31.7.1 人脸的深度特征
31.7.2 AlexNet 的特征
31.7.3 GoogleNet 的特征
31.7.4 深度特征融合计算
31.7.5 实验设计
31.7.6 实验小结
31.8 案例实现 6:基于 YOLO 的交通目标检测应用
31.8.1 车辆目标的 YOLO 检测
31.8.2 交通标志的 YOLO 检测
31.9 延伸阅读
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/03/sHvGvnH4bpUPKj4z.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论