内容来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

机器学习与优化 PDF 文档

发布于 2024-03-25 20:58:45 字数 4005 浏览 39 评论 0

本书是机器学习实战领域的一本佳作，从机器学习的基本概念讲起，旨在将初学者引入机器学习的大门，并走上实践的道路。本书通过讲解机器学习中的监督学习和无监督学习，并结合特征选择和排序、聚类方法、文本和网页挖掘等热点问题，论证了优化是力量之源这一观点，为机器学习在企业中的应用提供了切实可行的操作建议。

本书适合从事机器学习领域工作的相关人员，以及任何对机器学习感兴趣的读者。

将问题归结为“优化一个收益函数”也激励着决策者，使用量化的目标，就可以用可衡量的方式来领会宗旨，也就可以专注于方针的制定而非执行的细枝末节。当人们深陷于执行的泥潭中，以至于遗忘了目标时，企业就染上了“疫病”，此时如果外界环境发生了变化，这种“疫病”将会使企业无法做出及时的应对。

自动化是解决这个问题的关键：将一个问题形式化地表述后，我们把得到的收益模型输入计算机，计算机将自动创造出并找到一个或多个最佳的选项。另外，当条件和重点发生改变时，只需要修改一下收益函数的量化目标，再重启优化过程就可以了。当然，CPU 时间会是个问题，也并非每次都能保证找到全局最优解决方案。但可以肯定的是，使用计算机来搜寻，无论是速度还是范围，都远远领先于人力搜寻，并且这一领先优势会越来越明显。

目录
第 1 章引言
1.1 学习与智能优化：燎原之火
1.2 寻找黄金和寻找伴侣
1.3 需要的只是数据
1.4 超越传统的商业智能
1.5 LION 方法的实施
1.6 “动手”的方法
第 2 章懒惰学习：最近邻方法
最近邻方法
第 3 章学习需要方法
3.1 从已标记的案例中学习：最小化和泛化
3.2 学习、验证、测试
3.3 不同类型的误差
第一部分监督学习
第 4 章线性模型
4.1 线性回归
4.2 处理非线性函数关系的技巧
4.3 用于分类的线性模型
4.4 大脑是如何工作的
4.5 线性模型为何普遍，为何成功
4.6 最小化平方误差和
4.7 数值不稳定性和岭回归
第 5 章广义线性最小二乘法
5.1 拟合的优劣和卡方分布
5.2 最小二乘法与最大似然估计
5.2.1 假设检验
5.2.2 交叉验证
5.3 置信度的自助法
第 6 章规则、决策树和森林
6.1 构造决策树
6.2 民主与决策森林
第 7 章特征排序及选择
7.1 特征选择：情境
7.2 相关系数
7.3 相关比
7.4 卡方检验拒绝统计独立性
7.5 熵和互信息
第 8 章特定非线性模型
8.1 logistic 回归
8.2 局部加权回归
8.3 用 LASSO 来缩小系数和选择输入值
第 9 章神经网络：多层感知器
9.1 多层感知器
9.2 通过反向传播法学习
9.2.1 批量和 bolddriver 反向传播法
9.2.2 在线或随机反向传播
9.2.3 训练多层感知器的高级优化
第 10 章深度和卷积网络
10.1 深度神经网络
10.1.1 自动编码器
10.1.2 随机噪声、屏蔽和课程
10.2 局部感受野和卷积网络
第 11 章统计学习理论和支持向量机
11.1 经验风险最小化
11.1.1 线性可分问题
11.1.2 不可分问题
11.1.3 非线性假设
11.1.4 用于回归的支持向量
第 12 章最小二乘法和健壮内核机器
12.1 最小二乘支持向量机分类器
12.2 健壮加权最小二乘支持向量机
12.3 通过修剪恢复稀疏
12.4 算法改进：调谐 QP、原始版本、无补偿
第 13 章机器学习中的民主
13.1 堆叠和融合
13.2 实例操作带来的多样性：装袋法和提升法
13.3 特征操作带来的多样性
13.4 输出值操作带来的多样性：纠错码
13.5 训练阶段随机性带来的多样性
13.6 加性 logistic 回归
13.7 民主有助于准确率--拒绝的折中
第 14 章递归神经网络和储备池计算
14.1 递归神经网络
14.2 能量极小化霍普菲尔德网络
14.3 递归神经网络和时序反向传播
14.4 递归神经网络储备池学习
14.5 超限学习机
第二部分无监督学习和聚类
第 15 章自顶向下的聚类：K 均值
15.1 无监督学习的方法
15.2 聚类：表示与度量
15.3 硬聚类或软聚类的 K 均值方法
第 16 章自底向上（凝聚）聚类
16.1 合并标准以及树状图
16.2 适应点的分布距离：马氏距离
16.3 附录：聚类的可视化
第 17 章自组织映射
17.1 将实体映射到原型的人工皮层
17.2 使用成熟的自组织映射进行分类
第 18 章通过线性变换降维（投影）
18.1 线性投影
18.2 主成分分析
18.3 加权主成分分析：结合坐标和关系
18.4 通过比值优化进行线性判别
18.5 费希尔线性判别分析
第 19 章通过非线性映射可视化图与网络
19.1 最小应力可视化
19.2 一维情况：谱图绘制
19.3 复杂图形分布标准
第 20 章半监督学习
20.1 用部分无监督数据进行学习
20.1.1 低密度区域中的分离
20.1.2 基于图的算法
20.1.3 学习度量
20.1.4 集成约束和度量学习
第三部分优化：力量之源
第 21 章自动改进的局部方法
21.1 优化和学习
21.2 基于导数技术的一维情况
21.2.1 导数可以由割线近似
21.2.2 一维最小化直到现在，我们都在
21.3 求解高维模型（二次正定型）
21.3.1 梯度与最速下降法
21.3.2 共轭梯度法
21.4 高维中的非线性优化
21.4.1 通过线性查找的全局收敛
21.4.2 解决不定黑塞矩阵
21.4.3 与模型信赖域方法的关系
21.4.4 割线法
21.4.5 缩小差距：二阶方法与线性复杂度
21.5 不涉及导数的技术：反馈仿射振荡器
21.5.1 RAS：抽样区域的适应性
21.5.2 为健壮性和多样化所做的重复
第 22 章局部搜索和反馈搜索优化
22.1 基于扰动的局部搜索
22.2 反馈搜索优化：搜索时学习
22.3 基于禁忌的反馈搜索优化
第 23 章合作反馈搜索优化
23.1 局部搜索过程的智能协作
23.2 CoRSO：一个政治上的类比
23.3 CoRSO 的例子：RSO 与 RAS 合作
第 24 章多目标反馈搜索优化
24.1 多目标优化和帕累托最优
24.2 脑--计算机优化：循环中的用户
第四部分应用精选
第 25 章文本和网页挖掘
25.1 网页信息检索与组织
25.1.1 爬虫
25.1.2 索引
25.2 信息检索与排名
25.2.1 从文档到向量：向量{空间模型
25.2.2 相关反馈
25.2.3 更复杂的相似性度量
25.3 使用超链接来进行网页排名
25.4 确定中心和权威：HITS
25.5 聚类
第 26 章协同过滤和推荐
26.1 通过相似用户结合评分
26.2 基于矩阵分解的模型
参考文献