机器学习与优化 PDF 文档
本书是机器学习实战领域的一本佳作,从机器学习的基本概念讲起,旨在将初学者引入机器学习的大门,并走上实践的道路。本书通过讲解机器学习中的监督学习和无监督学习,并结合特征选择和排序、聚类方法、文本和网页挖掘等热点问题,论证了优化是力量之源这一观点,为机器学习在企业中的应用提供了切实可行的操作建议。
本书适合从事机器学习领域工作的相关人员,以及任何对机器学习感兴趣的读者。
将问题归结为“优化一个收益函数”也激励着决策者,使用量化的目标,就可以用可衡量的方式来领会宗旨,也就可以专注于方针的制定而非执行的细枝末节。当人们深陷于执行的泥潭中,以至于遗忘了目标时,企业就染上了“疫病”,此时如果外界环境发生了变化,这种“疫病”将会使企业无法做出及时的应对。
自动化是解决这个问题的关键:将一个问题形式化地表述后,我们把得到的收益模型输入计算机,计算机将自动创造出并找到一个或多个最佳的选项。另外,当条件和重点发生改变时,只需要修改一下收益函数的量化目标,再重启优化过程就可以了。当然,CPU 时间会是个问题,也并非每次都能保证找到全局最优解决方案。但可以肯定的是,使用计算机来搜寻,无论是速度还是范围,都远远领先于人力搜寻,并且这一领先优势会越来越明显。
目录
第 1 章 引言
1.1 学习与智能优化:燎原之火
1.2 寻找黄金和寻找伴侣
1.3 需要的只是数据
1.4 超越传统的商业智能
1.5 LION 方法的实施
1.6 “动手”的方法
第 2 章 懒惰学习:最近邻方法
最近邻方法
第 3 章 学习需要方法
3.1 从已标记的案例中学习:最小化和泛化
3.2 学习、验证、测试
3.3 不同类型的误差
第一部分 监督学习
第 4 章 线性模型
4.1 线性回归
4.2 处理非线性函数关系的技巧
4.3 用于分类的线性模型
4.4 大脑是如何工作的
4.5 线性模型为何普遍,为何成功
4.6 最小化平方误差和
4.7 数值不稳定性和岭回归
第 5 章 广义线性最小二乘法
5.1 拟合的优劣和卡方分布
5.2 最小二乘法与最大似然估计
5.2.1 假设检验
5.2.2 交叉验证
5.3 置信度的自助法
第 6 章 规则、决策树和森林
6.1 构造决策树
6.2 民主与决策森林
第 7 章 特征排序及选择
7.1 特征选择:情境
7.2 相关系数
7.3 相关比
7.4 卡方检验拒绝统计独立性
7.5 熵和互信息
第 8 章 特定非线性模型
8.1 logistic 回归
8.2 局部加权回归
8.3 用 LASSO 来缩小系数和选择输入值
第 9 章 神经网络:多层感知器
9.1 多层感知器
9.2 通过反向传播法学习
9.2.1 批量和 bolddriver 反向传播法
9.2.2 在线或随机反向传播
9.2.3 训练多层感知器的高级优化
第 10 章 深度和卷积网络
10.1 深度神经网络
10.1.1 自动编码器
10.1.2 随机噪声、屏蔽和课程
10.2 局部感受野和卷积网络
第 11 章 统计学习理论和支持向量机
11.1 经验风险最小化
11.1.1 线性可分问题
11.1.2 不可分问题
11.1.3 非线性假设
11.1.4 用于回归的支持向量
第 12 章 最小二乘法和健壮内核机器
12.1 最小二乘支持向量机分类器
12.2 健壮加权最小二乘支持向量机
12.3 通过修剪恢复稀疏
12.4 算法改进:调谐 QP、原始版本、无补偿
第 13 章 机器学习中的民主
13.1 堆叠和融合
13.2 实例操作带来的多样性:装袋法和提升法
13.3 特征操作带来的多样性
13.4 输出值操作带来的多样性:纠错码
13.5 训练阶段随机性带来的多样性
13.6 加性 logistic 回归
13.7 民主有助于准确率--拒绝的折中
第 14 章 递归神经网络和储备池计算
14.1 递归神经网络
14.2 能量极小化霍普菲尔德网络
14.3 递归神经网络和时序反向传播
14.4 递归神经网络储备池学习
14.5 超限学习机
第二部分 无监督学习和聚类
第 15 章 自顶向下的聚类:K 均值
15.1 无监督学习的方法
15.2 聚类:表示与度量
15.3 硬聚类或软聚类的 K 均值方法
第 16 章 自底向上(凝聚)聚类
16.1 合并标准以及树状图
16.2 适应点的分布距离:马氏距离
16.3 附录:聚类的可视化
第 17 章 自组织映射
17.1 将实体映射到原型的人工皮层
17.2 使用成熟的自组织映射进行分类
第 18 章 通过线性变换降维(投影)
18.1 线性投影
18.2 主成分分析
18.3 加权主成分分析:结合坐标和关系
18.4 通过比值优化进行线性判别
18.5 费希尔线性判别分析
第 19 章 通过非线性映射可视化图与网络
19.1 最小应力可视化
19.2 一维情况:谱图绘制
19.3 复杂图形分布标准
第 20 章 半监督学习
20.1 用部分无监督数据进行学习
20.1.1 低密度区域中的分离
20.1.2 基于图的算法
20.1.3 学习度量
20.1.4 集成约束和度量学习
第三部分 优化:力量之源
第 21 章 自动改进的局部方法
21.1 优化和学习
21.2 基于导数技术的一维情况
21.2.1 导数可以由割线近似
21.2.2 一维最小化直到现在,我们都在
21.3 求解高维模型(二次正定型)
21.3.1 梯度与最速下降法
21.3.2 共轭梯度法
21.4 高维中的非线性优化
21.4.1 通过线性查找的全局收敛
21.4.2 解决不定黑塞矩阵
21.4.3 与模型信赖域方法的关系
21.4.4 割线法
21.4.5 缩小差距:二阶方法与线性复杂度
21.5 不涉及导数的技术:反馈仿射振荡器
21.5.1 RAS:抽样区域的适应性
21.5.2 为健壮性和多样化所做的重复
第 22 章 局部搜索和反馈搜索优化
22.1 基于扰动的局部搜索
22.2 反馈搜索优化:搜索时学习
22.3 基于禁忌的反馈搜索优化
第 23 章 合作反馈搜索优化
23.1 局部搜索过程的智能协作
23.2 CoRSO:一个政治上的类比
23.3 CoRSO 的例子:RSO 与 RAS 合作
第 24 章 多目标反馈搜索优化
24.1 多目标优化和帕累托最优
24.2 脑--计算机优化:循环中的用户
第四部分 应用精选
第 25 章 文本和网页挖掘
25.1 网页信息检索与组织
25.1.1 爬虫
25.1.2 索引
25.2 信息检索与排名
25.2.1 从文档到向量:向量{空间模型
25.2.2 相关反馈
25.2.3 更复杂的相似性度量
25.3 使用超链接来进行网页排名
25.4 确定中心和权威:HITS
25.5 聚类
第 26 章 协同过滤和推荐
26.1 通过相似用户结合评分
26.2 基于矩阵分解的模型
参考文献
下载地址:https://www.wenjiangs.com/wp-content/uploads/2024/03/Cgpl2zdNp26a2QOG.zip
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
上一篇: 机器学习实战 PDF 文档
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论