图书介绍
机器学习实践:测试驱动的开发方法PDF|Epub|txt|kindle电子书版本网盘下载
- (美)Matthew Kirk著;段菲译 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115396181
- 出版时间:2015
- 标注页数:188页
- 文件大小:22MB
- 文件页数:205页
- 主题词:机器学习-研究
PDF下载
下载说明
机器学习实践:测试驱动的开发方法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 测试驱动的机器学习1
1.1 TDD的历史2
1.2 TDD与科学方法2
1.2.1 TDD可构建有效的逻辑命题3
1.2.2 TDD要求你将假设以文字或代码的形式记录下来5
1.2.3 TDD和科学方法的闭环反馈机制5
1.3 机器学习中的风险5
1.3.1 数据的不稳定性6
1.3.2 欠拟合6
1.3.3 过拟合7
1.3.4 未来的不可预测性8
1.4 为降低风险应采用的测试8
1.4.1 利用接缝测试减少数据中的不稳定因素8
1.4.2 通过交叉验证检验拟合效果9
1.4.3 通过测试训练速度降低过拟合风险10
1.4.4 检测未来的精度和查全率漂移情况11
1.5 小结11
第2章 机器学习概述13
2.1 什么是机器学习13
2.1.1 有监督学习13
2.1.2 无监督学习14
2.1.3 强化学习15
2.2 机器学习可完成的任务15
2.3 本书采用的数学符号16
2.4 小结16
第3章 K近邻分类17
3.1 K近邻分类的历史18
3.2 基于邻居的居住幸福度18
3.3 如何选择K21
3.3.1 猜测K的值21
3.3.2 选择K的启发式策略21
3.3.3 K的选择算法24
3.4 何谓“近”24
3.4.1 Minkowski 距离25
3.4.2 Mahalanobis 距离26
3.5 各类别的确定27
3.6 利用KNN算法和OpenCV实现胡须和眼镜的检测29
3.6.1 类图29
3.6.2 从原始图像到人脸图像30
3.6.3 Face类33
3.6.4 Neighborhood类36
3.7 小结43
第4章 朴素贝叶斯分类45
4.1 利用贝叶斯定理找出欺诈性订单45
4.1.1 条件概率46
4.1.2 逆条件概率47
4.2 朴素贝叶斯分类器48
4.2.1 链式法则48
4.2.2 贝叶斯推理中的朴素性49
4.2.3 伪计数50
4.3 垃圾邮件过滤器51
4.3.1 类图51
4.3.2 数据源52
4.3.3 Email类52
4.3.4 符号化与上下文55
4.3.5 SpamTrainer类56
4.3.6 通过交叉验证将错误率最小化63
4.4 小结66
第5章 隐马尔可夫模型67
5.1 利用状态机跟踪用户行为67
5.1.1 隐含状态的输出和观测69
5.1.2 利用马尔可夫假设简化问题70
5.1.3 利用马尔可夫链而非有限状态机71
5.1.4 隐马尔可夫模型71
5.2 评估:前向-后向算法72
5.3 利用维特比算法求解解码问题75
5.4 学习问题76
5.5 利用布朗语料库进行词性标注76
5.5.1 词性标注器的首要问题:CorpusParser77
5.5.2 编写词性标注器79
5.5.3 通过交叉验证获取模型的置信度86
5.5.4 模型的改进方案88
5.6 小结88
第6章 支持向量机89
6.1 求解忠诚度映射问题89
6.2 SVM的推导过程91
6.3 非线性数据92
6.3.1 核技巧92
6.3.2 软间隔96
6.4 利用SVM进行情绪分析97
6.4.1 类图98
6.4.2 Corpus类99
6.4.3 从语料库返回一个无重复元素的单词集102
6.4.4 CorpusSet类103
6.4.5 SentimentClassifier类107
6.4.6 随时间提升结果111
6.5 小结111
第7章 神经网络113
7.1 神经网络的历史113
7.2 何为人工神经网络114
7.2.1 输入层115
7.2.2 隐含层116
7.2.3 神经元117
7.2.4 输出层122
7.2.5 训练算法122
7.3 构建神经网络125
7.3.1 隐含层数目的选择126
7.3.2 每层中神经元数目的选择126
7.3.3 误差容限和最大epoch的选择126
7.4 利用神经网络对语言分类127
7.4.1 为语言编写接缝测试129
7.4.2 网络类的交叉验证132
7.4.3 神经网络的参数调校135
7.4.4 收敛性测试136
7.4.5 神经网络的精度和查全率136
7.4.6 案例总结136
7.5 小结136
第8章 聚类137
8.1 用户组138
8.2 K均值聚类139
8.2.1 K均值算法139
8.2.2 K均值聚类的缺陷140
8.3 EM聚类算法141
8.4 不可能性定理142
8.5 音乐归类142
8.5.1 数据收集143
8.5.2 用K均值聚类分析数据144
8.5.3 EM聚类146
8.5.4 爵士乐的EM聚类结果149
8.6 小结151
第9章 核岭回归153
9.1 协同过滤153
9.2 应用于协同过滤的线性回归154
9.3 正则化技术与岭回归157
9.4 核岭回归158
9.5 理论总结158
9.6 用协同过滤推荐啤酒风格159
9.6.1 数据集159
9.6.2 我们所需的工具159
9.6.3 评论者162
9.6.4 编写代码确定某人的偏好164
9.6.5 利用用户偏好实现协同过滤166
9.7 小结167
第10章 模型改进与数据提取169
10.1 维数灾难问题169
10.2 特征选择171
10.3 特征变换173
10.4 主分量分析175
10.5 独立分量分析177
10.6 监测机器学习算法179
10.6.1 精度与查全率:垃圾邮件过滤179
10.6.2 混淆矩阵181
10.7 均方误差182
10.8 产品环境的复杂性183
10.9 小结183
第11章 结语185
11.1 机器学习算法回顾185
11.2 如何利用这些信息来求解问题186
11.3 未来的学习路线187
作者介绍188
封面介绍188