图书介绍

实用机器学习PDF|Epub|txt|kindle电子书版本网盘下载

实用机器学习
  • 孙亮,黄倩著 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115446466
  • 出版时间:2017
  • 标注页数:340页
  • 文件大小:49MB
  • 文件页数:351页
  • 主题词:机器学习

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

实用机器学习PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引论1

1.1 什么是机器学习1

1.2 机器学习算法的分类2

1.3 实际应用3

1.3.1 病人住院时间预测3

1.3.2 信用分数估计4

1.3.3 Netflix上的影片推荐4

1.3.4 酒店推荐5

1.3.5 讨论6

1.4 本书概述7

1.4.1 本书结构9

1.4.2 阅读材料及其他资源10

第2章 R语言12

2.1 R的简单介绍12

2.2 R的初步体验13

2.3 基本语法14

2.3.1 语句14

2.3.2 函数17

2.4 常用数据结构19

2.4.1 向量19

2.4.2 因子23

2.4.3 矩阵24

2.4.4 数据框26

2.4.5 列表29

2.4.6 下标系统33

2.5 公式对象和apply函数34

2.6 R软件包36

2.6.1 软件包的安装37

2.6.2 软件包的使用38

2.6.3 软件包的开发38

2.7 网络资源38

第3章 数学基础39

3.1 概率39

3.1.1 基本概念39

3.1.2 基本公式40

3.1.3 常用分布42

3.1.4 随机向量及其分布43

3.1.5 随机变量的数字特征46

3.1.6 随机向量的数字特征48

3.2 统计49

3.2.1 常用数据特征49

3.2.2 参数估计52

3.3 矩阵54

3.3.1 基本概念54

3.3.2 基本运算56

3.3.3 特征值与特征向量57

3.3.4 矩阵分解60

3.3.5 主成分分析62

3.3.6 R中矩阵的计算68

第4章 数据探索和预处理74

4.1 数据类型74

4.2 数据探索75

4.2.1 常用统计量76

4.2.2 使用R实际探索数据76

4.3 数据预处理82

4.3.1 缺失值的处理82

4.3.2 数据的标准化83

4.3.3 删除已有变量85

4.3.4 数据的变换86

4.3.5 构建新的变量:哑变量86

4.3.6 离群数据的处理88

4.4 数据可视化89

4.4.1 直方图89

4.4.2 柱状图92

4.4.3 茎叶图95

4.4.4 箱线图96

4.4.5 散点图100

第5章 回归分析104

5.1 回归分析的基本思想104

5.2 线性回归和最小二乘法105

5.2.1 最小二乘法的几何解释106

5.2.2 线性回归和极大似然估计107

5.3 岭回归和Lasso108

5.3.1 岭回归108

5.3.2 Lasso与稀疏解110

5.3.3 Elastic Net114

5.4 回归算法的评价和选取114

5.4.1 均方差和均方根误差114

5.4.2 可决系数114

5.4.3 偏差-方差权衡115

5.5 案例分析118

5.5.1 数据导入和探索118

5.5.2 数据预处理120

5.5.3 将数据集分成训练集和测试集121

5.5.4 建立一个简单的线性回归模型121

5.5.5 建立岭回归和Lasso模型122

5.5.6 选取合适的模型124

5.5.7 构造新的变量126

5.6 小结126

第6章 分类算法127

6.1 分类的基本思想127

6.2 决策树130

6.2.1 基本原理130

6.2.2 决策树学习131

6.2.3 过拟合和剪枝138

6.2.4 实际使用139

6.2.5 讨论148

6.3 逻辑回归148

6.3.1 sigmoid函数的性质148

6.3.2 通过极大似然估计来估计参数149

6.3.3 牛顿法151

6.3.4 正则化项的引入153

6.3.5 实际使用154

6.4 支持向量机161

6.4.1 基本思想:最大化分类间隔161

6.4.2 最大分类间隔的数学表示163

6.4.3 如何处理线性不可分的数据164

6.4.4 Hinge损失函数166

6.4.5 对偶问题168

6.4.6 非线性支持向量机和核技巧170

6.4.7 实际使用173

6.5 损失函数和不同的分类算法175

6.5.1 损失函数175

6.5.2 正则化项178

6.6 交叉检验和caret包180

6.6.1 模型选择和交叉检验180

6.6.2 在R中实现交叉检验以及caret包182

6.7 分类算法的评价和比较192

6.7.1 准确率193

6.7.2 混淆矩阵193

6.7.3 精确率、召回率和F1度量195

6.7.4 ROC曲线和AUC196

6.7.5 R中评价标准的计算199

6.8 不平衡分类问题201

6.8.1 使用不同的算法评价标准201

6.8.2 样本权值201

6.8.3 取样方法202

6.8.4 代价敏感学习203

第7章 推荐算法205

7.1 推荐系统基础205

7.1.1 常用符号208

7.1.2 推荐算法的评价标准209

7.2 基于内容的推荐算法210

7.3 基于矩阵分解的算法211

7.3.1 无矩阵分解的基准方法211

7.3.2 基于奇异值分解的推荐算法212

7.3.3 基于SVD推荐算法的变体216

7.4 基于邻域的推荐算法222

7.4.1 基于用户的邻域推荐算法223

7.4.2 基于商品的邻域推荐算法225

7.4.3 混合算法226

7.4.4 相似度的计算227

7.5 R中recommenderlab的实际使用232

7.6 推荐算法的评价和选取250

第8章 排序学习253

8.1 排序学习简介253

8.1.1 解决排序问题的基本思路254

8.1.2 构造特征255

8.1.3 获取相关度分数256

8.1.4 数学符号257

8.2 排序算法的评价257

8.2.1 MAP258

8.2.2 DCG260

8.2.3 NDCG261

8.2.4 讨论261

8.3 逐点方法262

8.3.1 基于SVM的逐点排序方法263

8.3.2 逐点方法讨论264

8.4 逐对方法265

8.4.1 Ranking SVM算法265

8.4.2 IR-SVM算法266

8.4.3 RankNet算法267

8.4.4 LambdaRank算法271

8.4.5 LambdaMART算法273

8.5 逐列方法279

8.5.1 SVMmap算法279

8.5.2 讨论283

第9章 集成学习284

9.1 集成学习简介284

9.2 bagging简介285

9.3 随机森林289

9.3.1 训练随机森林的基本流程289

9.3.2 利用随机森林估计变量的重要性290

9.3.3 随机森林的实际使用291

9.4 boosting简介300

9.4.1 boosting和指数损失函数301

9.4.2 AdaBoost算法302

9.4.3 AdaBoost的实际使用306

9.4.4 讨论311

9.5 提升决策树和梯度提升算法311

9.5.1 提升决策树和梯度提升算法的基本原理311

9.5.2 如何避免过拟合315

9.5.3 gbm包的实际使用318

9.5.4 讨论327

9.6 学习器的聚合及stacking328

9.6.1 简单平均328

9.6.2 加权平均329

9.6.3 stacking的基本思想及应用329

9.7 小结331

参考文献332

索引334

热门推荐