图书介绍

多元统计分析PDF|Epub|txt|kindle电子书版本网盘下载

多元统计分析
  • 吴喜之编著 著
  • 出版社: 北京:中国人民大学出版社
  • ISBN:9787300266558
  • 出版时间:2019
  • 标注页数:324页
  • 文件大小:134MB
  • 文件页数:333页
  • 主题词:多元分析-统计分析

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

多元统计分析PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言1

1.1 数据科学1

1.1.1 统计是数据科学吗?1

1.1.2 计算机学科在数据科学中的地位2

1.1.3 问题驱动应成为数据科学的基本思维方式2

1.2 多元分析的对象2

1.3 需要的工具3

1.4 各章的安排3

1.5 软件和编程4

1.6 如何教学4

第2章 矩阵代数回顾6

2.1 矩阵6

2.1.1 基本定义6

2.1.2 基本矩阵运算7

2.1.3 行列式8

2.1.4 矩阵的逆9

2.1.5 矩阵的广义逆9

2.1.6 Kronecker积10

2.1.7 幂等矩阵10

2.1.8 向量空间11

2.1.9 正交性11

2.1.10 矩阵的秩11

2.1.11 矩阵的迹12

2.1.12 特征值12

2.1.13 广义特征值13

2.1.14 分块矩阵13

2.2 矩阵的分解15

2.2.1 矩阵的特征值分解15

2.2.2 奇异值分解及广义奇异值分解16

2.2.3 QR分解18

2.2.4 Cholesky分解19

2.3 二次型20

2.3.1 定义20

2.3.2 二次型和矩阵的定性20

2.3.3 椭球21

2.4 矩阵的导数22

2.4.1 向量关于数量的偏导数22

2.4.2 数量关于向量的偏导数22

2.4.3 向量关于向量的偏导数22

2.4.4 矩阵关于数量的偏导数22

2.4.5 数量关于矩阵的偏导数23

2.4.6 有关内积、二次型的导数23

2.4.7 函数的偏导数23

2.5 本章矩阵简单运算的R和Python代码24

2.6 习题27

第3章 回归29

3.1 经典回归模型基本要素29

3.1.1 描述数据30

3.1.2 线性回归模型31

3.1.3 最小二乘回归32

3.1.4 最小二乘回归参数的估计34

3.2 交叉验证36

3.3 经典线性回归的基本假定及根据假定所得到的结论38

3.3.1 经典线性回归的数学假定38

3.3.2 最小二乘回归参数估计量的一些性质及有关检验39

3.3.3 例3.1波士顿住房数据的最小二乘回归42

3.3.4 最小二乘回归结果的解释43

3.3.5 有关拟合的R2及AIC46

3.4 自变量有分类变量(定性变量)的情况48

3.5 机器学习回归简介及案例52

3.5.1 例子和机器学习方法的优势52

3.5.2 决策树回归54

3.5.3 bagging回归57

3.5.4 随机森林回归58

3.6 经典线性回归与各种机器学习回归的比较62

3.6.1 对例3.1波士顿住房数据的九种方法的比较62

3.6.2 对例3.1波士顿住房数据使用caret包比较各种方法64

3.7 多元多重回归回顾69

3.7.1 模型69

3.7.2 最小二乘估计及对估计量的检验70

3.7.3 多元回归检验例子71

3.8 本章计算的Python代码76

3.8.1 例3.1波士顿住房数据的线性回归76

3.8.2 例3.1波士顿住房数据的决策树回归、bagging回归和随机森林回归79

3.8.3 把分类变量转换成哑元变量84

3.9 习题86

第4章 分类89

4.1 目的和基本概念89

4.1.1 目的和例子89

4.1.2 分类和聚类的区别90

4.2 经典判别分析90

4.2.1 线性判别分析和二次判别分析90

4.2.2 Fisher判别分析92

4.3 例4.1数字笔迹识别的判别分析实践93

4.3.1 例4.1数字笔迹识别的线性判别分析的计算93

4.3.2 例4.1数字笔迹识别的二次判别分析的计算94

4.4 判别分析的一些概念和某些数学细节的补充95

4.4.1 数据总体分布已知时的判别95

4.4.2 线性判别分析的某些细节97

4.4.3 Fisher线性判别分析的某些细节98

4.5 二分类因变量的Logistic回归99

4.5.1 Logistic回归模型99

4.5.2 Logistic回归模型对实际数据的拟合101

4.5.3 Logistic回归对例4.2献血数据的分类102

4.5.4 ROC等描述性曲线103

4.5.5 三种分类方法对例4.2献血数据的交叉验证比较106

4.6 机器学习模型简介及案例106

4.6.1 决策树分类模型107

4.6.2 随机森林分类模型109

4.6.3 adaboost分类模型114

4.6.4 adaboost拟合例4.1数字笔迹识别全部数据115

4.6.5 adaboost的变量重要性115

4.6.6 adaboost的交叉验证115

4.6.7 各种分类模型的比较116

4.7 本章计算的Python代码118

4.7.1 产生Z折交叉验证集的代码118

4.7.2 线性判别分析及交叉验证120

4.7.3 二次判别分析121

4.7.4 Logistic回归122

4.7.5 对例4.2献血数据做3个经典分类方法的交叉验证124

4.7.6 随机森林分类125

4.7.7 对例4.1数字笔迹识别数据做5个机器学习方法分类的交叉验证比较125

4.8 习题128

第5章 主成分分析129

5.1 基本思想和例子129

5.1.1 数据中变量之间的关系与降维的可能性129

5.1.2 从例子中产生的问题130

5.2 问题和计算133

5.2.1 求协方差矩阵及样本相关阵的特征值和特征向量134

5.2.2 求各个成分的贡献率和累积贡献率135

5.2.3 根据贡献率选取少数重要成分138

5.2.4 主成分和原始变量的相关系数计算与载荷图138

5.2.5 主成分得分139

5.3 主成分分析在图像处理中的应用142

5.3.1 图像压缩案例(例5.2江景图片)142

5.3.2 主成分分析运用于图像识别145

5.4 案例:例5.3数据的主成分分析145

5.5 主成分分析的一些数学知识148

5.5.1 目标148

5.5.2 过程148

5.5.3 累积贡献率150

5.5.4 总体主成分的一些性质151

5.5.5 样本主成分的一些性质151

5.5.6 主成分的解释152

5.5.7 标准化主成分分析152

5.6 本章计算的Python代码153

5.6.1 例5.1教师数据153

5.6.2 图像压缩例子158

5.7 习题159

第6章 因子分析161

6.1 基本内容161

6.1.1 概述161

6.1.2 模型163

6.1.3 性质164

6.1.4 旋转165

6.1.5 因子得分165

6.1.6 计算及分析步骤166

6.2 例子和计算166

6.2.1 例6.1WHO数据分析166

6.2.2 例6.2豌豆数据的因子分析172

6.2.3 例5.1教师数据的因子分析174

6.3 因子分析计算基于的原理176

6.3.1 主成分方法176

6.3.2 主因子方法177

6.3.3 最大似然法177

6.3.4 因子个数的选择178

6.3.5 旋转178

6.3.6 因子得分179

6.3.7 建议和评论180

6.4 本章计算的Python代码180

6.5 习题182

第7章 聚类分析184

7.1 目的及基本概念184

7.1.1 目的184

7.1.2 聚类和分类方法没有必然联系184

7.1.3 距离186

7.1.4 两个数据例子191

7.1.5 集群倾向的度量193

7.2 分层聚类195

7.2.1 对观测值分类:例7.2美国各州数据195

7.2.2 对观测值聚类和对变量聚类:例7.3花卉数据198

7.3 K均值聚类和基于密度的聚类200

7.3.1 K均值聚类的基本思想200

7.3.2 K均值聚类中类别数目的确定201

7.3.3 基于密度聚类的思想203

7.4 基于模型的聚类205

7.4.1 直观描述205

7.4.2 E-M算法206

7.4.3 基于模型聚类的计算实现208

7.5 聚类数目的选择211

7.5.1 Gap方法211

7.5.2 轮廓法212

7.5.3 计算聚类数目的不同软件215

7.6 实例的计算220

7.6.1 种子数据220

7.6.2 胎心宫缩监护数据225

7.6.3 例5.1教师数据的聚类228

7.7 图像色彩的聚类230

7.7.1 对图像色彩聚类的例子230

7.7.2 颜色的十六进制表示形式233

7.8 本章计算的Python代码234

7.8.1 例7.2美国各州数据的聚类235

7.8.2 例7.6种子数据的聚类238

7.8.3 图像色彩的聚类241

7.9 习题243

第8章 典型相关分析245

8.1 基本内容245

8.1.1 问题的描述和例子245

8.1.2 典型相关及特征值问题247

8.1.3 载荷252

8.1.4 典型变量的选择253

8.2 实例计算:例5.1教师数据257

8.3 典型相关分析的不同角度推导262

8.3.1 完全利用特征值问题的性质262

8.3.2 利用Cauchy-Schwarz不等式263

8.3.3 利用奇异值分解264

8.3.4 利用广义特征值问题及Cholesky分解265

8.3.5 各种公式的总结265

8.4 本章计算的Python代码266

8.5 习题267

第9章 对应分析268

9.1 基本内容和应用268

9.2 二元对应分析268

9.2.1 二元对应分析的数学原理271

9.2.2 对应分析行列相关的显著性272

9.2.3 两个解释图形273

9.3 多元及联合对应分析274

9.3.1 例9.1收入数据多元及联合对应分析实践274

9.3.2 多元对应分析方法的数学277

9.3.3 基于指标矩阵和Burt矩阵的方法277

9.3.4 从Burt矩阵到联合对应分析280

9.4 本章计算的Python代码280

9.4.1 二元对应分析280

9.4.2 多元对应分析282

9.5 习题282

第10章 多维尺度变换284

10.1 目的284

10.2 多维尺度变换分类285

10.3 距离函数285

10.4 mMDS的目的286

10.5 mMDS方法的原理287

10.6 nMDS的基本思维288

10.7 本章计算的Python代码290

10.8 习题292

附录1 R简介——通过运行来领悟293

附录2 Python简介——通过运行来领悟305

参考文献319

热门推荐