图书介绍

数据挖掘方法与模型PDF|Epub|txt|kindle电子书版本网盘下载

数据挖掘方法与模型
  • (美)拉罗斯著;刘燕权等译 著
  • 出版社: 北京:高等教育出版社
  • ISBN:9787040309683
  • 出版时间:2011
  • 标注页数:287页
  • 文件大小:53MB
  • 文件页数:304页
  • 主题词:数据采集-数学模型-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘方法与模型PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章降维方法1

1.1数据挖掘中降低维度的必要性1

1.2主成分分析法2

1.2.1主成分分析应用于房屋数据集4

1.2.2应提取多少个主成分9

1.3因子分析法16

1.3.1因子分析法在成年人数据集中的应用16

1.3.2因子旋转19

1.4用户自定义合成21

总结23

参考文献25

练习题26

第2章回归模型30

2.1简单线性回归实例30

2.2最小二乘法估计33

2.3决定系数36

2.4估计值的标准误差40

2.5相关系数41

2.6方差分析表43

2.7异常点、高杠杆点和强影响观测值44

2.8回归模型50

2.9回归推断52

2.9.1x和y之间线性关系的t检验53

2.9.2回归直线斜率的置信区间54

2.9.3给定x条件下,y均值的置信区间55

2.9.4给定x条件下,y随机选择值的预测区间55

2.10回归假设检验58

2.11实例:棒球数据集62

2.12实例:加利福尼亚州数据集68

2.13线性变换实现72

总结77

参考文献79

练习题79

第3章多元回归和建模85

3.1多元回归实例85

3.2多元回归模型90

3.3多元回归推断91

3.3.1y和xi之间关系的t检验91

3.3.2营养级别和糖之间关系的t检验92

3.3.3营养级别和纤维之间关系的t检验92

3.3.4整体回归模型的显著性水平检验:F检验93

3.3.5营养级别(糖和纤维)的综合因素的F检验94

3.3.6特定回归系数的置信区间95

3.3.7给定x1,x2,…,xm下,y均值的置信区间95

3.3.8给定x1,x2,…,xm下,y随机选择值的预测区间95

3.4含有分类预测变量的回归96

3.4.1调整R2:对包含无用预测变量的惩罚模式103

3.4.2序贯的误差平方和104

3.5多重共线性106

3.6变量选择方法112

3.6.1偏F检验113

3.6.2向前选择程序114

3.6.3向后排除程序114

3.6.4逐步选择程序115

3.6.5最优子集程序115

3.6.6所有可能的子集选择程序115

3.7变量选择方法的应用116

3.7.1向前选择程序应用于谷物数据集116

3.7.2向后排除程序应用于谷物数据集118

3.7.3逐步选择程序应用于谷物数据集120

3.7.4最优子集程序应用于谷物数据集120

3.8Mallows’Cp统计量121

3.9变量选择标准123

3.10用主成分作为预测变量131

总结136

参考文献137

练习题137

第4章逻辑回归143

4.1逻辑回归的简单实例143

4.2最大似然估计146

4.3解读逻辑回归模型的输出146

4.4推论:预测变量都显著吗147

4.5解读逻辑回归模型149

4.5.1解读一个两分预测变量的模型150

4.5.2解读一个多分预测变量的模型153

4.5.3解读一个连续预测变量的模型157

4.6线性假设161

4.7空值问题164

4.8多元逻辑回归166

4.9引入高阶项处理非线性问题170

4.10验证逻辑回归模型176

4.11WEKA:运用逻辑回归进行实际应用分析180

总结184

参考文献186

练习题186

第5章朴素贝叶斯估计和贝叶斯网络191

5.1贝叶斯方法191

5.2最大后验概率分类193

5.2.1后验让步比197

5.2.2平衡数据198

5.3朴素贝叶斯分类201

5.4WEKA:运用朴素贝叶斯进行实际应用分析208

5.5贝叶斯信念网络212

5.5.1购买服装实例212

5.5.2使用贝叶斯网络寻找概率214

5.6WEKA:运用贝叶斯网络分类器进行实际应用分析216

总结218

参考文献220

练习题220

第6章遗传算法223

6.1遗传算法简介223

6.2遗传算法的基本框架224

6.3遗传算法运用简单实例225

6.3.1第一次循环225

6.3.2第二次循环227

6.4修改和改进:选择227

6.5修改和改进:交叉228

6.6实值变量的遗传算法230

6.7使用遗传算法训练神经网络231

6.8WEKA:使用遗传算法进行实际操作分析235

总结242

参考文献243

练习题244

第7章案例研究:直邮营销的回应建模问题246

7.1跨行业的数据挖掘标准流程246

7.2业务理解阶段248

7.2.1直邮营销回应问题248

7.2.2建立成本/收益表248

7.3数据理解和数据准备阶段250

7.3.1服装店数据集250

7.3.2变换以实现数据的正态性或对称性252

7.3.3标准化和标志变量254

7.3.4衍生新的变量255

7.3.5探索预测变量和回应变量之间的关系256

7.3.6对预测变量之间关联结构的考察262

7.4建模和评估阶段264

7.4.1主成分分析266

7.4.2聚类分析:BIRCH聚类算法268

7.4.3平衡训练数据集271

7.4.4建立基线模型性能272

7.4.5模型集A:使用主成分273

7.4.6失衡作为错误分类成本的替代275

7.4.7组合模型:投票277

7.4.8模型集B:非主成分分析模型279

7.4.9利用均值回应概率组合模型281

总结284

参考文献287

热门推荐