图书介绍

普通高等教育“十三五”应用型人才培养规划教材 数据处理与知识发现PDF|Epub|txt|kindle电子书版本网盘下载

普通高等教育“十三五”应用型人才培养规划教材 数据处理与知识发现
  • 徐琴,刘智珺主编;王晶副主编;黄向宇参编 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111605843
  • 出版时间:2018
  • 标注页数:280页
  • 文件大小:61MB
  • 文件页数:288页
  • 主题词:数据处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

普通高等教育“十三五”应用型人才培养规划教材 数据处理与知识发现PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

上篇 理论部分2

第1章 绪论2

1.1 KDD与数据挖掘2

1.1.1 KDD的定义2

1.1.2 KDD过程与数据挖掘3

1.2数据挖掘的对象4

1.3数据挖掘的任务8

1.4 Mahout简介12

1.4.1 Mahout12

1.4.2 Mahout算法库13

1.4.3 Mahout应用16

1.5小结17

1.6习题17

第2章 数据预处理18

2.1数据概述18

2.1.1属性与度量19

2.1.2数据集的类型23

2.2数据预处理27

2.2.1数据预处理概述28

2.2.2数据清理30

2.2.3数据集成34

2.2.4数据变换38

2.2.5数据归约40

2.2.6离散化与概念分层48

2.3小结52

2.4习题53

第3章 数据仓库55

3.1数据仓库概述55

3.1.1从数据库到数据仓库55

3.1.2数据仓库56

3.1.3数据仓库系统结构59

3.1.4数据仓库中的名词59

3.2数据仓库的ETL60

3.2.1 ETL的基本概念60

3.2.2 ETL的工具60

3.3元数据与外部数据62

3.3.1元数据的定义62

3.3.2元数据的存储与管理63

3.3.3外部数据64

3.4数据仓库模型及数据仓库的建立65

3.4.1多维数据模型65

3.4.2多维数据模型的建立67

3.5联机分析处理OLAP技术73

3.5.1 OLAP概述73

3.5.2 OLAP与数据仓库75

3.5.3 OLAP的模型77

3.5.4 OLAP的基本操作79

3.6数据仓库实例80

3.6.1数据仓库的创建81

3.6.2数据的提取、转换和加载83

3.7小结83

3.8习题83

第4章 关联规则挖掘84

4.1问题定义85

4.1.1购物篮分析85

4.1.2基本术语85

4.2频繁项集的产生87

4.2.1先验原理88

4.2.2 Apriori算法的频繁项集产生90

4.3规则产生94

4.3.1基于置信度的剪枝94

4.3.2 Apriori算法中规则的产生94

4.4 FP-growth算法95

4.5多层关联规则和多维关联规则99

4.5.1多层关联规则99

4.5.2多维关联规则102

4.6非二元属性的关联规则103

4.7关联规则的评估104

4.8序列模式挖掘算法106

4.8.1序列模式的概念106

4.8.2 Apriori类算法——AprioriAll算法109

4.9小结114

4.10习题115

第5章 聚类分析方法118

5.1聚类分析概述118

5.1.1聚类的定义118

5.1.2聚类算法的要求119

5.1.3聚类算法的分类120

5.1.4相似性的测度121

5.2基于划分的聚类算法126

5.2.1基于质心的(Centroid-based)划分方法——基本K-means聚类算法126

5.2.2 K-means聚类算法的拓展128

5.2.3基于中心的(Medoid-based)划分方法——PAM算法130

5.3层次聚类算法133

5.3.1 AGNES算法135

5.3.2 DIANA算法136

5.3.3改进算法——BIRCH算法137

5.3.4改进算法——CURE算法141

5.4基于密度的聚类算法143

5.5聚类算法评价147

5.6离群点挖掘149

5.6.1相关问题概述149

5.6.2基于距离的方法150

5.6.3基于相对密度的方法154

5.7小结158

5.8习题158

第6章 分类规则挖掘160

6.1分类问题概述160

6.2最近邻分类法162

6.2.1 KNN算法原理162

6.2.2 KNN算法的特点及改进165

6.2.3基于应用平台的KNN算法应用实例166

6.3决策树分类方法167

6.3.1决策树概述167

6.3.2信息论171

6.3.3 ID3算法172

6.3.4算法改进:C4.5算法176

6.4贝叶斯分类方法180

6.4.1贝叶斯定理181

6.4.2朴素贝叶斯分类器183

6.4.3朴素贝叶斯分类方法的改进185

6.5神经网络算法188

6.5.1前馈神经网络概述188

6.5.2学习前馈神经网络189

6.5.3 BP神经网络模型与学习算法191

6.6回归分析193

6.7小结196

6.8习题197

第7章 数据挖掘工具与产品198

7.1评价数据挖掘产品的标准198

7.2数据挖掘工具简介200

7.3数据挖掘的可视化203

7.3.1数据挖掘可视化的过程与方法203

7.3.2数据挖掘可视化的分类204

7.3.3数据挖掘可视化的工具206

7.4 Weka207

7.4.1 Weka Explorer208

7.4.2 Weka Experimenter216

7.4.3 KnowledgeFlow219

7.5小结221

7.6习题221

下篇 实验部分224

第8章 Mahout入门224

8.1 Mahout安装前的准备224

8.1.1安装JDK224

8.1.2安装Hadoop227

8.2 Mahout的安装237

8.3测试安装238

8.4小结239

第9章 使用Mahout实践关联规则算法240

9.1 FP树关联规则算法240

9.1.1 Mahout中Parallel Frequent Patte Mining算法的实现原理240

9.1.2 Mahout的Parallel Frequent Pattern Mining算法实践243

9.2小结246

第10章 使用Mahout实践聚类算法247

10.1 Canopy算法247

10.1.1 Mahout中Canopy算法的实现原理250

10.1.2 Mahout中Canopy算法实战251

10.2 K-means算法254

10.2.1 Mahout中K-means算法的实现原理255

10.2.2 Mahout中K-means算法实战256

10.3小结259

第11章 使用Mahout实践分类算法260

11.1 Bayesian算法260

11.1.1 Mahout中Bayesian算法的实现原理261

11.1.2 Mahout的Bayesian算法实战262

11.2 Random Forests算法270

11.2.1 Mahout中Random Forests算法的实现原理272

11.2.2 Mahout的Random Forests算法实战275

11.3小结279

参考文献280

热门推荐