图书介绍

数据仓库与数据挖掘 第2版PDF|Epub|txt|kindle电子书版本网盘下载

数据仓库与数据挖掘 第2版
  • 陈志泊,韩慧,王建新,孙俏,聂耿青 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302483991
  • 出版时间:2017
  • 标注页数:252页
  • 文件大小:37MB
  • 文件页数:263页
  • 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

数据仓库与数据挖掘 第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据仓库的概念与体系结构1

1.1 数据仓库的概念、特点与组成1

1.1.1 数据仓库的特点2

1.1.2 数据仓库的组成2

1.2 数据挖掘的概念与方法4

1.2.1 数据挖掘的分析方法4

1.2.2 数据仓库与数据挖掘的关系4

1.3 数据仓库的技术、方法与产品4

1.3.1 OLAP技术4

1.3.2 数据仓库实施的关键环节和技术6

1.3.3 数据仓库实施方法论8

1.3.4 常用的数据仓库产品8

1.4 数据仓库系统的体系结构11

1.4.1 独立的数据仓库体系结构13

1.4.2 基于独立数据集市的数据仓库体系结构14

1.4.3 基于依赖型数据集市和操作型数据存储的数据仓库体系结构15

1.4.4 基于逻辑型数据集市和实时数据仓库的体系结构17

1.5 数据仓库的产生、发展与未来19

1.5.1 数据仓库的产生19

1.5.2 数据仓库的发展20

1.5.3 数据仓库的未来23

1.5.4 新一代数据仓库技术24

1.6 小结25

1.7 习题26

第2章 数据仓库的数据存储与处理27

2.1 数据仓库的数据结构27

2.2 数据仓库的数据特征28

2.2.1 状态数据与事件数据28

2.2.2 当前数据与周期数据28

2.2.3 元数据30

2.3 数据仓库的数据ETL过程31

2.3.1 ETL的目标31

2.3.2 ETL过程描述32

2.3.3 数据抽取33

2.3.4 数据清洗33

2.3.5 数据转换35

2.3.6 数据加载和索引36

2.4 多维数据模型37

2.4.1 多维数据模型及其相关概念38

2.4.2 多维数据模型的实现39

2.4.3 多维建模技术41

2.4.4 星型模式举例44

2.5 小结45

2.6 习题46

第3章 数据仓库系统的设计与开发47

3.1 数据仓库系统的设计与开发概述47

3.1.1 建立数据仓库系统的步骤47

3.1.2 数据仓库系统的生命周期48

3.1.3 建立数据仓库系统的思维模式49

3.1.4 数据仓库数据库的设计步骤49

3.2 基于SQL Server 2005的数据仓库数据库设计50

3.2.1 分析组织的业务状况及数据源结构51

3.2.2 组织需求调研,收集分析需求54

3.2.3 采用信息包图法设计数据仓库的概念模型57

3.2.4 利用星型图设计数据仓库的逻辑模型61

3.2.5 数据仓库的物理模型设计70

3.3 使用SQL Server 2005建立多维数据模型72

3.3.1 SQL Server 2005示例数据仓库环境的配置与使用73

3.3.2 基于SQL Server 2005示例数据库的多维数据模型75

3.4 小结88

3.5 习题88

第4章 关联规则90

4.1 概述90

4.2 引例91

4.3 经典算法94

4.3.1 Apriori算法94

4.3.2 FP-growth算法97

4.4 相关研究与应用100

4.4.1 分类100

4.4.2 SQL Server 2005中的关联规则应用100

4.5 小结106

4.6 习题107

第5章 数据分类108

5.1 引例108

5.2 分类问题概述109

5.2.1 分类的过程109

5.2.2 分类的评价准则110

5.3 决策树112

5.3.1 决策树的基本概念112

5.3.2 决策树算法ID3113

5.3.3 ID3算法应用举例115

5.3.4 决策树算法C4.5117

5.3.5 SQL Server 2005中的决策树应用119

5.3.6 决策树剪枝125

5.4 支持向量机125

5.5 近邻分类方法128

5.5.1 最近邻分类方法128

5.5.2 k-近邻分类方法128

5.5.3 近邻分类方法应用举例129

5.6 小结130

5.7 习题130

第6章 数据聚类131

6.1 引例131

6.2 聚类分析概述132

6.3 聚类分析中相似度的计算方法134

6.3.1 连续型属性的相似度计算方法134

6.3.2 二值离散型属性的相似度计算方法135

6.3.3 多值离散型属性的相似度计算方法136

6.3.4 混合类型属性的相似度计算方法137

6.4 K-means聚类算法138

6.4.1 K-means聚类算法的基本概念138

6.4.2 SQL server 2005中的K-means应用140

6.5 层次聚类方法144

6.5.1 层次聚类方法的基本概念144

6.5.2 层次聚类方法应用举例145

6.6 小结146

6.7 习题147

第7章 贝叶斯网络148

7.1 引例148

7.2 贝叶斯概率基础149

7.2.1 先验概率、后验概率和条件概率149

7.2.2 条件概率公式149

7.2.3 全概率公式150

7.2.4 贝叶斯公式151

7.3 贝叶斯网络概述152

7.3.1 贝叶斯网络的组成和结构152

7.3.2 贝叶斯网络的优越性152

7.3.3 贝叶斯网络的三个主要议题153

7.4 贝叶斯网络的预测、诊断和训练算法154

7.4.1 概率和条件概率数据154

7.4.2 贝叶斯网络的预测算法155

7.4.3 贝叶斯网络的诊断算法157

7.4.4 贝叶斯网络预测和诊断的综合算法158

7.4.5 贝叶斯网络的建立和训练算法159

7.5 SQL Server 2005中的贝叶斯网络应用161

7.6 小结166

7.7 习题166

第8章 粗糙集167

8.1 引例167

8.2 分类与知识168

8.2.1 等价关系和等价类168

8.2.2 分类169

8.3 粗糙集170

8.3.1 分类的运算170

8.3.2 分类的表达能力170

8.3.3 上近似集和下近似集170

8.3.4 正域、负域和边界171

8.3.5 粗糙集应用举例171

8.3.6 粗糙集的性质172

8.4 辨识知识的简化173

8.4.1 集合近似精度的度量173

8.4.2 分类近似的度量173

8.4.3 等价关系的可省略、独立和核174

8.4.4 等价关系简化举例175

8.4.5 知识的相对简化175

8.4.6 知识的相对简化举例176

8.5 决策规则简化176

8.5.1 知识依赖性的度量176

8.5.2 简化决策规则177

8.5.3 可辨识矩阵179

8.6 小结180

8.7 习题181

第9章 神经网络182

9.1 引例182

9.2 人工神经网络183

9.2.1 人工神经网络概述183

9.2.2 神经元模型184

9.2.3 网络结构185

9.3 BP算法186

9.3.1 网络结构和数据示例186

9.3.2 有序导数187

9.3.3 计算误差信号对参数的有序导数188

9.3.4 梯度下降189

9.3.5 BP算法描述189

9.4 SQL Server 2005中的神经网络应用190

9.5 小结196

9.6 习题197

第10章 遗传算法198

10.1 概述198

10.2 相关概念199

10.3 基本步骤200

10.3.1 概述200

10.3.2 引例201

10.4 算法设计203

10.4.1 编码方式203

10.4.2 种群规模204

10.4.3 适应度函数205

10.4.4 遗传算子205

10.4.5 终止条件207

10.5 相关研究与应用207

10.6 小结209

10.7 习题209

第11章 统计分析211

11.1 线性回归模型211

11.1.1 线性回归模型的参数估计212

11.1.2 线性回归方程的判定系数213

11.1.3 线性回归方程的检验214

11.1.4 统计软件中的线性回归分析215

11.1.5 SQL Server 2005中的线性回归应用216

11.2 Logistic回归模型222

11.2.1 Logistic回归模型的参数估计222

11.2.2 统计软件中Logistic回归的结果分析222

11.2.3 SQL Server 2005中的Logistic回归应用223

11.3 时间序列模型229

11.3.1 ARIMA模型230

11.3.2 建立ARIMA模型的步骤231

11.3.3 使用统计软件估计ARIMA模型231

11.3.4 SQL Server 2005中的时间序列分析233

11.4 小结238

11.5 习题238

第12章 文本和Web挖掘239

12.1 引例239

12.2 文本挖掘240

12.2.1 文本信息检索概述240

12.2.2 基于关键字的关联分析243

12.2.3 文档自动聚类243

12.2.4 自动文档分类244

12.2.5 自动摘要244

12.3 Web挖掘246

12.3.1 Web内容挖掘247

12.3.2 Web结构挖掘247

12.3.3 Web使用挖掘249

12.4 小结250

12.5 习题250

参考文献251

热门推荐