图书介绍
国外计算机科学经典教材 数据挖掘原理与应用:SQL SERVER 2005数据库PDF|Epub|txt|kindle电子书版本网盘下载
- (美)ZHAOHUI TANG JAMIE MACLENNAN著 邝祝芳 焦贤龙 高升译 著
- 出版社: 清华大学出版社
- ISBN:
- 出版时间:2007
- 标注页数:372页
- 文件大小:78MB
- 文件页数:389页
- 主题词:
PDF下载
下载说明
国外计算机科学经典教材 数据挖掘原理与应用:SQL SERVER 2005数据库PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据挖掘导论1
1.1 什么是数据挖掘1
1.2 数据挖掘解决的商业问题4
1.3 数据挖掘的任务5
1.3.1 分类5
1.3.2 聚类5
1.3.3 关联6
1.3.4 回归6
1.3.6 序列分析7
1.3.5 预测7
1.3.7 偏差分析8
1.4 数据挖掘技术8
1.5 数据流9
1.6 数据挖掘项目的生命周期10
1.6.1 第1步:数据收集10
1.6.2 第2步:数据清理和转换10
1.6.3 第3步:模型构建12
1.6.4 第4步:模型评估12
1.6.8 第8步:模型管理13
1.6.7 第7步:应用集成13
1.6.6 第6步:预测(评分)13
1.6.5 第5步:报告13
1.7 数据挖掘当前市场与主要厂商14
1.7.1 数据挖掘市场的大小14
1.7.2 主要生产厂商和产品14
1.8 目前存在的问题及挑战15
1.9 数据挖掘标准16
1.10 OLE DB forDM规范和XML for Analysis规范16
1.10.1 用于数据挖掘的SQL/Multimedia17
1.10.2 Java数据挖掘API18
1.10.3 预测模型标记语言20
1.10.4 Crisp-DM模型23
1.10.5 公共仓库元数据24
1.11 数据挖掘的新趋势25
1.12 本章小结26
第2章 OLE DB for DM规范27
2.1 OLE DB介绍27
2.2 为什么使用OLE DB进行数据挖掘29
2.3.1 事例31
2.3 OLE DB for DM规范中的基本概念31
2.3.2 事例键32
2.3.3 嵌套键32
2.3.4 事例表和嵌套表33
2.3.5 标量列和表列33
2.3.6 数据挖掘模型33
2.3.7 模型创建33
2.3.8 模型训练33
2.4.1 数据挖掘的3个步骤34
2.4 DMX34
2.3.9 模型预测34
2.4.2 预测函数43
2.4.3 单例查询50
2.4.4 仅仅使用内容进行预测51
2.4.5 钻取模型的内容52
2.4.6 内容查询52
2.5 理解模式行集52
2.5.1 Mining Services模式行集53
2.5.3 Mining_Models模式行集54
2.5.2 Service_Parameters模式行集54
2.5.4 Mining_Columns模式行集55
2.5.5 Mining_Model_Content模式行集55
2.5.6 Query_Content模式行集58
2.5.7 Mining_Functions模式行集59
2.5.8 Model_PMML模式行集60
2.6 理解用于挖掘结构的DMX扩展60
2.6.1 挖掘结构60
2.6.2 挖掘结构的DMX扩展61
2.6.3 Mining Structure模式行集62
2.7 本章小结63
第3章 实践SQL Server数据挖掘65
3.1 BI Dev Studio介绍65
3.1.1 理解用户界面66
3.1.2 脱机模式和即时模式68
3.2 设置数据源72
3.2.1 数据源72
3.2.2 使用数据源视图74
3.3.2 使用数据挖掘向导83
3.3 创建和编辑模型83
3.3.1 结构和模型83
3.3.3 创建MovieClick挖掘结构和挖掘模型88
3.3.4 使用数据挖掘设计器89
3.4 处理94
3.5 使用模型96
3.5.1 了解模型查看器96
3.5.2 使用挖掘准确性图表98
3.5.4 使用挖掘模型预测101
3.5.3 为MovieClick模型创建一个提升图101
3.5.5 针对MovieClick模型执行查询102
3.5.6 创建数据挖掘报表103
3.6 使用SQL Server Management Studio104
3.6.1 了解Management Studio用户界面105
3.6.2 使用对象资源管理器106
3.6.3 使用查询编辑器106
3.7 本章小结107
第4章 Microsoft贝叶斯算法109
4.1 贝叶斯算法介绍109
4.2 理解贝叶斯算法的基本原理110
4.3 贝叶斯算法的参数112
4.4 使用贝叶斯算法113
4.4.1 DMX114
4.4.2 理解贝叶斯模型的内容115
4.4.3 浏览贝叶斯模型117
4.5 本章小结120
第5章 Microsoft决策树算法121
5.1 决策树算法介绍121
5.2.1 决策树生成的基本思想122
5.2 决策树算法的基本原理122
5.2.2 处理变量中的多个状态125
5.2.3 避免过度训练125
5.2.4 结合先验知识126
5.2.5 特征选择126
5.2.6 使用连续的输入属性127
5.2.7 回归127
5.2.8 使用Microsoft决策树算法进行关联分析128
5.3 理解算法参数129
5.4.1 DMX查询131
5.4 使用决策树算法131
5.4.2 模型内容135
5.4.3 解释模型136
5.5 本章小结139
第6章 Microsoft时序算法141
6.1 Microsoft时序算法介绍141
6.2 Microsoft时序算法的基本原理142
6.2.1 自动回归142
6.2.3 自动回归树144
6.2.2 使用多个时间序列144
6.2.4 季节性145
6.2.5 预测历史146
6.2.6 高速缓存预测146
6.3 理解时序算法的参数147
6.4 使用Microsoft时序算法148
6.4.1 DMX查询148
6.4.2 模型内容152
6.4.3 模型解释152
6.5 本章小结155
第7章 Microsoft聚类算法157
7.1 Microsoft聚类算法介绍158
7.2 聚类算法的基本原理159
7.2.1 硬聚类算法与软聚类算法160
7.2.2 离散聚类161
7.2.3 可伸缩聚类162
7.2.4 聚类预测163
7.3 聚类算法的参数163
7.4.1 将聚类作为一个分析步骤166
7.4 使用聚类模型166
7.4.2 DMX167
7.4.3 模型内容169
7.4.4 理解聚类模型169
7.5 本章小结174
第8章 Microsoft序列聚类算法175
8.1 Microsoft序列聚类算法介绍175
8.2 Microsoft序列聚类算法的基本原理176
8.2.1 什么是马尔可夫链176
8.2.2 马尔可夫链的阶176
8.2.3 状态转移矩阵177
8.2.4 使用马尔可夫链来进行聚类178
8.2.5 聚类分解180
8.3 序列聚类算法的参数180
8.4 使用序列聚类算法181
8.4.1 DMX查询181
8.4.2 模型内容185
8.4.3 解释模型185
8.5 本章小结189
9.1 Microsoft关联规则算法介绍191
第9章 Microsoft关联规则算法191
9.2 关联规则算法的基本原理192
9.2.1 理解关联规则算法的基本概念192
9.2.2 挖掘频繁项集195
9.2.3 生成关联规则198
9.2.4 预测198
9.3 关联算法的参数199
9.4 使用关联算法200
9.4.1 DMX查询200
9.4.2 模型内容202
9.4.3 解释模型203
9.5 本章小结205
第10章 Microsoft神经网络算法207
10.1 Microsoft神经网络算法的基本原理207
10.1.1 什么是神经网络208
10.1.2 组合和激活209
10.1.3 反向传播、误差函数和共轭梯度211
10.1.4 处理神经网络的简单示例212
10.1.5 规范化和映射213
10.1.6 网络拓扑214
10.1.7 训练终止条件215
10.2 神经网络算法的参数215
10.3 DMX查询216
10.4 模型内容218
10.5 解释模型219
10.6 本章小结221
第11章 挖掘OLAP立方体223
11.1 OLAP介绍224
11.1.2 理解维和层次225
11.1.1 理解星型模式和雪花模式225
11.1.3 理解度量和度量组226
11.1.4 理解立方体的处理和存储227
11.1.5 使用前摄缓存228
11.1.6 查询立方体228
11.2 执行计算229
11.3 浏览立方体230
11.4 理解统一维度模型231
11.5 理解OLAP和数据挖掘之间的关系234
11.5.2 OLAP需要数据挖掘来发现模式235
11.5.1 OLAP在聚集数据方面给数据挖掘带来的好处235
11.5.3 OLAP挖掘与关系挖掘236
11.6 使用向导和编辑器来构建OLAP挖掘模型237
11.6.1 使用数据挖掘向导237
11.6.2 构建客户细分模型237
11.6.3 创建购物篮模型239
11.6.4 创建销售预测模型242
11.6.5 使用数据挖掘编辑器245
11.7 理解数据挖掘维246
11.8 在DMX查询内部使用MDX248
11.9 将AMO用于OLAP挖掘模型249
11.10 本章小结253
第12章 SQL Server集成服务数据挖掘255
12.1 SSIS介绍255
12.1.1 理解SSIS包257
12.1.2 任务流257
12.1.3 数据流259
12.2 在SSIS环境中进行数据挖掘261
12.2.1 数据挖掘任务262
12.2.2 数据挖掘转换267
12.3 本章小结276
第13章 SQL Server数据挖掘的体系结构277
13.1 Analysis Services体系结构介绍277
13.2 XML for Analysis278
13.2.1 XMLA的API279
13.2.2 XMLA和Analysis Services282
13.3 处理体系结构283
13.4 数据挖掘管理284
13.4.1 服务器配置284
13.4.2 数据挖掘安全285
13.5 本章小结287
第14章 SQL Server数据挖掘编程289
14.1 数据挖掘API290
14.1.1 ADO291
14.1.2 ADO.NET291
14.1.3 ADOMD.NET291
14.1.5 AMO292
14.2 使用Analysis Services的API292
14.1.4 Server ADOMD292
14.3 使用Microsoft.AnalysisServices创建和管理挖掘模型293
14.3.1 AMO的基本原理294
14.3.2 AMO应用程序和安全295
14.3.3 对象的创建296
14.4 浏览和查询挖掘模型305
14.4.1 使用ADOMD.NET来预测306
14.4.2 浏览模型309
14.4.3 存储过程311
14.4.4 编写存储过程312
14.5 本章小结317
第15章 实现一个Web交叉销售应用程序319
15.1 源数据描述319
15.2 构建模型320
15.2.1 确定数据挖掘任务320
15.2.2 将决策树算法应用于关联任务320
15.2.3 使用关联规则算法322
15.2.4 两个模型的比较324
15.3.1 批处理预测查询325
15.3 执行预测325
15.3.2 使用单例预测查询327
15.4 在Web应用程序中集成预测功能327
15.4.1 理解Web应用程序的体系结构327
15.4.2 设置权限328
15.4.3 分析Web推荐应用程序的样例代码329
15.5 本章小结332
第16章 使用Microsoft Excel进行高级预测333
16.1 针对会话模型来配置Analysis Services333
16.2 使用高级预测工具334
16.4 构建输入数据集336
16.3 ExcelTimeSeries插件的体系结构336
16.5 创建和训练挖掘模型339
16.5.1 连接数据挖掘引擎339
16.5.2 创建和训练340
16.6 预测序列342
16.7 结合所有代码343
16.8 本章小结346
第17章 扩展SQL Server数据挖掘347
17.1 理解插件算法347
17.1.2 插件算法的概念348
17.1.1 插件算法的架构348
17.1.3 模型的创建和处理350
17.1.4 预测351
17.1.5 内容导航352
17.1.6 受托管的插件352
17.1.7 安装插件算法353
17.2 使用数据挖掘查看器353
17.3 本章小结354
18.1.1 最新的算法355
18.1 重新回顾SQL Server 2005数据挖掘的亮点355
第18章 总结与其他资源355
18.1.2 易于使用的工具356
18.1.3 简单而强大的API356
18.1.4 与同类BI技术的集成357
18.2 探讨数据挖掘的新领域及应用357
18.3 延伸阅读358
1 8.3.1 Microsoft数据挖掘的资源358
18.3.2 数据挖掘的其他资源358
1 8.3.4 流行的数据挖掘会议359
18.3.3 流行的数据挖掘Web站点359
附录A 导入数据集361
A.1 数据集361
A.1.1 MovieClick数据集361
A.1.2 Voting Records数据集363
A.1.3 FoodMart 2000数据集364
A.1.4 College Plans数据集364
A.2 导入数据集364
附录B 支持的VBA函数和Excel函数369
附录C 学习资源373