图书介绍

大数据时代数据仓库技术研究PDF|Epub|txt|kindle电子书版本网盘下载

大数据时代数据仓库技术研究
  • 王会举著 著
  • 出版社: 武汉:武汉大学出版社
  • ISBN:9787307188730
  • 出版时间:2016
  • 标注页数:158页
  • 文件大小:18MB
  • 文件页数:174页
  • 主题词:数据库系统-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据时代数据仓库技术研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 绪论1

1.1 研究背景1

1.1.1 大数据时代1

1.1.2 数据管理技术发展历程2

1.2 传统数据仓库技术概述3

1.3 四大推动力的发展变化4

1.3.1 管理对象的变化4

1.3.2 分析需求的变化6

1.3.3 硬件平台的变化6

1.3.4 软件技术的发展7

1.4 传统数据仓库系统在大数据时代面临的挑战8

1.4.1 架构问题8

1.4.2 扩展性问题10

1.4.3 数据组织方式问题10

1.4.4 计算的容错性问题11

1.5 MapReduce技术11

1.6 研究范围、目标、内容及假设13

1.7 研究技术路线16

1.7.1 基于关系数据的大型数据仓库系统研究技术路线16

1.7.2 基于属性图的多维数据分析研究技术路线18

1.8 贡献19

1.9 本书结构20

第2章 大规模可扩展的数据仓库架构22

2.1 新型数据仓库系统期望特性23

2.2 相关工作26

2.2.1 并行数据库主导型27

2.2.2 MapReduce主导型27

2.2.3 MapReduce和并行数据库集成型29

2.2.4 最新研究30

2.3 大规模可扩展的新型数据仓库架构33

2.3.1 MapReduce技术分析34

2.3.2 大规模可扩展的数据仓库架构36

2.4 StarBacthLoad星形模型数据并行加载算法40

2.5 本章小结42

第3章 可扩展的高效查询处理框架43

3.1 概述43

3.2 相关工作45

3.2.1 处理框架45

3.2.2 预连接46

3.2.3 层次编码46

3.3 TAMP执行模型47

3.3.1 关键思想47

3.3.2 TAMP执行模型48

3.3.3 TAMP在MapReduce平台上的实现49

3.4 无连接存储模型50

3.4.1 基本概念50

3.4.2 无连接存储模型51

3.4.3 维表优化存储策略55

3.4.4 事实表优化存储策略55

3.5 查询转换57

3.5.1 等值谓词判断转换57

3.5.2 范围谓词判断转换57

3.5.3 列表谓词判断转换58

3.5.4 Group-by转换58

3.5.5 一个完整的转换例子58

3.6 聚集优化59

3.6.1 并行谓词判断59

3.6.2 批量谓词判断算法59

3.6.3 跳跃式扫描60

3.6.4 Scan-index64

3.7 多版本共存的维表更新协议66

3.8 实验70

3.8.1 扩展性分析71

3.8.2 性能分析73

3.8.3 跳跃式扫描性能分析74

3.8.4 压缩性能分析76

3.8.5 数据加载时间分析78

3.8.6 存储空间分析79

3.8.7 批量谓词判断分析79

3.8.8 多版本共存的维表更新协议分析81

3.9 TAMP执行模型的其他应用领域82

3.10 本章小结82

第4章 高效的智能型HC存储模型84

4.1 概述84

4.2 Hadoop分布式文件系统概述88

4.3 相关工作89

4.4 智能型混合列式存储模型的设计90

4.4.1 HC存储模型90

4.4.2 纯列式存储模型在HDFS上的实现92

4.4.3 PAX存储模型94

4.5 代价模型95

4.5.1 概述96

4.5.2 全局代价估计99

4.5.3 局部代价估计101

4.6 实验102

4.6.1 数据加载和存储空间104

4.6.2 聚集任务105

4.6.3 连接任务106

4.6.4 容错108

4.7 本章小结109

第5章 面向大规模属性图的超图立方体111

5.1 概述111

5.2 相关研究114

5.3 超图立方体模型116

5.4 基于MapReduce的超图立方体基本计算模型121

5.5 MRGraph-Cubing:批量超图立方体计算算法122

5.5.1 自包含式连接123

5.5.2 单位立方体分批技术124

5.5.3 批处理127

5.5.4 基于代价的执行计划优化130

5.6 实验135

5.6.1 有效性136

5.6.2 自包含式连接优化138

5.6.3 单位立方体分批次优化138

5.6.4 批次执行计划优化140

5.6.5 可扩展性140

5.7 本章小结141

第6章 结论与展望143

6.1 结论143

6.2 展望144

6.2.1 TAMP并发查询的扫描共享144

6.2.2 新的TAMP代价模型与查询优化144

6.2.3 异构冗余块共存的扩展145

6.2.4 HC存储备份块恢复145

6.2.5 面向高维数据的超图数据立方体计算145

6.2.6 增量式超图数据立方体计算145

参考文献147

热门推荐