图书介绍

大数据导论PDF|Epub|txt|kindle电子书版本网盘下载

大数据导论
  • 孟宪伟,许桂秋主编 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:9787115503459
  • 出版时间:2019
  • 标注页数:188页
  • 文件大小:66MB
  • 文件页数:197页
  • 主题词:数据处理-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据导论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 什么是大数据1

1.1 人类信息文明的发展1

1.2 大数据时代的来临2

1.2.1 信息技术的发展3

1.2.2 数据产生方式的变革5

1.3 大数据的主要特征7

1.3.1 大数据的数据特征8

1.3.2 大数据的技术特征10

1.4 大数据的社会价值11

习题12

本章参考文献13

第2章 大数据技术基础14

2.1 计算机操作系统14

2.1.1 什么是操作系统14

2.1.2 Linux操作系统16

2.2 编程语言18

2.2.1 编程语言的发展与种类18

2.2.2 Python语言21

2.3 数据库23

2.3.1 SQL数据库的发展与成熟24

2.3.2 NoSQL数据库及其特点25

2.3.3 NoSQL数据库的分类27

2.3.4 NewSQL数据库30

2.4 算法30

2.4.1 什么是算法30

2.4.2 大数据时代的算法32

2.5 大数据系统33

2.5.1 Hadoop平台33

2.5.2 Spark平台35

2.6 大数据的数据类型37

2.6.1 结构化数据38

2.6.2 半结构化数据38

2.6.3 非结构化数据39

2.7 大数据应用的开发流程40

2.8 数据科学算法的应用流程41

习题42

本章参考文献43

第3章 数据采集与预处理44

3.1 大数据的来源44

3.1.1 传统商业数据45

3.1.2 互联网数据45

3.1.3 物联网数据46

3.2 数据的采集方法47

3.2.1 系统日志的采集方法47

3.2.2 网页数据的采集方法52

3.2.3 其他数据的采集方法55

3.3 数据预处理56

3.3.1 影响数据质量的因素56

3.3.2 数据预处理的目的59

3.3.3 数据预处理的流程60

习题67

本章参考文献67

第4章 大数据存储与管理68

4.1 数据存储概述68

4.1.1 数据的存储介质68

4.1.2 数据的存储模式72

4.2 大数据时代的存储管理系统76

4.2.1 文件系统76

4.2.2 分布式文件系统77

4.2.3 数据库80

4.2.4 键-值数据库82

4.2.5 分布式数据库82

4.2.6 关系型数据库84

4.2.7 数据仓库85

4.2.8 文档数据库87

4.2.9 图形数据库89

4.2.10 云存储90

习题93

本章参考文献93

第5章 大数据计算框架94

5.1 计算框架94

5.1.1 批处理框架94

5.1.2 流式处理框架95

5.1.3 交互式处理框架96

5.2 MapReduce96

5.2.1 MapReduce编程的特点97

5.2.2 MapReduce的计算模型97

5.2.3 MapReduce的资源管理框架101

5.3 Spark105

5.3.1 Spark的基本知识105

5.3.2 Spark的生态系统107

5.3.3 Spark的架构与原理109

5.3.4 Spark RDD的基本知识111

习题115

本章参考文献115

第6章 数据挖掘116

6.1 什么是数据挖掘116

6.2 数据挖掘的对象与价值119

6.2.1 数据挖掘的对象119

6.2.2 数据挖掘的价值121

6.3 数据挖掘常用的技术123

6.3.1 关联分析123

6.3.2 分类分析126

6.3.3 聚类分析129

6.4 数据挖掘常用的工具132

6.4.1 RapidMiner133

6.4.2 WEKA133

6.4.3 Orange134

6.4.4 R语言134

6.4.5 Mining135

6.5 数据挖掘的典型应用137

6.5.1 社交媒体领域的应用137

6.5.2 市场营销领域的应用137

6.5.3 科学研究领域的应用138

6.5.4 电信领域的应用138

6.5.5 教育领域的应用138

6.5.6 医学领域的应用139

习题140

本章参考文献140

第7章 数据可视化141

7.1 什么是可视化141

7.1.1 可视化的含义141

7.1.2 可视化的发展历程142

7.1.3 可视化的作用143

7.2 数据可视化及其分类144

7.2.1 科学可视化144

7.2.2 信息可视化146

7.2.3 可视化分析学147

7.3 数据可视化工具147

7.3.1 入门级工具148

7.3.2 信息图表工具149

7.3.3 地图工具152

7.3.4 高级分析工具155

7.4 数据可视化案例157

7.4.1 数字美食157

7.4.2 空中的间谍157

习题158

本章参考文献158

第8章 大数据与云计算160

8.1 什么是云计算160

8.1.1 云计算的概念与特点160

8.1.2 云计算的分类162

8.1.3 云计算与分布式计算的区别163

8.1.4 云计算的体系架构163

8.1.5 云计算需要解决的问题165

8.1.6 具有代表性的云计算厂商166

8.2 大数据与云计算的关系167

8.2.1 云计算将改变大数据分析168

8.2.2 大数据与云计算的区别和联系168

8.2.3 大数据与云计算未来的发展方向和趋势169

8.2.4 大数据与云计算在生产生活中的应用171

习题173

本章参考文献174

第9章 大数据与人工智能175

9.1 什么是人工智能175

9.1.1 人工智能的发展历史176

9.1.2 人工智能的研究方向和方法182

9.1.3 人工智能面临的问题184

9.2 数据驱动的智能时代185

9.2.1 人工智能与大数据185

9.2.2 产业战略187

习题188

本章参考文献188

热门推荐