图书介绍

大数据分布式计算与案例PDF|Epub|txt|kindle电子书版本网盘下载

大数据分布式计算与案例
  • 李丰主编 著
  • 出版社: 北京:中国人民大学出版社
  • ISBN:9787300230276
  • 出版时间:2016
  • 标注页数:137页
  • 文件大小:22MB
  • 文件页数:150页
  • 主题词:统计数据-分布式数据处理-研究生-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据分布式计算与案例PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 统计分析与并行计算1

1.1 并行计算与并行计算机1

1.2 统计计算的并行原理——以矩阵乘法为例7

1.3 基于R的单机并行计算9

1.4 基于Python的单机并行计算10

1.5 大数据背景下的数据采集和存储11

1.6 参考文献14

第2章 Hadoop基础15

2.1 Hadoop历史、生态系统15

2.2 Hadoop的分布式文件系统(HDFS)16

2.3 MapReduce工作原理21

2.4 Hadoop上运行MapReduce24

2.5 MapReduce实例:分层随机抽样25

2.6 MapReduce实例:聚类分析26

2.7 参考文献30

第3章 基于Hadoop的分布式算法和模型实现31

3.1 R中实现Hadoop分布式计算31

3.2 Mahout与大数据机器学习39

3.3 利用Mahout进行数据挖掘40

3.4 Mahout实例:Logistics回归和随机森林分类算法42

3.5 Mahout实例:随机森林的分布式实现46

3.6 参考文献49

第4章 统计模型的MapReduce实现详解51

4.1 泊松回归模型:付费搜索广告分析51

4.2 判别分析:气象因素对雾霾影响分析58

4.3 分块Logistics回归60

4.4 文本分类64

4.5 朴素贝叶斯模型68

4.6 岭回归模型73

4.7 推荐系统77

4.8 参考文献80

第5章 分布式文件访问与计算81

5.1 Hive基础81

5.2 HiveQL数据定义(DDL)82

5.3 HBase89

5.4 Hive实例:FoodMart案例92

5.5 Hive实例:Hive Streaming交互计算95

5.6 参考文献96

第6章 Spark与统计模型97

6.1 Spark简介97

6.2 Spark工作原理介绍100

6.3 Pyspark命令介绍103

6.4 Spark实例:通过Word Count了解Spark工作流程107

6.5 Spark实例:二分类学习109

6.6 Spark实例:决策树模型114

6.7 参考文献115

附录A Hadoop安装运行117

A.1 单机伪分布式安装117

A.2 全分布式集群119

附录B Mahout安装与运行128

附录C Hive安装运行129

C.1 准备129

C.2 安装Hive129

C.3 配置Hive130

附录D HBase安装运行131

D.1 安装配置HBase131

D.2 启动HBase132

附录E Spark的配置与安装134

E.1 安装配置Scala134

E.2 安装配置Spark134

热门推荐