图书介绍

颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用PDF|Epub|txt|kindle电子书版本网盘下载

颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用
  • (美)阿涅斯瓦兰著 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121252242
  • 出版时间:2015
  • 标注页数:218页
  • 文件大小:18MB
  • 文件页数:238页
  • 主题词:数据处理软件

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

1 引言:为什么要超越Hadoop Map-Reduce1

Hadoop的适用范围3

大数据分析之机器学习实现的革命10

第一代机器学习工具/范式11

第二代机器学习工具/范式11

第三代机器学习工具/范式14

小结18

参考文献19

2 何为伯克利数据分析栈(BDAS)23

实现BDAS的动机24

Spark:动机25

Shark:动机26

Mesos:动机28

BDAS的设计及架构29

Spark:高效的集群数据处理的范式34

Spark的弹性分布式数据集36

Spark的实现40

Spark VS.分布式共享内存系统42

RDD的表达性44

类似Spark的系统45

Shark:分布式系统上的SQL接口46

Spark为Shark提供的扩展47

列内存存储49

分布式数据加载50

完全分区智能连接50

分区修剪50

机器学习的支持51

Mesos:集群调度及管理系统51

Mesos组件52

资源分配54

隔离55

容错性57

小结58

参考文献59

3 使用Spark实现机器学习算法66

机器学习基础知识66

机器学习:随机森林示例68

逻辑回归:概述72

二元形式的逻辑回归73

逻辑回归估计75

多元逻辑回归76

Spark中的逻辑回归算法77

支持向量机80

复杂决策面81

支持向量机背后的数学原理82

Spark中的支持向量机84

Spark对PMML的支持85

PMML结构87

PMML的生产者及消费者92

Spark对朴素贝叶斯的PMML支持94

Spark对线性回归的PMML支持95

在Spark中使用MLbase进行机器学习97

参考文献99

4 实现实时的机器学习算法101

Storm简介101

数据流103

拓扑104

Storm集群105

简单的实时计算例子106

数据流组108

Storm的消息处理担保109

基于Storm的设计模式111

分布式远程过程调用111

Trident:基于Storm的实时聚合115

实现基于Storm的逻辑回归算法116

实现基于Storm的支持向量机算法120

Storm对朴素贝叶斯PMML的支持122

实时分析的应用126

工业日志分类126

互联网流量过滤器130

Storm的替代品131

Spark流133

DStreams的动机133

参考文献135

5 图处理范式138

Pregel:基于BSP的图处理框架139

类似的做法141

开源的Pregel实现143

Giraph143

GoldenORB145

Phoebus145

Apache Hama146

Stanford GPS146

GraphLab147

GraphLab:多核版本148

分布式的GraphLab150

PowerGraph152

通过GraphLab实现网页排名算法156

顶点程序158

基于GraphLab实现随机梯度下降算法163

参考文献167

6 结论:超越Hadoop Map-Reduce的大数据分析171

Hadoop YARN概览172

Hadoop YARN的动机172

作为资源调度器的YARN174

YARN上的其他框架175

大数据分析的未来是怎样的177

参考文献180

附录A 代码笔记182

热门推荐