图书介绍
颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用PDF|Epub|txt|kindle电子书版本网盘下载
![颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用](https://www.shukui.net/cover/5/34417056.jpg)
- (美)阿涅斯瓦兰著 著
- 出版社: 北京:电子工业出版社
- ISBN:9787121252242
- 出版时间:2015
- 标注页数:218页
- 文件大小:18MB
- 文件页数:238页
- 主题词:数据处理软件
PDF下载
下载说明
颠覆大数据分析 基于Storm Spark等Hadoop替代技术的实时应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
1 引言:为什么要超越Hadoop Map-Reduce1
Hadoop的适用范围3
大数据分析之机器学习实现的革命10
第一代机器学习工具/范式11
第二代机器学习工具/范式11
第三代机器学习工具/范式14
小结18
参考文献19
2 何为伯克利数据分析栈(BDAS)23
实现BDAS的动机24
Spark:动机25
Shark:动机26
Mesos:动机28
BDAS的设计及架构29
Spark:高效的集群数据处理的范式34
Spark的弹性分布式数据集36
Spark的实现40
Spark VS.分布式共享内存系统42
RDD的表达性44
类似Spark的系统45
Shark:分布式系统上的SQL接口46
Spark为Shark提供的扩展47
列内存存储49
分布式数据加载50
完全分区智能连接50
分区修剪50
机器学习的支持51
Mesos:集群调度及管理系统51
Mesos组件52
资源分配54
隔离55
容错性57
小结58
参考文献59
3 使用Spark实现机器学习算法66
机器学习基础知识66
机器学习:随机森林示例68
逻辑回归:概述72
二元形式的逻辑回归73
逻辑回归估计75
多元逻辑回归76
Spark中的逻辑回归算法77
支持向量机80
复杂决策面81
支持向量机背后的数学原理82
Spark中的支持向量机84
Spark对PMML的支持85
PMML结构87
PMML的生产者及消费者92
Spark对朴素贝叶斯的PMML支持94
Spark对线性回归的PMML支持95
在Spark中使用MLbase进行机器学习97
参考文献99
4 实现实时的机器学习算法101
Storm简介101
数据流103
拓扑104
Storm集群105
简单的实时计算例子106
数据流组108
Storm的消息处理担保109
基于Storm的设计模式111
分布式远程过程调用111
Trident:基于Storm的实时聚合115
实现基于Storm的逻辑回归算法116
实现基于Storm的支持向量机算法120
Storm对朴素贝叶斯PMML的支持122
实时分析的应用126
工业日志分类126
互联网流量过滤器130
Storm的替代品131
Spark流133
DStreams的动机133
参考文献135
5 图处理范式138
Pregel:基于BSP的图处理框架139
类似的做法141
开源的Pregel实现143
Giraph143
GoldenORB145
Phoebus145
Apache Hama146
Stanford GPS146
GraphLab147
GraphLab:多核版本148
分布式的GraphLab150
PowerGraph152
通过GraphLab实现网页排名算法156
顶点程序158
基于GraphLab实现随机梯度下降算法163
参考文献167
6 结论:超越Hadoop Map-Reduce的大数据分析171
Hadoop YARN概览172
Hadoop YARN的动机172
作为资源调度器的YARN174
YARN上的其他框架175
大数据分析的未来是怎样的177
参考文献180
附录A 代码笔记182