图书介绍
R与Hadoop大数据分析实战PDF|Epub|txt|kindle电子书版本网盘下载
![R与Hadoop大数据分析实战](https://www.shukui.net/cover/58/34456623.jpg)
- (印)普贾帕提(VigneshPrajapati)著;李明王威扬孙思栋等译 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111483526
- 出版时间:2014
- 标注页数:159页
- 文件大小:19MB
- 文件页数:182页
- 主题词:程序语言-程序设计;数据处理软件
PDF下载
下载说明
R与Hadoop大数据分析实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 R和Hadoop入门1
1.1 安装R2
1.2 安装RStudio3
1.3 R语言的功能特征3
1.3.1 使用R程序包3
1.3.2 执行数据操作3
1.3.3 日渐增多的社区支持4
1.3.4 R语言数据建模4
1.4 Hadoop的安装5
1.4.1 不同的Hadoop模式6
1.4.2 Hadoop的安装步骤6
1.5 Hadoop的特点12
1.5.1 HDFS简介13
1.5.2 MapReduce简介13
1.6 HDFS和MapReduce架构14
1.6.1 HDFS架构14
1.6.2 MapReduce架构15
1.6.3 通过图示了解HDFS和MapReduce架构15
1.7 Hadoop的子项目16
1.8 小结19
第2章 编写Hadoop MapReduce程序20
2.1 MapReduce基础概念20
2.2 Hadoop MapReduce技术简介22
2.2.1 MapReduce中包含的实体22
2.2.2 MapReduce中的主要执行进程23
2.2.3 MapReduce的局限25
2.2.4 MapReduce可以解决的问题26
2.2.5 使用Hadoop编程时用到不同的Java概念26
2.3 Hadoop MapReduce原理27
2.3.1 MapReduce对象27
2.3.2 MapReduce中实现Map阶段的执行单元数目28
2.3.3 MapReduce中实现Reduce阶段的执行单元数目28
2.3.4 MapReduce的数据流28
2.3.5 深入理解HadoopMapReduce30
2.4 编写Hadoop MapReduce示例程序32
2.4.1 MapReducejob运行的步骤33
2.4.2 MapReduce可解决的商业问题38
2.5 在R环境中编写Hadoop MapReduce程序的方式39
2.5.1 RHadoop39
2.5.2 RHIPE40
2.5.3 Hadoop streaming40
2.6 小结40
第3章 集成R和Hadoop41
3.1 RHIPE42
3.1.1 安装RHIPE42
3.1.2 RHIPE架构44
3.1.3 RHIPE实例45
3.1.4 RHIPE参考函数48
3.2 RHadoop51
3.2.1 RHadoop架构51
3.2.2 安装RHadoop52
3.2.3 RHadoop案例53
3.2.4 RHadoop参考函数56
3.3 小结58
第4章 Hadoop Streaming中使用R59
4.1 Hadoop Streaming基础概念59
4.2 使用R运行Hadoop streaming62
4.2.1 MapReduce应用程序基础63
4.2.2 如何编写MapReduce应用程序65
4.2.3 如何运行MapReduce应用程序67
4.2.4 如何浏览MapRecuce应用程序的输出69
4.2.5 Hadoop MapReduce脚本的基础R函数70
4.2.6 管理Hadoop MapReduce任务71
4.3 R语言扩展包HadoopStreaming介绍72
4.3.1 hsTableReader函数73
4.3.2 hsKeyValReader函数75
4.3.3 hasLineReader函数75
4.3.4 运行Hadoop streaming任务78
4.3.5 执行Hadoop Streaming任务79
4.4 小结79
第5章 利用R和Hadoop学习数据分析80
5.1 数据分析项目生命周期80
5.1.1 问题定义81
5.1.2 设计数据需求81
5.1.3 数据预处理81
5.1.4 数据分析82
5.1.5 数据可视化82
5.2 数据分析问题83
5.2.1 展示网页分类83
5.2.2 计算股市变动频率92
5.2.3 案例研究:预测推土机售价98
5.3 小结107
第6章 应用机器学习做大数据分析108
6.1 机器学习介绍108
6.2 有监督机器学习算法109
6.2.1 线性回归109
6.2.2 logistic回归115
6.3 无监督机器学习算法118
6.4 推荐算法123
6.4.1 在R中产生推荐商品的步骤125
6.4.2 使用R和Hadoop产生推荐商品128
6.5 小结131
第7章 从各种数据库中导入与导出数据132
7.1 文件型数据库134
7.1.1 不同类型的文件134
7.1.2 安装R包134
7.1.3 将数据导入R134
7.1.4 从R导出数据135
7.2 MySQL135
7.2.1 安装MySQL135
7.2.2 安装RMySQL136
7.2.3 列出数据表及其结构136
7.2.4 导入数据进R136
7.2.5 数据操纵137
7.3 Excel137
7.3.1 安装Excel138
7.3.2 导入数据进R138
7.3.3 R和Excel的数据操纵138
7.3.4 导出数据到Excel138
7.4 MongoDB138
7.4.1 安装MongoDB139
7.4.2 安装rmongodb141
7.4.3 导入数据进R141
7.4.4 数据操纵142
7.5 SQLite143
7.5.1 SQLite的特性143
7.5.2 安装SQLite144
7.5.3 安装RSQLite144
7.5.4 将数据导师入R144
7.5.5 数据操纵145
7.6 PostgreSQL145
7.6.1 PostgreSQL的特性145
7.6.2 安装PostgreSQL145
7.6.3 安装RPostgreSQL146
7.6.4 从R导出数据146
7.7 Hive147
7.7.1 Hive的特性147
7.7.2 安装Hive147
7.7.3 安装RHive149
7.7.4 RHive操作149
7.8 HBase150
7.8.1 HBase的特性150
7.8.2 安装HBase151
7.8.3 安装Thrift152
7.8.4 安装RHBase153
7.8.5 导入数据进R153
7.8.6 数据操纵153
7.9 小结154
附录 参考资源155