图书介绍
基于Python的大数据分析基础及实战PDF|Epub|txt|kindle电子书版本网盘下载
![基于Python的大数据分析基础及实战](https://www.shukui.net/cover/7/31319170.jpg)
- 余本国著 著
- 出版社: 北京:中国水利水电出版社
- ISBN:9787517064992
- 出版时间:2018
- 标注页数:370页
- 文件大小:169MB
- 文件页数:381页
- 主题词:软件工具-程序设计
PDF下载
下载说明
基于Python的大数据分析基础及实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1部分 基础篇2
第1章 Python语言基础2
1.0引子2
1.1 工欲善其事,必先利其器(安装Python)3
1.2 学跑得先学走(语法基础)9
1.3 程序结构11
1.3.1 Hello World!11
1.3.2 运算符介绍12
1.3.3 顺序结构14
1.3.4 判断结构17
1.3.5 循环结构18
1.3.6 异常20
1.4 函数24
1.4.1 基本函数结构24
1.4.2 参数结构25
1.4.3 回调函数28
1.4.4 函数的递归与嵌套28
1.4.5 闭包31
1.4.6 匿名函数lambda32
1.4.7 关键字yield32
1.5 数据结构35
1.5.1 列表(list)35
1.5.2 元组(tuple)38
1.5.3 集合(set)39
1.5.4 字典(dict)40
1.5.5 集合的操作41
1.5.6 学以致用45
1.6 3个函数(map、filter、reduce)47
1.6.1 遍历函数(map)47
1.6.2 筛选函数(filter)48
1.6.3 累计函数(reduce)48
1.7 面向对象编程基础50
1.7.1 类50
1.7.2 类和实例51
1.7.3 数据封装52
1.7.4 私有变量与私有方法53
本章小结54
第2章 数据处理60
2.1 Anaconda简介60
2.2 Numpy简介66
2.3 关于Pandas68
2.3.1 什么是Pandas68
2.3.2 Pandas中的数据结构68
2.4 数据准备68
2.4.1 数据类型68
2.4.2 数据结构69
2.4.3 数据导入79
2.4.4 数据导出86
2.5 数据处理88
2.5.1 数据清洗89
2.5.2 数据抽取97
2.5.3 插入记录114
2.5.4 修改记录117
2.5.5 交换行或列120
2.5.6 排名索引122
2.5.7 数据合并131
2.5.8 数据计算137
2.5.9 数据分组141
2.5.10 日期处理143
带你飞(数据处理案例)148
本章小结160
第3章 数据分析165
3.1 基本统计分析165
3.2 分组分析169
3.3 分布分析171
3.4 交叉分析173
3.5 结构分析174
3.6 相关分析176
小试牛刀(相关分析案例:电商数据分析)178
本章小结180
第4章 数据可视化181
4.1 使用Python对数据进行可视化处理181
4.1.1 准备工作181
4.1.2 Matplotlib绘图示例186
4.1.3 Seabon中的图例198
4.1.4 pandas的一些可视化功能212
4.1.5 文本数据可视化217
4.1.6 networkx网络图218
4.1.7 folium绘制地图220
4.2 Python图像处理基础221
4.2.1 PIL图库221
4.2.2 OpenCV图库224
本章小结226
第5章 字符串处理与网络爬虫228
5.1 字符串处理228
5.1.1 字符串处理函数228
5.1.2 正则表达式230
5.1.3 编码处理237
5.2 网络爬虫240
5.2.1 获取网页源码240
5.2.2 从源码中提取信息241
5.2.3 数据存储246
5.2.4 网络爬虫从这里开始248
本章小结260
第2部分 实战案例篇262
第6章 词云262
6.1 安装文件包263
6.2 jieba功能用法264
6.2.1 cut用法264
6.2.2 词频与分词字典265
6.3 文本词云图269
6.4 背景轮廓词云图的制作271
6.4.1 数据准备271
6.4.2 分词272
6.4.3 构建词云273
本章小结278
第7章 航空客户分类279
7.1 问题的提出279
7.2 聚类分析相关概念280
7.3 模型的建立281
7.4 Python实现代码281
7.5 分类结果展示与分析284
本章小结287
第8章 《红楼梦》文本分析288
8.1 准备工作289
8.2 分词291
8.2.1 读取数据291
8.2.2 数据预处理293
8.2.3 对红楼梦进行分词301
8.2.4 制作词云303
8.3 文本聚类分析312
8.3.1 构建分词TF-IDF矩阵312
8.3.2 使用TF-IDF矩阵对章节进行聚类314
8.4 LDA主题模型322
8.5 人物社交网络分析328
本章小结334
第3部分 拓展与延伸336
第9章 Python字符串格式化336
9.1 使用%符号进行格式化336
9.2 使用format()方法进行格式化339
9.3 使用f方法进行格式化341
本章小结342
第10章 在Python中操作MySQL数据库343
10.1 对MySQL的连接与访问344
10.2 对MySQL的增、删、改、查操作345
10.2.1 查询操作345
10.2.2 插入操作346
10.2.3 更新操作347
10.2.4 删除操作347
10.3 创建数据库表348
本章小结349
第11章 fractal(分形)库的发布350
11.1 用Python绘制分形351
11.1.1 分形简介351
11.1.2 先睹为快351
11.1.3 绘制方法简介352
11.2 第三方库发布到PyPi364
本章小结369
参考文献370