图书介绍
PYTHON数据分析实战PDF|Epub|txt|kindle电子书版本网盘下载
![PYTHON数据分析实战](https://www.shukui.net/cover/6/31991132.jpg)
- (意)内利著;杜春晓译 著
- 出版社: 北京:人民邮电出版社
- ISBN:9787115432209
- 出版时间:2016
- 标注页数:290页
- 文件大小:39MB
- 文件页数:302页
- 主题词:软件工具-程序设计
PDF下载
下载说明
PYTHON数据分析实战PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据分析简介1
1.1 数据分析1
1.2 数据分析师的知识范畴2
1.2.1 计算机科学2
1.2.2 数学和统计学3
1.2.3 机器学习和人工智能3
1.2.4 数据来源领域3
1.3 理解数据的性质4
1.3.1 数据到信息的转变4
1.3.2 信息到知识的转变4
1.3.3 数据的类型4
1.4 数据分析过程4
1.4.1 问题定义5
1.4.2 数据抽取6
1.4.3 数据准备6
1.4.4 数据探索和可视化7
1.4.5 预测模型7
1.4.6 模型评估8
1.4.7 部署8
1.5 定量和定性数据分析9
1.6 开放数据9
1.7 Python和数据分析11
1.8 结论11
第2章 Python世界简介12
2.1 Python——编程语言12
2.2 Python——解释器13
2.2.1 Cython14
2.2.2 Jython14
2.2.3 PyPy14
2.3 Python 2和Python 314
2.4 安装Python15
2.5 Python发行版15
2.5.1 Anaconda15
2.5.2 Enthought Canopy16
2.5.3 Python(x,y)17
2.6 使用Python17
2.6.1 Python shell17
2.6.2 运行完整的Python程序17
2.6.3 使用IDE编写代码18
2.6.4 跟Python 交互18
2.7 编写Python代码18
2.7.1 数学运算18
2.7.2 导入新的库和函数19
2.7.3 函数式编程21
2.7.4 缩进22
2.8 IPython23
2.8.1 IPython shell23
2.8.2 IPython Qt-Console24
2.9 PyPI仓库——Python包索引25
2.10 多种Python IDE26
2.10.1 IDLE26
2.10.2 Spyder27
2.10.3 Eclipse (pyDev)27
2.10.4 Sublime28
2.10.5 Liclipse29
2.10.6 NinjaIDE29
2.10.7 Komodo IDE29
2.11 SciPy30
2.11.1 NumPy30
2.11.2 pandas30
2.11.3 matplotlib31
2.12 小结31
第3章 NumPy库32
3.1 NumPy简史32
3.2 NumPy安装32
3.3 ndarray:NumPy库的心脏33
3.3.1 创建数组34
3.3.2 数据类型34
3.3.3 dtype选项35
3.3.4 自带的数组创建方法36
3.4 基本操作37
3.4.1 算术运算符37
3.4.2 矩阵积38
3.4.3 自增和自减运算符39
3.4.4 通用函数40
3.4.5 聚合函数40
3.5 索引机制、切片和迭代方法41
3.5.1 索引机制41
3.5.2 切片操作42
3.5.3 数组迭代43
3.6 条件和布尔数组45
3.7 形状变换45
3.8 数组操作46
3.8.1 连接数组46
3.8.2 数组切分47
3.9 常用概念49
3.9.1 对象的副本或视图49
3.9.2 向量化50
3.9.3 广播机制50
3.10 结构化数组52
3.11 数组数据文件的读写53
3.11.1 二进制文件的读写54
3.11.2 读取文件中的列表形式数据54
3.12 小结55
第4章 pandas库简介56
4.1 pandas:Python数据分析库56
4.2 安装57
4.2.1 用Anaconda安装57
4.2.2 用PyPI安装58
4.2.3 在Linux系统的安装方法58
4.2.4 用源代码安装58
4.2.5 Windows模块仓库59
4.3 测试pandas是否安装成功59
4.4 开始pandas之旅59
4.5 pandas数据结构简介60
4.5.1 Series对象60
4.5.2 DataFrame对象66
4.5.3 Index对象72
4.6 索引对象的其他功能74
4.6.1 更换索引74
4.6.2 删除75
4.6.3 算术和数据对齐77
4.7 数据结构之间的运算78
4.7.1 灵活的算术运算方法78
4.7.2 DataFrame和Series对象之间的运算78
4.8 函数应用和映射79
4.8.1 操作元素的函数79
4.8.2 按行或列执行操作的函数80
4.8.3 统计函数81
4.9 排序和排位次81
4.10 相关性和协方差84
4.11 NaN数据85
4.11.1 为元素赋NaN值85
4.11.2 过滤NaN86
4.11.3 为NaN元素填充其他值86
4.12 等级索引和分级87
4.12.1 重新调整顺序和为层级排序89
4.12.2 按层级统计数据89
4.13 小结90
第5章 pandas:数据读写91
5.1 I/O API工具91
5.2 CSV和文本文件92
5.3 读取CSV或文本文件中的数据92
5.3.1 用RegExp解析TXT文件94
5.3.2 从TXT文件读取部分数据96
5.3.3 往CSV文件写入数据97
5.4 读写HTML文件98
5.4.1 写入数据到HTML文件98
5.4.2 从HTML文件读取数据100
5.5 从XML读取数据101
5.6 读写Microsoft Excel文件103
5.7 JSON数据105
5.8 HDF5格式107
5.9 pickle——Python对象序列化108
5.9.1 用cPicklc实现Python 对象序列化109
5.9.2 用pandas实现对象序列化109
5.10 对接数据库110
5.10.1 SQLite3数据读写111
5.10.2 PostgreSQL数据读写112
5.11 NoSQL数据库MongoDB数据读写114
5.12 小结116
第6章 深入pandas:数据处理117
6.1 数据准备117
6.2 拼接122
6.2.1 组合124
6.2.2 轴向旋转125
6.2.3 删除127
6.3 数据转换128
6.3.1 删除重复元素128
6.3.2 映射129
6.4 离散化和面元划分132
6.5 排序136
6.6 字符串处理137
6.6.1 内置的字符串处理方法137
6.6.2 正则表达式139
6.7 数据聚合140
6.7.1 GroupBy141
6.7.2 实例141
6.7.3 等级分组142
6.8 组迭代143
6.8.1 链式转换144
6.8.2 分组函数145
6.9 高级数据聚合145
6.10 小结148
第7章 用matplotlib实现数据可视化149
7.1 matplotlib库149
7.2 安装150
7.3 IPython和IPython QtConsole150
7.4 matplotlib架构151
7.4.1 Backend层152
7.4.2 Artist层152
7.4.3 Scripting层(pyplot)153
7.4.4 pylab和pyplot153
7.5 pyplot154
7.5.1 生成一幅简单的交互式图表154
7.5.2 设置图形的属性156
7.5.3 matplotlib和Num Py158
7.6 使用kwargs160
7.7 为图表添加更多元素162
7.7.1 添加文本162
7.7.2 添加网格165
7.7.3 添加图例166
7.8 保存图表168
7.8.1 保存代码169
7.8.2 将会话转换为HTML文件170
7.8.3 将图表直接保存为图片171
7.9 处理日期值171
7.10 图表类型173
7.11 线性图173
7.12 直方图180
7.13 条状图181
7.13.1 水平条状图183
7.13.2 多序列条状图184
7.13.3 为pandas DataFrame生成多序列条状图185
7.13.4 多序列堆积条状图186
7.13.5 为pandas DataFrame绘制堆积条状图189
7.13.6 其他条状图190
7.14 饼图190
7.15 高级图表193
7.15.1 等值线图193
7.15.2 极区图195
7.16 mplot3d197
7.16.1 3D曲面197
7.16.2 3D散点图198
7.16.3 3D条状图199
7.17 多面板图形200
7.17.1 在其他子图中显示子图200
7.17.2 子图网格202
7.18 小结204
第8章 用scikit-learn库实现机器学习205
8.1 scikit-learn库205
8.2 机器学习205
8.2.1 有监督和无监督学习205
8.2.2 训练集和测试集206
8.3 用scikit-learn实现有监督学习206
8.4 Iris数据集206
8.5 K-近邻分类器211
8.6 Diabetes数据集214
8.7 线性回归:最小平方回归215
8.8 支持向量机219
8.8.1 支持向量分类219
8.8.2 非线性SVC223
8.8.3 绘制SVM分类器对Iris数据集的分类效果图225
8.8.4 支持向量回归227
8.9 小结229
第9章 数据分析实例——气象数据230
9.1 待检验的假设:靠海对气候的影响230
9.2 数据源233
9.3 用IPython Notebook做数据分析234
9.4 风向频率玫瑰图246
9.5 小结251
第10章 IPython Notebook内嵌JavaScript库D3252
10.1 开放的人口数据源252
10.2 JavaScript库D3255
10.3 绘制簇状条状图259
10.4 地区分布图262
10.5 2014年美国人口地区分布图266
10.6 小结270
第11章 识别手写体数字271
11.1 手写体识别271
11.2 用scikit-learn识别手写体数字271
11.3 Digits数据集272
11.4 学习和预测274
11.5 小结276
附录A 用LaTeX编写数学表达式277
附录B 开放数据源287