图书介绍

Python数据分析 第2版PDF|Epub|txt|kindle电子书版本网盘下载

Python数据分析 第2版
  • (美)阿曼多·凡丹戈著;韩波译 著
  • 出版社: 北京:人民邮电出版社
  • ISBN:7115481177
  • 出版时间:2018
  • 标注页数:274页
  • 文件大小:66MB
  • 文件页数:292页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Python数据分析 第2版PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章Python程序库入门1

1.1安装Python 33

1.1.1安装数据分析程序库3

1.1.2 Linux平台或Mac OS X平台3

1.1.3 Windows平台4

1.2将IPython用作shell4

1.3学习手册页6

1.4 Jupyter Notebook7

1.5 NumPy数组8

1.6一个简单的应用8

1.7从何处寻求帮助和参考资料11

1.8查看Pyton库中包含的模块12

1.9通过Matplotlib实现数据的可视化12

1.10小结14

第2章NumPy数组15

2.1 NumPy数组对象16

2.2创建多维数组17

2.3选择NumPy数组元素17

2.4 NumPy的数值类型18

2.4.1数据类型对象20

2.4.2字符码20

2.4.3 dtype构造函数21

2.4.4 dtype属性22

2.5一维数组的切片与索引23

2.6处理数组形状23

2.6.1堆叠数组25

2.6.2拆分NumPy数组28

2.6.3 NumPy数组的属性30

2.6.4数组的转换34

2.7创建数组的视图和拷贝35

2.8花式索引36

2.9基于位置列表的索引方法38

2.10用布尔型变量索引 NumPy数组39

2.11 NumPy数组的广播41

2.12小结44

2.13参考资料44

第3章Pandas入门45

3.1 Pandas的安装与概览46

3.2 Pandas数据结构之DataFrame47

3.3 Pandas数据结构之Series49

3.4利用Pandas查询数据52

3.5利用Pandas的DataFrame进行统计计算56

3.6利用Pandas的DataFrame实现数据聚合58

3.7 DataFrame的串联与附加操作62

3.8连接DataFrames63

3.9处理缺失数据问题65

3.10处理日期数据67

3.11数据透视表70

3.12小结71

3.13参考资料71

第4章 统计学与线性代数72

4.1用NumPy进行简单的描述性统计计算72

4.2用NumPy进行线性代数运算75

4.2.1用NumPy求矩阵的逆75

4.2.2用NumPy解线性方程组77

4.3用NumPy计算特征值和特征向量78

4.4 NumPy随机数80

4.4.1用二项式分布进行博弈81

4.4.2正态分布采样83

4.4.3用Scipy进行正态检验84

4.5创建掩码式NumPy数组86

4.6忽略负值和极值88

4.7小结91

第5章 数据的检索、加工与存储92

5.1利用NumPy和pandas对CSV文件进行写操作92

5.2二进制npy与pickle格式94

5.3使用PyTables存储数据97

5.4 Pandas DataFrame与HDF5仓库之间的读写操作99

5.5使用Pandas读写Excel文件102

5.6使用REST Web服务和JSON103

5.7使用Pandas读写JSON105

5.8解析RSS和Atom订阅106

5.9使用Beautiful Soup解析HTML108

5.10小结114

5.11参考资料114

第6章 数据可视化115

6.1 Matplotlib的子库116

6.2 Matplotlib绘图入门116

6.3对数图118

6.4散点图119

6.5图例和注解121

6.6三维图123

6.7 Pandas绘图125

6.8时滞图127

6.9自相关图129

6.10 Plot.ly130

6.11小结132

第7章 信号处理与时间序列133

7.1 statsmodels模块134

7.2移动平均值134

7.3窗口函数136

7.4协整的定义138

7.5自相关140

7.6自回归模型142

7.7 ARMA模型145

7.8生成周期信号147

7.9傅里叶分析149

7.10谱分析152

7.11滤波153

7.12小结155

第8章 应用数据库156

8.1基于sqlite3的轻量级访问157

8.2通过Pandas访问数据库159

8.3 SQLAlchemy161

8.3.1 SQLAlchemy的安装和配置161

8.3.2通过SQLAlchemy填充数据库162

8.3.3通过SQLAlchemy查询数据库164

8.4 Pony ORM166

8.5 Dataset:懒人数据库167

8.6 PyMongo与MongoDB168

8.7利用Redis存储数据170

8.8利用memcache存储数据171

8.9 Apache Cassandra172

8.10小结174

第9章 分析文本数据和社交媒体176

9.1安装NLTK177

9.2 NLTK简介177

9.3滤除停用字、姓名和数字178

9.4词袋模型180

9.5词频分析181

9.6朴素贝叶斯分类183

9.7情感分析186

9.8创建词云189

9.9社交网络分析193

9.10小结195

第10章 预测性分析与机器学习197

10.1预处理198

10.2基于逻辑回归的分类201

10.3基于支持向量机的分类202

10.4基于ElasticNetCV的回归分析205

10.5支持向量回归207

10.6基于相似性传播算法的聚类分析210

10.7均值漂移算法211

10.8遗传算法213

10.9神经网络217

10.10决策树219

10.11小结222

第11章 Python生态系统的外部环境和云计算223

11.1与MATLAB/Octave交换信息224

11.2安装rpy2225

11.3连接R225

11.4为Java传递NumPy数组228

11.5集成SWIG和NumPy229

11.6集成Boost和Python233

11.7通过f2py使用For ran代码235

11.8 PythonAnywhere云236

11.9小结238

第12章 性能优化、性能分析与并发性239

12.1代码的性能分析240

12.2安装Cython245

12.3调用C代码248

12.4利用multiprocessing创建进程池252

12.5通过Joblib提高for循环的并发性254

12.6比较Bottleneck函数与NumPy函数255

12.7通过Jug实现MapReduce257

12.8安装MPI for Python259

12.9 IPython Parallel260

12.10小结263

附录A重要概念264

附录B常用函数269

热门推荐