图书介绍

文本挖掘技术及其应用PDF|Epub|txt|kindle电子书版本网盘下载

文本挖掘技术及其应用
  • 谢邦昌,朱建平,李毅著 著
  • 出版社: 厦门:厦门大学出版社
  • ISBN:7561559710
  • 出版时间:2016
  • 标注页数:152页
  • 文件大小:18MB
  • 文件页数:163页
  • 主题词:

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

文本挖掘技术及其应用PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 文本挖掘技术3

第一章 绪论3

1.1 整合文本挖掘与数据挖掘4

1.2 基础技术7

第二章 资料分析15

2.1 数据分析作业15

2.1.1 数据清洗15

2.1.2 建立基本词汇数据库15

2.1.3 Metadata(元数据)及非结构化文本数据的自动分类16

2.1.4 数据聚类17

2.1.5 关系型分析18

2.2 基础挖掘过程18

2.2.1 文献的树状知识分类18

2.2.2 数据检索19

2.2.3 主题侦测追踪19

2.2.4 概念丛集19

2.2.5 个人化议题式词库(增列)19

2.2.6 动态索引词库19

2.2.7 推论分析19

第二部分 文本挖掘:以R软件为例23

第三章 R软件23

3.1 R软件简介23

3.2 R软件的特色23

3.3 R软件的基本安装24

3.4 程序包安装24

第四章 基本工具25

4.1 基本工具25

4.1.1 安装rJava包25

4.1.2 安装Rwordseg包25

4.1.3 安装tm包26

4.1.4 安装tmcn包26

4.1.5 安装wordcloud、ggplot2、graphics包26

4.1.6 安装Rfacebook、Rweibo、Rtwitter包26

4.2 社群开放平台权限申请27

4.2.1 如何获得Facebook权限27

4.2.2 如何获得微博权限33

第五章 文本挖掘之爬虫38

5.1 Rfacebook38

5.1.1 用户发文38

5.1.2 粉丝发文39

5.1.3 所需R包40

5.2 Rweibo43

5.2.1 主题43

5.2.2 实例说明47

5.2.3 所需R包48

5.3 R Twitter51

5.3.1 关键词51

5.3.2 所需R包53

5.4 网页爬虫55

5.4.1 爬一般网页文字55

5.4.1 爬PTT网页文字58

5.4.3 所需R包59

5.5 SpideR61

5.5.1 所需R包61

5.5.2 有关爬虫时的注意事项62

5.5.3 抓取网页数据的标准作业程序62

5.5.4 R IDE的编码63

5.5.5 读取文档或网页的编码63

5.5.6 R IDE开发spideR面对编码的解决方案64

第六章 数据预处理65

6.1 编码处理65

6.1.1 乱码问题65

6.1.2 字符编码种类65

6.2 代表性语料库、词库简介66

6.2.1 知网http://www.keenage.com66

6.2.2 中文词知识库小组(http://ekip.iis.sinica.edu.tw/CKIP/index.htm)69

6.3 断词方法69

6.4 字词处理72

6.5 语料库建立73

6.6 正则表达式(regular expressions)76

第七章 资料分析77

7.1 频率(词频)77

7.2 DTM(TDM)matrix78

7.2.1 DocumentTermMatrix与TermDocumentMatrix78

7.2.2 稀疏矩阵(sparse matrix)79

7.3 关联分析81

7.4 聚类分析82

7.4.1 常用的两种相似系数82

7.4.2 常用的点间距离公式83

7.4.3 层次式聚类法84

7.4.4 非层次式聚类法85

7.4.5 R聚类分析语法85

7.5 主成分分析86

7.5.1 主成分分析原理86

7.5.2 主成分分析数学模型87

7.5.3 主成分特性88

7.5.4 R语言主成分分析语法89

7.6 词云聚类分析91

7.6.1 词云聚类简介91

7.6.2 R语言词云聚类语法91

第三部分 文本挖掘之SQL Server 201499

第八章 SQL Server 2014简介99

8.1 商业智能应用程序99

8.2 文本挖掘技术100

第九章 文本挖掘应用101

9.1 导入文本数据101

9.2 建立NGArticles的词库105

9.2.1 建立词库(Dictionary)105

9.2.2 建立词向量117

9.2.3 建立Train Sample和Test Sample124

第十章 资料分析131

10.1 串联Train Sample、Test Sample和TermVectors131

10.2 构建数据挖掘模型(决策树、神经网络、逻辑回归)134

10.3 图表分析143

10.3.1 各模型的准确度图表分析143

10.3.2 决策树图表分析145

10.3.3 神经网络图表分析146

第十一章 文本挖掘在实务上的应用148

11.1 创造商机148

11.1.1 商品卖得好149

11.1.2 社群操作得好150

11.1.3 危机预警151

11.1.4 广告ROI高152

11.2 结语152

热门推荐