图书介绍

基于文本特征计算的信息分析方法PDF|Epub|txt|kindle电子书版本网盘下载

基于文本特征计算的信息分析方法
  • 许鑫著 著
  • 出版社: 上海:上海科学技术文献出版社
  • ISBN:9787543968356
  • 出版时间:2015
  • 标注页数:236页
  • 文件大小:47MB
  • 文件页数:245页
  • 主题词:信息-分析方法

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

基于文本特征计算的信息分析方法PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

绪论1

第1章 信息分析方法概述3

1.1 定性分析与定量分析3

1.1.1 定性研究方法3

1.1.2 定量研究方法4

1.1.3 定性与定量相结合5

1.2 常用信息分析方法5

1.3 文本挖掘方法10

1.3.1 文本挖掘的一般过程11

1.3.2 人文社科研究中的应用13

1.3.3 常用的文本挖掘工具14

1.3.4 文本挖掘方法的局限性17

1.4 大数据时代的信息分析18

1.4.1 大数据及其特点18

1.4.2 大数据信息分析18

1.4.3 大数据分析技术19

1.4.4 大数据分析应用20

第2章 基于文本特征计算的信息分析框架23

2.1 何谓文本特征23

2.2 基于文本特征的信息分析25

2.2.1 无特征词表的文本信息分析25

2.2.2 主题词表作为特征词的文本信息分析26

2.2.3 标签作为特征词的文本信息分析30

2.3 文本特征计算与文本挖掘31

2.4 基于文本特征计算的信息分析特点32

2.5 基于文本特征计算的信息分析过程33

第3章 确认问题及设计方案35

3.1 问题的准确描述35

3.2 明确文本信息分析需求36

3.3 选取信息分析的文本对象37

3.4 设计文本特征的分析框架38

3.5 形成并确认信息分析方案38

第4章 文本数据的获取39

4.1 文本数据类型39

4.2 基于互联网的数字化文本39

4.2.1 网络信息资源40

4.2.2 网络信息资源的分类41

4.2.3 网络中的数字化文本43

4.3 Web文本采集策略44

4.3.1 确定采集范围44

4.3.2 选择采集方式45

4.3.3 常用采集技术46

4.3.4 采集的防屏蔽策略49

4.3.5 网页采集去重策略50

4.4 Web采集架构及常用工具51

4.5 互联网信息采集实例55

第5章 文本特征的选取58

5.1 网络文本预处理58

5.1.1 网页正文抽取58

5.1.2 中文分词60

5.1.3 词性标注64

5.1.4 停用词过滤66

5.2 特征词提取73

5.2.1 基于主题词表的特征词提取74

5.2.2 基于德尔菲法的特征词提取75

5.2.3 基于词频统计的特征词提取76

5.2.4 基于文档频度DF的特征词提取77

5.2.5 基于TF-IDF方法的特征词提取78

5.2.6 基于信息增益IG的特征词提取79

5.2.7 基于互信息MI的特征词提取80

5.2.8 基于λ2统计量的特征词提取81

5.2.9 其他自动提取方法及其比较82

5.3 影响特征词权重的因素分析84

5.4 计算特征的选择与词表构建85

第6章 文本特征计算及分析87

6.1 词频统计与分析87

6.1.1 相关探讨87

6.1.2 基于网络新闻的词频分析实例89

6.1.3 基于微博文本的词频分析实例92

6.1.4 基于多源文本的词频分析实例94

6.2 时空间分布分析96

6.2.1 相关探讨96

6.2.2 基于时间分布的分析实例97

6.2.3 基于空间分布的分析实例98

6.3 共现分析100

6.3.1 相关探讨100

6.3.2 基于论文题录信息共现的分析实例102

6.3.3 基于游记内容景区共现的分析实例105

6.4 文本分类111

6.4.1 相关探讨111

6.4.2 常见的分类算法113

6.4.3 上海世博会网络信息多维分类实例116

6.5 文本聚类119

6.5.1 相关探讨119

6.5.2 常见的聚类算法121

6.5.3 文本聚类用于舆情热点发现的实例125

6.5.4 基于文本聚类的热点事件演变实例128

6.6 特征关联分析132

6.6.1 相关探讨132

6.6.2 关联规则算法在文本分析中的改进133

6.6.3 上海世博会场馆与赞助商的关联分析实例135

6.6.4 基于两类Web文本的关联与交叉分析140

6.7 社会网络分析146

6.7.1 相关探讨146

6.7.2 常用的软件工具147

6.7.3 基于文献题录信息的社会网络分析148

6.7.4 基于网页链接关系的社会网络分析151

6.7.5 基于网页内容特征的社会网络分析156

6.8 文本倾向性分析158

6.8.1 情感分析相关研究158

6.8.2 文本倾向性分析研究162

6.8.3 一种文本倾向性分析方法163

6.8.4 基于上述方法的实例分析168

6.9 其他技术的应用概述172

6.9.1 信息抽取及应用172

6.9.2 可视化技术应用174

6.9.3 本体技术的应用176

第7章 基于WordScore的区域合作交流政策价值评价178

7.1 政策价值与政策价值评价178

7.1.1 政策价值178

7.1.2 政策价值评价模型与方法178

7.1.3 WordScore政策文本分析方法179

7.2 国内外区域合作交流政策研究180

7.3 区域合作交流政策价值评价模型构建181

7.3.1 区域合作交流政策价值分类体系181

7.3.2 区域合作交流政策价值模型构建182

7.4 沪浙两地十二五期间区域合作交流政策的比较184

7.5 篇章分析领域应用的探讨185

7.5.1 政策倾向性权值设定问题185

7.5.2 政策价值性的进一步解读190

7.5.3 政治法律领域的文本分析191

第8章 基于文本特征分析的古镇旅游形象感知研究193

8.1 游客感知研究综述193

8.2 研究对象与数据采集196

8.3 朱家角的游客感知形象分析197

8.3.1 高频词分析197

8.3.2 不同类型的感知形象分析198

8.3.3 感知形象的长尾现象分析199

8.4 结论与讨论201

第9章 基于网络搜索数据的金融危机传导实证分析202

9.1 网络搜索的相关研究202

9.2 一个事件分析的框架203

9.3 金融危机事件静态词表的构建204

9.3.1 事件信息表征的分类204

9.3.2 初始样本数据的选取205

9.3.3 采集策略与采集结果205

9.3.4 样本数据的处理206

9.3.5 分类词表的构建209

9.4 基于搜索数据的动态演化分析210

9.4.1 基于词表的搜索数据采集与整理210

9.4.2 基于时间维度的事件动态演化分析210

9.4.3 基于空间维度的事件动态演化分析213

9.5 金融危机事件的传导实证分析214

9.5.1 金融危机网络搜索的中美整体数据相关性分析215

9.5.2 金融危机爆发前后的中美搜索数据相关性分析216

9.5.3 表征金融危机三个类别搜索数据的相关性分析216

9.6 基于网络搜索数据的金融危机传导应对策略217

附录218

参考文献220

后记236

热门推荐