图书介绍
Java自然语言处理PDF|Epub|txt|kindle电子书版本网盘下载
![Java自然语言处理](https://www.shukui.net/cover/75/34502931.jpg)
- (美)理查德·M.里斯著;邹伟,孙逢举译 著
- 出版社: 北京:机械工业出版社
- ISBN:9787111592112
- 出版时间:2018
- 标注页数:195页
- 文件大小:48MB
- 文件页数:207页
- 主题词:JAVA语言-程序设计;自然语言处理
PDF下载
下载说明
Java自然语言处理PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 NLP简介1
1.1什么是NLP2
1.2为何使用NLP3
1.3 NLP的难点4
1.4 NLP工具汇总5
1.4.1 Apache OpenNLP6
1.4.2 Stanford NLP7
1.4.3 LingPipe9
1.4.4 GATE10
1.4.5 UIMA10
1.5文本处理概览10
1.5.1文本分词11
1.5.2文本断句12
1.5.3人物识别14
1.5.4词性判断16
1.5.5文本分类17
1.5.6关系提取18
1.5.7方法组合20
1.6理解NLP模型20
1.6.1明确目标20
1.6.2选择模型21
1.6.3构建、训练模型21
1.6.4验证模型22
1.6.5使用模型22
1.7准备数据22
1.8本章小结24
第2章 文本分词25
2.1理解文本分词25
2.2什么是分词26
2.3一些简单的Java分词器28
2.3.1使用Scanner类29
2.3.2使用split方法30
2.3.3使用B reakIterator类31
2.3.4使用Stream Tokenizer类32
2.3.5使用StringTokenizer类34
2.3.6使用Java核心分词法的性能考虑34
2.4 NLP分词器的API34
2.4.1使用OpenNLPTokenizer类分词器35
2.4.2使用Stanford分词器37
2.4.3训练分词器进行文本分词41
2.4.4分词器的比较44
2.5理解标准化处理45
2.5.1转换为小写字母45
2.5.2去除停用词46
2.5.3词干化49
2.5.4词形还原51
2.5.5使用流水线进行标准化处理54
2.6本章小结55
第3章 文本断句56
3.1 SBD方法56
3.2 SBD难在何处57
3.3理解LingPipe的HeuristicSen-tenceModel类的SBD规则59
3.4简单的Java SBD60
3.4.1使用正则表达式60
3.4.2使用BreakIterator类62
3.5使用NLP API63
3.5.1使用OpenNLP64
3.5.2使用Stanford API66
3.5.3使用LingPipe74
3.6训练文本断句模型78
3.6.1使用训练好的模型80
3.6.2使用SentenceDetector-Evaluator类评估模型81
3.7本章小结82
第4章 人物识别83
4.1 NER难在何处84
4.2 NER的方法84
4.2.1列表和正则表达式85
4.2.2统计分类器85
4.3使用正则表达式进行NER86
4.3.1使用Java的正则表达式来寻找实体86
4.3.2使用LingPipe的RegEx-Chunker类88
4.4使用NLP API89
4.4.1使用OpenNLP进行NER89
4.4.2使用Stanford API进行NER95
4.4.3使用LingPipe进行NER96
4.5训练模型100
4.6本章小结103
第5章 词性判断104
5.1词性标注104
5.1.1词性标注器的重要性107
5.1.2词性标注难在何处107
5.2使用NLP API109
5.2.1使用OpenNLP词性标注器110
5.2.2使用Stanford词性标注器118
5.2.3使用LingPipe词性标注器125
5.2.4 训练OpenNLP词性标注模型129
5.3本章小结131
第6章 文本分类132
6.1文本分类问题132
6.2情感分析介绍134
6.3文本分类技术135
6.4使用API进行文本分类136
6.4.1 OpenNLP的使用136
6.4.2 Stanford API的使用140
6.4.3使用LingPipe进行文本分类145
6.5本章小结152
第7章 关系提取153
7.1关系类型154
7.2理解解析树155
7.3关系提取的应用156
7.4关系提取159
7.5使用NLP API159
7.5.1 OpenNLP的使用159
7.5.2使用Stanford API162
7.5.3判断共指消解的实体166
7.6问答系统的关系提取168
7.6.1判断单词依赖关系169
7.6.2判断问题类型170
7.6.3搜索答案171
7.7本章小结173
第8章 方法组合174
8.1准备数据175
8.1.1使用Boilerpipe从HTML中提取文本175
8.1.2使用POI从Word文档中提取文本177
8.1.3使用PDFBox从PDF文档中提取文本181
8.2流水线182
8.2.1使用Stanford流水线182
8.2.2在Standford流水线中使用多核处理器187
8.3创建一个文本搜索的流水线188
8.4本章小结193