图书介绍
术语学与术语信息处理PDF|Epub|txt|kindle电子书版本网盘下载
- 张榕著 著
- 出版社: 北京:中国社会科学出版社
- ISBN:9787516160916
- 出版时间:2015
- 标注页数:192页
- 文件大小:73MB
- 文件页数:200页
- 主题词:术语学-研究
PDF下载
下载说明
术语学与术语信息处理PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第一章 引论1
第一节 本研究提出的背景1
一 术语定义自动抽取的必要性1
二 术语定义的聚类的意义6
三 术语识别的意义7
第二节 国内外研究现状7
一 术语定义抽取的研究现状7
二 句子聚类的国内外研究9
三 术语识别的研究现状11
第三节 术语学介绍15
一 什么是术语学15
二 术语学的发展简介16
三 术语学的主要流派16
四 我国的术语学研究17
五 术语数据库19
六 术语概念的唯一性与术语定义的多样性22
七 术语与普通词语25
八 术语的跨语言借用30
九 新术语与旧术语在定义出现概率上的区别35
十 术语的语缀36
十一 一些基本概念39
第四节 术语与术语定义的界定42
一 术语的界定42
二 术语定义的界定47
第二章 术语定义的抽取研究51
第一节 候选术语定义的规则匹配51
一 文本下载51
二 文本的预处理52
三 文本的分词53
四 候选术语定义的模板匹配54
第二节 基于统计方法的术语定义抽取62
一 词语的定义隶属度63
二 句子的定义隶属度67
三 句子的定义隶属度实验结果67
第三节 向量空间距离计算69
一 向量空间模型介绍69
二 向量空间模型的引用71
三 向量空间模型实验结果示例72
第四节 隶属度计算和向量空间模型的结合74
第五节 术语定义抽取系统结构与实验结果75
第六节 实验结果评价77
一 网络文本结构的多样性因素77
二 语言表达形式的多样性因素80
三 分词的因素82
四 网络文本的可靠性因素83
五 搜索引擎准确率的因素84
六 算法的因素84
第七节 术语定义形式的多样性85
一 传统意义上的定义形式85
二 下定义的要求86
三 术语定义形式的多样性89
第八节 本章小结91
第三章 术语定义的聚类研究93
第一节 术语定义聚类的必要性93
第二节 聚类综述96
一 聚类与聚类分析96
二 分类与聚类97
三 硬聚类和软聚类97
四 层级聚类与非层级聚类98
第三节 本研究采用的聚类方法99
一 聚类步骤99
二 相似度的界定和属性的选取99
三 《知网》介绍100
第四节 术语定义的领域聚类107
一 句子相似度计算107
二 词语的相似度计算108
三 术语定义领域聚类的停用词表的建立112
四 聚类特征的选取112
第五节 术语定义聚类的结果及分析115
一 领域聚类的判定复杂性115
二 聚类相似度阈值的设定116
三 《知网》知识库在领域聚类中的优点与局限性116
四 聚类结果的错误分析119
第四章 术语自动识别研究122
第一节 术语缺乏位置信息122
第二节 术语的抽取124
一 术语的语言学特征124
二 术语的粗抽取124
三 术语边界的确定126
四 术语的词性过滤129
五 术语词性序列的统计133
第三节 候选术语的统计特征136
一 术语的用词长度特征136
二 候选术语的长度与词频计算139
三 候选术语的最后得分141
第四节 过滤词表的构建143
一 术语识别过滤词表构建的必要性143
二 过滤词表的构建145
第五节 术语识别系统结构与实验结果145
第六节 实验结果分析146
一 定义匹配模板的局限性146
二 句子定义隶属度过低147
三 其他情况148
第七节 本章小结149
第五章 结束语150
附录156
附录一 《人民日报》用词与术语定义用词对比156
附录二 词语的定义隶属度162
附录三 术语定义抽取的分步骤结果示例164
附录四 术语的词性序列168
附录五 术语抽取结果169
附录六 术语定义聚类的部分结果171
附录七 术语定义聚类程序示例179
参考文献184
致谢192