图书介绍
生物序列化表征模型的矩阵分解方法及其应用PDF|Epub|txt|kindle电子书版本网盘下载
- 余宏杰著 著
- 出版社: 合肥:中国科学技术大学出版社
- ISBN:9787312034541
- 出版时间:2014
- 标注页数:199页
- 文件大小:27MB
- 文件页数:208页
- 主题词:生物分析-序列-数据模型-生物信息论
PDF下载
下载说明
生物序列化表征模型的矩阵分解方法及其应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 绪论1
1.1 生物信息学海量数据的产生背景1
1.1.1 生物信息学简介1
1.1.2 两种基本的生物序列2
1.2 生物序列比对概述4
1.3 基于序列比对的系统发育树构建方法5
1.3.1 分子进化研究的基本方法5
1.3.2 构建系统进化树的详细步骤6
1.3.3 构建系统发育树需要注意的几个问题10
1.4 生物序列数值化表征模型的矩阵分解方法的研究背景11
1.4.1 序列图形化表征12
1.4.2 基因组序列数值化表征及应用13
1.4.3 蛋白质序列数值化表征及应用14
1.4.4 有关K-mer的算法概述15
1.5 本书的内容安排16
第2章 基于矩阵束联合对角化的DNA序列图形化表征及其应用19
2.1 DNA序列的图形化表征方法概述19
2.2 DNA序列的描述符20
2.2.1 相关的一些工作20
2.2.2 构建序列的邻接矩阵20
2.2.3 矩阵分解理论简介21
2.2.4 有关矩阵对角化的理论29
2.2.5 近似联合对角化(AJD)35
2.2.6 算法的保距性36
2.3 图形化表示法39
2.3.1 计算特征值组成的序列表征向量(EVV)40
2.3.2 AJD算法收敛性分析40
2.3.3 基于特征值组成的表征向量(EVV)的序列图形聚类41
2.4 相似度分析43
2.4.1 聚类分析基本原理43
2.4.2 计算成对距离59
2.4.3 11条β球蛋白基因的系统谱系分析59
2.4.4 与相关工作的比较60
2.5 本章结论62
第3章 基于SVD的基因组序列保序变换及其应用64
3.1 DNA序列数值描述符64
3.2 从基因组序列向数值向量的保序变换65
3.2.1 基因组序列变换矩阵的构建65
3.2.2 所提出的序列变换算法具有的良好性质67
3.2.3 保序变换-奇异值分解(OPT-SVD)算法的过程描述107
3.3 保序变换算法在基因组序列相似度/相异度分析中的应用108
3.4 本章结论113
第4章 基于保距映射算法的基因组序列Map示图及应用114
4.1 受PCA的启发尝试对基因组序列数值描述114
4.2 基因组序列的“保距”变换115
4.2.1 特征矩阵的构建115
4.2.2 基因组序列变换的特性115
4.3 基于保距变换算法的基因组序列的相似度分析118
4.3.1 第一个数据集上的实验结果118
4.3.2 另一个更大规模数据集上的实验结果124
4.4 本章结论127
第5章 基于NFV-AAA算法的蛋白质序列相似度分析128
5.1 基于K-mer的组分向量法背景概述128
5.2 基于氨基酸(AAA)分布的蛋白质序列描述符129
5.2.1 描述符的范式129
5.2.2 蛋白质序列转换成400 × (L-1)稀疏矩阵132
5.2.3 AAA优于SAA133
5.2.4 对特征矩阵M施行SVD以抽取序列的特征135
5.3 NFV在相似度分析中的应用136
5.3.1 九条ND5蛋白质序列的相似度分析136
5.3.2 在24条转铁蛋白序列的数据集上的应用141
5.4 本章结论143
第6章 分段K-mer算法及其在序列相似度分析中的应用144
6.1 K-mer分析法优劣性分析144
6.2 基因组序列的描述符145
6.3 s-K-mer在34条线粒体基因组序列数据集上的应用147
6.3.1 优化算法的数据准备147
6.3.2 对K-mer进行寻优以便获得其最优阶数K值148
6.3.3 s-K-mer算法的性能150
6.3.4 利用s-K-mer对基因组作系统发生分析153
6.4 本章结论154
第7章 基于层级虚拟混合与投影抽取的基因组序列比较155
7.1 有关FFP与ICA背景概述155
7.2 基因组序列特征提取模型160
7.2.1 基于K-mer虚拟混合器的基因组序列数据预处理160
7.2.2 虚拟混合与投影抽取模型162
7.2.3 层级的VMPE模型166
7.3 HVMPE模型在真实基因组数据集上的应用168
7.3.1 先行相关数据的准备168
7.3.2 确定虚拟混合器(VM)的最佳阶数K171
7.3.3 对HVMPE模型进行最佳段数s值的寻优171
7.3.4 层级的VMPE模型的效果分析172
7.3.5 基于HVMPE模型的基因组序列种系发生分析174
7.3.6 在另一个基因组数据集上的应用176
7.4 本章结论177
第8章 总结与展望179
8.1 本书的主要工作与创新点179
8.2 未来工作的设想181
8.2.1 NMF的基本原理182
8.2.2 序列分析中引入NMF算法的构想186
参考文献188