图书介绍

语音合成PDF|Epub|txt|kindle电子书版本网盘下载

（美）Jan P.H.van Santen等编；蔡莲红，杨鸿武，吴志勇等译著
出版社：北京：机械工业出版社
ISBN：7111155297
出版时间：2005
标注页数：404页
文件大小：30MB
文件页数：425页
主题词：语音合成－研究－进展

PDF下载

点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示：（请使用BT下载软件FDM进行下载）软件下载地址页直链下载[便捷但速度慢] [在线试读本书] [在线获取解压码]

点击复制MD5值：0f79eeb4f6f9588aa56dd64375978827

下载说明

语音合成PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

点击复制85GB完整离线版磁力链接到迅雷FDM等BT下载工具进行下载详情点击-查看共享计划

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台）。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用！后期资源热门了。安装了迅雷也可以迅雷进行下载！

（文件页数要大于标注页数，上中下等多册电子书除外）

注意：本站所有压缩包均有解压码： 点击下载压缩包解压工具

图书目录

第一部分信号处理和声源建模1

第1章简介：TTS中声门声源建模新方法1

1.1 声门声源建模简介1

目录1

1.2 替换单脉冲激励2

1.3 本部分指南2

1.4 小结3

参考文献3

第2章声门音位变体的合成4

2.1 引言4

2.2 实验数据5

2.3.1 材料6

2.3 合成实验6

2.3.2 模型8

2.3.3 方法8

2.4 各个源参数对声门化的贡献12

2.5 讨论14

2.6 小结15

参考文献16

第3章带有激励源参数动态控制的语音合成17

3.1 引言17

3.2 激励源模型17

3.2.1 周期性激励17

3.2.3 LF模型18

3.2.2 非周期性激励18

3.3 分析过程19

3.4 分析结果21

3.4.1 语音材料21

3.4.2 元音21

3.4.3 元音边界23

3.5 小结23

参考文献23

第4章合成中语音信号非周期成分的修改25

4.1 引言25

4.2 语音信号分解26

4.3 非周期成分的分析和合成29

4.4 评价31

4.5 语音修改32

4.5.1 时间缩放33

4.5.2 频谱修改33

4.5.3 非周期成分脉冲的修改33

4.5.4 周期／非周期信号比例的修改33

4.6 讨论和结论34

参考文献34

第5章文语转换中利用正弦模型的语音合成36

5.1 引言36

5.2 正弦模型概述37

5.4 正弦合成38

5.5.1 谐波正弦模型38

5.3 正弦分析38

5.5.2 系统幅度和相位39

5.5.3 激励幅度和相位40

5.6 简化正弦模型的参数41

5.7 基频和时长修改41

5.7.2 激励贡献42

5.8 分析和再合成实验42

5.7.1 系统贡献42

5.9 结论44

参考文献44

第二部分语言学分析46

第6章简介：TTS合成系统中的文本分析46

参考文献47

第7章语言无关面向数据的字音转换48

7.1 引言48

7.2 系统设计49

7.2.1 对准49

7.2.2 IG树：压缩和分类构造50

7.3 相关方法53

7.4.1 连接54

7.4.2 基于知识的语言学方法54

7.4 性能评价54

7.5 结论55

参考文献56

第8章语音合成中的全韵律结构57

8.1 引言57

8.2 系统结构58

8.2.1 分析部分58

8.2.2 语音解释部分1：时间的解释60

8.2.3 语音解释部分2：参量解释61

8.2.4 参数的产生与合成63

8.3 多音节词63

8.3.1 双音节64

8.3.2 元音削弱和语音韵律65

8.4 连续语音67

8.5 总结68

参考文献69

第9章一种非音段音位结构的定时模型71

9.1 引言71

9.2.1 参数化解释的原理72

9.2.2 结构化的音位表示72

9.2 音节联接及其在YorkTalk中的语音解释72

9.3 节律描述及建模73

9.4 YorkTalk与自然语音及其他合成系统的比较76

9.5 结束语77

参考文献77

第10章一个完整的意大利语文语转换系统的语言分析80

10.1 引言80

10.2 形态分析81

10.2.1 问题的定义81

10.2.2 有关词典82

10.2.3 形态分析器84

10.3 语音转换85

10.3.1 问题的定义85

10.3.2 自动重音分配86

10.3.3 开元音和闭元音86

10.4 形态-语法分析87

10.4.1 预分析器87

10.3.4 浊辅音和清辅音87

10.4.2 形态-句法分析器88

10.4.3 语法解析器89

10.5 性能评价90

10.6 结束语91

参考文献91

11.1 引言93

11.2 记叙文研究93

第11章记叙文中重音的语篇结构限制93

11.2.1 分析94

11.2.2 结果94

11.3 基于语篇的重音功能解释95

11.3.1 注意状态的建模96

11.4 重音的语篇功能98

11.4.1 局部焦点的处理：代词98

11.3.2 记叙文的语篇分析98

11.4.2 全局焦点的处理：显式形式100

11.5.1 旧信息和新信息101

11.5.2 主题划分101

11.5 讨论101

11.5.3 相对重要性102

11.6 结束语103

参考文献103

11.5.4 小结103

12.1 引言106

12.2 已有的方法106

第12章文语转换中的同形异音字消歧106

12.3 算法107

12.4 歧义类的决策列表113

12.4.1 类模型：创建113

12.4.3 类模型：结合先验概率114

12.4.4 罗马数字114

12.4.2 类模型：使用114

12.5 评价115

12.6 讨论和结论116

参考文献117

第三部分发音器官合成与可视语音119

第13章简介：语音合成中“讲话的头”119

参考文献121

第14章简介：发音器官合成与可视语音122

参考文献124

第15章语音模型与语音合成126

15.1 主题和一些例子126

15.2 十五年的语调合成127

15.3 时间模型135

15.4 结束语139

参考文献139

第16章基于伪发音器官参数合成语音片段的框架145

16.1 引言145

16.2 控制参数和映射关系146

16.3 利用HL参数合成的例子147

16.4 合成规则149

参考文献151

17.1 引言152

17.2 发音器官合成152

第17章基于生物机械学和病理生理学的语音建模152

17.3 一个有限元舌头模型153

17.3.1 为软组织建模153

17.3.2 舌头模型研究概要154

17.4 控制器156

17.5 结论159

参考文献159

18.1 引言161

18.2 参数模型161

第18章会说话人脸的分析——合成与可懂度161

18.3 视频分析162

18.4 实时分析-合成163

18.5 模型的可懂度164

18.5.1 刺激数据的准备164

18.5.2 整体可懂度165

18.5.3 辅音混淆度166

18.5.4 元音混淆度167

18.6 视频分析168

参考文献169

19.1 引言170

19.2 2D嘴唇模型170

第19章可视语音合成中的3D嘴唇与下腭模型170

19.3 3D嘴唇模型172

19.4 嘴唇模型的动画174

19.5 下腭模型175

19.6 嘴唇和下腭模型的动画176

19.7 嘴唇和下腭模型的评价176

19.8 结论177

参考文献177

第四部分拼接式语音合成与自动切分179

第20章简介：拼接式语音合成179

第21章德语拼接式语音合成中的混合基元结构181

21.1 引言181

21.2.1 实验材料182

21.2.2 浊音清化现象182

21.2 自然语音概述182

21.2.3 同化现象183

21.2.4 音节边界位置183

21.2.5 元音前后的辅音184

21.2.6 结论184

21.3.1 拼接方法185

21.3.2 基元结构185

21.3 基元结构与拼接规则185

21.3.3 基元定义186

21.3.4 拼接规则186

21.4 感知评估187

21.4.1 配对比较实验188

21.4.2 音段可懂度测试190

21.5 小结191

参考文献192

第22章拼接式语音合成中的韵律及基元选取194

22.1 引言194

22.2 切分及韵律标注195

22.3.1 语音类别及音段样本196

22.3.2 确定语音基元196

22.3 语音数据库基元定义196

22.3.3 数据库裁减198

22.4 基于韵律的语音基元选取198

22.5 实验及评估分析200

22.5.1 实验1：使用全部数据库进行测试200

22.5.2 实验2：使用裁剪后的数据库进行测试202

22.6 讨论202

22.7 结论203

参考文献204

23.1 引言206

23.2 未优化的双音子集合206

第23章双音子的优化拼接206

23.3 不匹配度度量方法207

23.3.1 简单帧不匹配度207

23.3.2 考虑帧以及回归系数的不匹配度209

23.3.3 基于帧窗口线性拟合的不匹配度211

23.4 实验评估212

23.4.1 总体考虑212

23.3.4 给定时长的最小不匹配度212

23.4.2 感知实验213

23.5 结论214

参考文献214

第24章应用于拼接基元选取的自动语音切分216

24.1 引言216

24.2 自动标注算法216

24.2.1 音位结构学模型216

24.2.2 时长模型217

24.2.3 音素声学模型217

24.2.4 切分算法217

24.2.5 训练算法218

24.3 切分实验218

24.4 结论220

参考文献221

第25章 Aligner：使用Markov模型进行文语对齐222

25.1 引言222

25.2 Aligner的操作224

25.2.1 产生语音序列224

25.2.2 文语对齐225

25.3 评估实验225

25.4 讨论和结论228

参考文献229

第五部分自然语音的韵律分析230

第26章简介：韵律分析：一条双重途径？230

第27章简介：自然语音的韵律分析232

28.2 自动提取F0控制规则的算法234

28.1 引言234

28.2.1 规则提取过程概述234

第28章利用统计分析自动提取F0控制规则234

28.2.2 F0包络分解235

28.3 F0控制规则提取实验237

28.3.1 语音数据及参数提取条件237

28.2.3 统计规则提取237

28.3.2 用以建模的语言学参数238

28.3.3 F0控制规则解释239

28.4 小结241

参考文献243

第29章语音合成中音高包络规格化方法的比较研究245

29.1 引言245

29.2 基于音调感知的自动规格化方法246

29.2.1 理论基础246

29.2.2 音调感知和韵律分析247

29.2.3 算法描述248

29.2.4 讨论250

29.3 手工直线规格化方法251

29.4 感知和直线规格化方法的比较252

29.4.1 两种方法的差异252

29.4.2 感知实验253

29.5 结论255

参考文献255

第30章 z-Score模型中的停顿生成257

30.1 引言257

30.2.2 周期的吸引者259

30.2.1 关于每个音节一个参照点的争论259

30.2.3 感知中心的声学互相关性259

30.2 节奏和感知中心259

30.4 Barbosa-Bailly模型260

30.3 Campbell模型260

30.4.1 IPCG时长预测260

30.2.4 感知中心在感知调整上的重要性260

30.4.2 语料262

30.4.3 在重新分配算法中加入停顿现象263

30.4.4 自动学习264

30.5 感知测验265

30.6 小结266

参考文献266

31.1 引言270

31.2 数据库270

第31章贝尔实验室里文语转换系统的时长研究270

31.3 时长模型274

31.3.1 元音275

31.3.2 摩擦音276

31.3.3 爆发和送气276

31.3.4 结尾部分277

31.3.5 时长估计277

31.4 讨论278

31.4.1 补偿效应278

31.4.2 句尾效应的缺失279

31.5 小结280

参考文献281

第32章德语语调曲线的合成283

32.1 引言283

32.2 语调模型284

32.3 参数估计286

32.4 基于规则的F0合成287

32.5 感知实验288

32.6 小结291

参考文献292

33.1 引言294

33.2 语音素材294

第33章说话风格对基频包络参数影响的研究294

33.3 基频包络参数分析295

33.3.1 提取基频包络参数295

33.3.2 不同风格间的F0参数比较296

33.4 说话风格转换298

33.4.1 转换到其他说话风格的转换规则298

33.4.2 转换语音的评价实验299

33.4.3 评价测试结果299

33.5 小结301

参考文献302

34.1 引言303

第34章简介：文本与韵律303

34.2 控制TTS系统中的韵律303

第六部分韵律合成303

34.3 TTS中语音风格的控制304

34.4 抽象语音结构和语音事实304

参考文献305

35.1 引言306

35.2 使用自下而上的分析建立音位表现306

第35章简介：语调的语音表现306

35.4 语音表现和认知功能307

35.5 韵律原型307

35.3 使用自上而下的分析建立语音模型307

35.6 结论308

参考文献309

第36章瑞典语语调生成的词典语法信息计算提取311

36.1 引言311

36.2 瑞典语韵律结构313

36.2.1 韵律词313

36.2.2 韵律短语314

36.2.3 韵律话语315

36.2.4 末位延长与静音间隔315

36.3 韵律结构组件的设计316

36.4 性能319

36.5 技术数据319

36.6 小结320

参考文献320

第37章用TTS符号输入进行的韵律变量参数控制322

37.1 KIM-Kiel声调模型322

37.1.1 概述322

37.1.2 重音322

37.1.3 语调323

37.1.4 参数的语音控制324

37.1.5 模型的语言学环境326

37.2 韵律范畴的符号表示327

37.2.1 模型的符号输入327

37.2.2 德语RULSYS/INFOVOX TTS系统参数控制的符号输入328

37.3 韵律建模、韵律标注与合成的开发系统329

参考文献333

38.2 一套语调域理论334

38.1 引言334

38.2.1 语调域和韵律层级334

第38章语音合成中的韵律和语调域334

38.2.2 相关域336

38.2.3 AD重构336

38.2.4 AD重构的约束337

38.3.1 实验假设338

5.5 一般模型的简化338

38.3 重构语调域：一个实验338

38.3.2 实验所用语料339

38.3.3 实验方法340

38.3.4 实验结果341

38.4 讨论342

38.4.1 效果估量342

38.4.2 语调域理论的推论342

38.4.3 语音合成的推论343

38.5 结论343

参考文献343

第39章说话风格：使用文语转换系统进行统计分析和合成345

39.1 引言345

39.2 语料345

39.3.2 共振峰频率特性346

39.3 不同说话风格的谱特性346

39.3.1 分析方法346

39.3.3 频谱倾斜特性347

39.4 不同说话风格的韵律特性347

39.4.1 基频特性347

39.4.2 音段时长的特征349

39.5 在文语转换系统中变换说话风格的一个策略350

39.5.1 不同说话风格的规则350

39.5.2 本文的TTS系统351

39.5.3 听辨评测352

39.6 结论353

参考文献353

第七部分评价与感知353

40.1 语音技术与标准355

第40章简介：内部评价还是外部评测355

40.2 为什么要在内部评价系统？356

40.3 怎样从外部评测系统？356

40.4 关于人所处的地位357

参考文献358

第41章评估TTS系统的结构化方法359

41.1 问卷359

41.1.1 问卷结果359

41.1.2 数据库361

41.1.3 参考书目361

41.2 评价语音产生系统的结构化方法361

41.2.1 系统详述362

41.2.2 测试详述362

41.2.3 举例363

参考文献364

第42章评价用于合成名称的TTS系统365

42.1 引言365

42.2 名称的字音转换366

42.2.1 系统概述367

42.2.2 字音转换的客观评价368

42.3 字音转换的感知评价369

42.3.1 测试设计369

42.3.2 结果370

42.4 小结371

参考文献372

第43章合成语音的感知373

43.1 引言373

43.2 合成语音的可懂度374

43.3 合成语音的理解376

43.4 感知编码技术379

43.5 语音感知中的一些认知因素381

43.6 一些新的研究方向382

参考文献383

第八部分系统与应用387

第44章简介：应用的简单历史387

参考文献388

第45章多语种文语转换的模块化结构389

45.1 引言389

45.2 系统结构389

45.2.1 NewTTS的英语版389

45.2.2 模块之间的通信390

45.2.3 模块结构的优点391

45.3 在其他语言中的应用392

45.4 声音文件393

参考文献393

46.2 语音输出技术395

46.2.1 回放预录语音395

第46章实际应用中消息到高质量语音的产生395

46.1 引言395

46.2.2 文语转换396

46.2.3 韵律问题396

46.2.4 韵律短语的拼接397

46.2.5 韵律后处理398

46.3 单词拼接和PSOLA398

46.3.1 Appeal系统398

46.3.2 Appeal系统中的语音399

46.3.3 专注的韵律399

46.3.4 举例400

46.3.5 一些评论401

46.4 讨论与结论401

参考文献404