图书介绍
GPU精粹 2 高性能图形芯片和通用计算机编程技巧PDF|Epub|txt|kindle电子书版本网盘下载
![GPU精粹 2 高性能图形芯片和通用计算机编程技巧](https://www.shukui.net/cover/47/31777000.jpg)
- (美)Matt Pharr编著;龚敏敏翻译 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302139430
- 出版时间:2007
- 标注页数:565页
- 文件大小:90MB
- 文件页数:584页
- 主题词:
PDF下载
下载说明
GPU精粹 2 高性能图形芯片和通用计算机编程技巧PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 几何复杂性5
第1章 实现照片级真实感的虚拟植物5
1.1 场景管理6
1.1.1 种植栅格6
1.1.2 种植策略6
1.1.3 实时优化7
1.2 草层7
1.2.1 通过溶解模拟Alpha透明9
1.2.2 变化10
1.2.3 光照11
1.2.4 风12
1.3 地面杂物层12
1.4 树和灌木层13
1.5 阴影14
1.6 后处理15
1.6.1 天空圆顶辉散16
1.6.2 全场景辉光16
1.7 本章小结17
参考文献18
第2章 使用基于GPU几何体剪切图的地形渲染19
2.1 几何体剪切图简介19
2.2 GPU实现概览21
2.2.1 数据结构22
2.2.2 剪切图大小22
2.3 渲染23
2.3.1 活动层23
2.3.2 顶点和索引缓冲区23
2.3.3 视锥剪切24
2.3.4 DrawPrimitive调用25
2.3.5 顶点着色器25
2.3.6 像素着色器27
2.4 更新28
2.4.1 升采样28
2.4.2 残差29
2.4.3 法线图30
2.5 结果和讨论30
2.6 本章小结和改进31
2.6.1 顶点纹理31
2.6.2 去掉法线图31
2.6.3 不需要存储空间的地形合成31
参考文献31
第3章 几何体实例化的内幕33
3.1 为什么要对几何体实例化?34
3.2 定义34
3.2.1 几何体包34
3.2.2 实例属性35
3.2.3 几何体实例35
3.2.4 渲染和纹理场景35
3.2.5 几何体批次36
3.3 实现37
3.3.1 静态批次38
3.3.2 动态批次39
3.3.3 顶点常量实例化40
3.3.4 几何体实例API批次43
3.4 本章小结46
参考文献48
第4章 分段缓冲49
4.1 问题空间49
4.2 解决方案50
4.3 方法50
4.3.1 分段缓冲的第一步50
4.3.2 分段缓冲的第二步50
4.3.3 分段缓冲的第三步51
4.4 改进分段缓冲技术51
4.5 本章小结51
参考文献51
第5章 用多流来优化资源管理53
5.1 概览53
5.2 实现55
5.2.1 DirectX 9.0中的多流55
5.2.2 资源管理57
5.2.3 处理顶点59
5.3 本章小结63
参考文献63
第6章 让硬件遮挡查询发挥作用65
6.1 引言65
6.2 受益于遮挡查询的场景66
6.3 遮挡裁减66
6.4 层的停等方法67
6.4.1 为什么使用层67
6.4.2 层结构67
6.4.3 层的算法68
6.4.4 问题1:停滞68
6.4.5 问题2:查询的额外开销68
6.5 一致性层裁减69
6.5.1 想法1:猜测69
6.5.2 想法2:提升,提升70
6.5.3 算法70
6.5.4 实现细节71
6.5.5 停滞比较少的原因73
6.5.6 查询较少的原因73
6.5.7 如何遍历层73
6.6 优化74
6.6.1 用真正的几何体查询74
6.6.2 只有Z的渲染遍74
6.6.3 近似的可见性74
6.6.4 保守的可见性测试74
6.7 本章小结75
参考文献76
第7章 带有位移映射的细分表面自适应镶嵌77
7.1 细分表面77
7.1.1 一些定义78
7.1.2 Catmull-Clark细分78
7.1.3 用细分来镶嵌79
7.1.4 面片化表面80
7.1.5 GPU镶嵌算法80
7.1.6 致密镶嵌84
7.2 位移映射84
7.2.1 改变平滑度测试85
7.2.2 用法线映射着色85
7.3 本章小结86
参考文献86
第8章 使用距离函数的逐像素位移映射87
8.1 简介87
8.2 准备工作89
8.3 距离映射算法89
8.4 计算距离图92
8.5 着色器92
8.5.1 顶点着色器92
8.5.2 片段着色器92
8.5.3 关于过滤的注意事项94
8.6 结果94
8.7 本章小结95
参考文献96
第Ⅱ部分 着色、光照和阴影第9章 S.T.A.L.K.E.R.中的延期着色101
9.1 引言101
9.2 几种观点102
9.3 优化103
9.3.1 优化的对象103
9.3.2 光照优化104
9.3.3 G缓冲区建立的优化106
9.3.4 阴影优化108
9.4 改善质量109
9.4.1 “虚拟位置”的威力109
9.4.2 环境遮挡110
9.4.3 材质和表面光照的交互111
9.5 反走样111
9.5.1 高效的调和映射113
9.5.2 处理透明114
9.6 尝试过但没有包含入最终代码的内容114
9.6.1 高程图114
9.6.2 实时的全局照明115
9.7 本章小结115
参考文献116
第10章 动态辐照度环境映射实时计算117
10.1 辐照度(irradiance)环境映射117
10.2 球面调和卷积119
10.3 映射到GPU上120
10.3.1 空域到频域121
10.3.2 卷积和恢复122
10.4 以后的工作123
10.5 本章小结123
参考文献123
第11章 近似的双向纹理函数125
11.1 引言125
11.2 采集126
11.2.1 建立和采集126
11.2.2 汇集着色图127
11.3 渲染128
11.3.1 细节算法128
11.3.2 实时渲染129
11.4 结果130
11.5 本章小结132
参考文献132
第12章 基于贴面的纹理映射133
12.1 方法简介134
12.2 纹理贴面的构造135
12.3 纹理贴面打包135
12.4 纹理贴面映射137
12.5 mipmap问题138
12.6 本章小结140
参考文献140
第13章 在GPU上实现mental images的Phenomena渲染器141
13.1 引言141
13.2 着色器和Phenomena142
13.3 用Cg实现Phenomena143
13.3.1 Cg顶点程序和可变参数144
13.3.2 片段程序着色器的main()入口点145
13.3.3 通用着色器接口145
13.3.4 一个简单的着色器例子146
13.3.5 全局的状态变量148
13.3.6 光着色器149
13.3.7 纹理着色器151
13.3.8 凹凸映射152
13.3.9 环境着色器和体着色器153
13.3.10 返回结构体的着色器154
13.3.11 渲染毛发154
13.3.12 组合所有东西155
13.4 本章小结155
参考文献156
第14章 动态环境遮挡和间接光照157
14.1 表面元素158
14.2 环境遮挡158
14.2.1 多遍阴影算法160
14.2.2 改善性能160
14.3 间接光照和面光源162
14.4 本章小结164
参考文献164
第15章 蓝图渲染和草图绘制165
15.1 基本原理166
15.1.1 中间渲染结果166
15.1.2 边增强166
15.1.3 深度子图形渲染167
15.2 蓝图渲染167
15.2.1 深度剥离167
15.2.2 析取可见边和不可见边169
15.2.3 合成蓝图170
15.2.4 深度屏蔽171
15.2.5 使用蓝图渲染显示建筑171
15.3 草图渲染171
15.3.1 边和颜色面片172
15.3.2 应用不确定性172
15.3.3 调整深度173
15.3.4 草图渲染的变体173
15.3.5 控制不确定性174
15.3.6 减少雨景效果175
15.4 本章小结176
参考文献176
第16章 精确的大气散射179
16.1 引言179
16.2 解散射方程180
16.2.1 Rayleigh散射与Mie散射180
16.2.2 相位函数181
16.2.3 外向散射方程181
16.2.4 内向散射方程182
16.2.5 表面散射方程182
16.3 实时渲染182
16.4 挤入着色器中184
16.4.1 去除一个维度184
16.4.2 去除其他维度184
16.5 实现散射的着色器185
16.5.1 顶点着色器185
16.5.2 片段着色器187
16.6 增加高动态范围渲染188
16.7 本章小结188
参考文献189
第17章 利用像素着色器分支的高效模糊边缘阴影191
17.1 现有的阴影生成技术191
17.2 用单张阴影图产生模糊阴影192
17.2.1 模糊尖锐边缘阴影192
17.2.2 提高效率195
17.2.3 实现细节196
17.3 本章小结199
参考文献200
第18章 将顶点纹理位移用于水的真实感渲染201
18.1 水的模型202
18.2 实现202
18.2.1 水的表面模型202
18.2.2 实现细节203
18.2.3 对高度图采样203
18.2.4 质量的提高与优化204
18.2.5 渲染局部的扰动208
18.3 本章小结209
参考文献209
第19章 通用的折射模拟211
19.1 基本方法212
19.2 折射掩码213
19.3 示例215
19.3.1 水的模拟215
19.3.2 玻璃的模拟217
19.4 本章小结219
参考文献219
第Ⅲ部分 高质量渲染225
第20章 快速三阶纹理过滤225
20.1 高阶过滤225
20.2 快速递归三次卷积226
20.3 mipmapping230
20.4 导数重建232
20.5 本章小结235
参考文献236
第21章 高质量反走样的光栅化237
21.1 概述237
21.2 降采样239
21.2.1 与现有软硬件的对比239
21.2.2 用GPU进行降采样240
21.3 延伸240
21.4 过滤器的细节241
21.5 两遍分离式的过滤器242
21.6 分块和累加243
21.7 代码243
21.7.1 渲染循环244
21.7.2 降采样类245
21.7.3 实现细节246
21.8 本章小结246
参考文献247
第22章 快速的预过滤线条249
22.1 为什么尖锐的直线看起来很糟糕249
22.2 限制信号的带宽250
22.3 预处理252
22.4 运行时253
22.4.1 线段的建立(CPU)253
22.4.2 表查找(GPU)254
22.5 实现的问题256
22.5.1 绘制宽线256
22.5.2 组合多条线段256
22.6 示例256
22.7 本章小结258
参考文献258
第23章 Nalu Demo的头发动画和渲染261
23.1 头发的几何体262
23.1.1 布局和增长262
23.1.2 控制头发263
23.1.3 数据流263
23.1.4 镶嵌263
23.1.5 插值264
23.2 动力学和碰撞265
23.2.1 约束条件265
23.2.2 碰撞266
23.2.3 鳍266
23.3 头发的着色267
23.3.1 用于头发的实时反射模型268
23.3.2 头发中实时的体化阴影271
23.4 本章小结和未来的工作274
参考文献274
第24章 使用查找表加速颜色变换275
24.1 查找表的基础知识275
24.1.1 一维查找表275
24.1.2 三维查找表276
24.1.3 插值278
24.2 实现278
24.2.1 把查找表映射到GPU的策略278
24.2.2 Cg着色器278
24.2.3 系统集成280
24.2.4 把三维查找表扩展到用于高动态范围图像281
24.3 本章小结282
参考文献282
第25章 Apple Motion中的GPU图像处理285
25.1 设计285
25.1.1 喜爱的和厌恶的285
25.1.2 选择语言287
25.1.3 CPU向后支持287
25.2 实现288
25.2.1 GPU资源的限制288
25.2.2 被零除289
25.2.3 丢失的顶点分量289
25.2.4 双线过滤290
25.2.5 高精度存储294
25.3 调试294
25.4 本章小结295
参考文献296
第26章 实现改进的Perlin噪声297
26.1 随机但平滑297
26.2 存储与计算297
26.3 实现细节298
26.4 本章小结302
参考文献302
第27章 高级的高质量过滤303
27.1 在GPU上实现过滤303
27.1.1 访问图像样本303
27.1.2 卷积过滤304
27.2 数字图像的重采样307
27.2.1 背景知识307
27.2.2 反走样问题307
27.2.3 图像重建310
27.3 冲击过滤:锐化图像的方法312
27.4 过滤器的实现技巧314
27.5 高级应用314
27.5.1 时间变形314
27.5.2 运动模糊的消除314
27.5.3 自适应的纹理过滤315
27.6 本章小结315
参考文献315
第28章 Mipmap级的测量317
28.1 哪个mipmap层是可见的?318
28.2 GPU抢险队318
28.2.1 像素点计数318
28.2.2 引擎中的实际考虑321
28.2.3 扩展322
28.3 实验结果324
28.4 本章小结325
参考文献326
第Ⅳ部分 GPU的通用计算:初级读本第29章 流式体系结构和技术趋势331
29.1 技术趋势331
29.1.1 核心技术趋势331
29.1.2 后果332
29.2 高性能计算的关键334
29.2.1 高效计算的方法334
29.2.2 高效通信的方法335
29.2.3 与CPU对比335
29.3 流式计算336
29.3.1 流式编程模型336
29.3.2 构建一个流式处理器337
29.4 未来和挑战338
29.4.1 技术趋势338
29.4.2 功耗管理338
29.4.3 支持更高的可编程性和功能性339
29.4.4 来自CPU的GPU功能性(或反之亦然)339
参考文献339
第30章 GeForce 6系列GPU的体系结构341
30.1 GPU如何适合于整体计算系统342
30.2 整体系统体系结构342
30.2.1 图形操作的功能结构图343
30.2.2 非图形操作的功能结构图346
30.3 GPU特性347
30.3.1 固定函数特性348
30.3.2 着色器Model 3.0编程模型349
30.3.3 支持的数据存储格式353
30.4 性能354
30.5 达到最佳性能354
30.5.1 积极地使用z裁减355
30.5.2 加载数据时利用纹理数学355
30.5.3 使用片段程序的分支355
30.5.4 尽可能使用fp16作中间值355
30.6 本章小结356
第31章 把计算概念映射到GPU357
31.1 数据并行的重要性357
31.1.1 哪种类型的计算可以很好地映射到GPU357
31.1.2 示例:在栅格上模拟358
31.1.3 流通信:聚集与散布359
31.2 GPU计算资源清单359
31.3 CPU-GPU类比362
31.3.1 流:GPU纹理=CPU数组362
31.3.2 核:GPU片段程序=CPU“内循环”362
31.3.3 渲染到纹理=反馈362
31.3.4 几何体光栅化=计算的调用363
31.3.5 纹理坐标=计算的域363
31.3.6 顶点坐标=计算的范围363
31.3.7 缩减363
31.4 从类比到实现364
31.5 一个简单的例子366
31.6 本章小结368
参考文献368
第32章 尝试GPU计算369
32.1 选择快速算法369
32.1.1 局部性369
32.1.2 允许计算的准则370
32.1.3 考虑下载和读回371
32.2 了解浮点371
32.3 实现散列373
32.3.1 转换成聚集373
32.3.2 地址排序374
32.3.3 渲染点375
32.4 本章小结375
参考文献376
第33章 在GPU上实现高效的并行数据结构377
33.1 流式编程377
33.2 GPU存储器模型379
33.2.1 存储器体系结构379
33.2.2 GPU流类型380
33.2.3 GPU核的存储器访问381
33.3 基于GPU的数据结构382
33.3.1 多维数组382
33.3.2 结构体387
33.3.3 稀疏数据结构387
33.4 性能考虑391
33.4.1 依赖的纹理读取391
33.4.2 计算频度和程序特化391
33.4.3 Pbuffer Survival Guide392
33.5 本章小结393
参考文献393
第34章 GPU流程控制习惯用法395
34.1 流程控制的挑战395
34.2 基本的流程控制策略396
34.2.1 判定396
34.2.2 把分支向着流水线上端移动396
34.2.3 z裁减397
34.2.4 分支指令399
34.2.5 选择一种分支机制399
34.3 使用遮挡查询的数据依赖循环400
34.4 本章小结400
第35章 GPU程序优化401
35.1 数据并行计算401
35.1.1 指令级并行性401
35.1.2 数据级并行性403
35.2 计算频率404
35.2.1 循环内不变量的预计算405
35.2.2 用查找表进行预计算406
35.2.3 避免内循环分支407
35.2.4 swizzle操作407
35.3 评价和负载平衡408
35.4 本章小结409
参考文献410
第36章 用于GPGPU应用程序的流式缩减操作411
36.1 通过紧缩来过滤411
36.1.1 累加和扫描412
36.1.2 通过搜索/聚集来散布413
36.1.3 过滤性能415
36.2 动机:碰撞检测416
36.3 用于细分表面的过滤419
36.4 本章小结421
参考文献421
第Ⅴ部分 面向图像的计算425
第37章 GPU上的八叉树纹理425
37.1 一个GPU加速的层次结构:N3树426
37.1.1 定义426
37.1.2 实现427
37.2 应用1:在网格表面上色431
37.2.1 建立八叉树431
37.2.2 上色432
37.2.3 渲染432
37.2.4 把八叉树纹理转换成标准2D纹理434
37.3 应用2:表面模拟436
37.4 本章小结437
参考文献438
第38章 使用光栅化的高质量全局照明渲染439
38.1 通过光栅化的全局照明440
38.2 最终聚集简介441
38.2.1 两遍的方法441
38.2.2 最终聚集441
38.2.3 两遍方法的问题442
38.3 通过光栅化的最终聚集443
38.3.1 最终聚集光线的聚类443
38.3.2 光线投射作为多次平行投影445
38.4 实现细节446
38.4.1 初始化446
38.4.2 深度剥离446
38.4.3 采样447
38.4.4 性能447
38.5 GPU上的全局照明渲染器448
38.5.1 第一遍448
38.5.2 生成可见点数据448
38.5.3 第二遍448
38.5.4 其他解决方案449
38.6 本章小结451
参考文献451
第39章 使用逐步求精辐射度方法的全局照明453
39.1 辐射度的基础454
逐步求精454
39.2 GPU实现455
39.2.1 使用半球投影的可见性456
39.2.2 构成因子的计算458
39.2.3 选择下一个发射者459
39.3 渐进细分459
39.3.1 纹理四叉树459
39.3.2 四叉数细分460
39.4 性能460
39.5 本章小结460
参考文献461
第40章 GPU上的计算机视觉463
40.1 引言463
40.2 实现框架463
40.3 应用示例464
40.3.1 把一系列片段程序用于计算机视觉464
40.3.2 求和操作467
40.3.3 创建全景照片的方程组469
40.3.4 特征向量的计算471
40.4 并行计算机视觉处理473
40.5 本章小结474
参考文献474
第41章 延迟过滤:困难数据格式的渲染477
41.1 引言477
41.2 为什么要延迟478
41.3 延迟过滤算法479
41.4 为什么它可以工作481
41.5 本章小结:何时延迟481
参考文献482
第42章 保守光栅化485
42.1 问题定义486
42.2 两种保守算法487
42.2.1 剪切空间487
42.2.2 第一种算法488
42.2.3 第二种算法489
42.3 鲁棒性问题492
42.4 保守深度492
42.5 结果和本章小结493
参考文献494
第Ⅵ部分 模拟与数值算法497
第43章 蛋白质结构预测的GPU计算497
43.1 介绍497
43.2 Floyd-Warshall算法以及绑定距离的平滑498
43.3 GPU实现499
43.3.1 动态更新499
43.3.2 数据纹理的索引499
43.3.3 三角形划分500
43.3.4 向量化500
43.4 试验结果501
43.5 本章小结和工作展望502
参考文献502
第44章 用于解线性方程组的GPU框架505
44.1 概述505
44.2 表示506
44.2.1 “单浮点”表示506
44.2.2 向量506
44.2.3 矩阵507
44.3 运算509
44.3.1 向量运算509
44.3.2 向量缩减509
44.3.3 矩阵与向量的积510
44.3.4 把所有的组合起来511
44.3.5 共轭梯度求解器511
44.4 一个偏微分方程的例子512
44.5 本章小结515
参考文献516
第45章 GPU上的期权定价517
45.1 期权概述517
45.2 Black-Scholes模型518
45.3 Lattice模型521
45.3.1 二项模型521
45.3.2 欧式期权定价522
45.4 本章小结525
参考文献526
第46章 改进的GPU排序527
46.1 排序算法527
46.2 一种简单的方法528
46.3 快速排序529
46.3.1 实现奇偶合并排序529
46.4 使用所有的GPU资源531
46.5 本章小结535
参考文献536
第47章 复杂边界的流体模拟537
47.1 简介537
47.2 Lattice Boltzmann方法538
47.3 基于GPU的LBM539
47.3.1 算法介绍539
47.3.2 数据封装540
47.3.3 迁移541
47.4 基于GPU的边界处理541
47.4.1 基于GPU的体素化方法542
47.4.2 周期性边界543
47.4.3 流出边界544
47.4.4 障碍物边界544
47.5 可视化545
47.6 实验结果546
47.7 本章小结547
参考文献548
第48章 基于FFT的医学图像重建551
48.1 背景551
48.2 傅里叶变换552
48.2 FFT算法553
48.4 在GPU上的实现553
48.4.1 方法1:主要使用片段处理器555
48.4.2 方法2:使用顶点处理器、光栅器和片段处理器556
48.4.3 负载平衡558
48.4.4 基准测试结果558
48.5 医学成像中的FFT559
48.5.1 磁共振成像559
48.5.2 MRI结果560
48.5.3 超声波成像562
48.6 本章小结564
参考文献565