nVIDIA SDK白皮书－－Vertex Texture Fetch Water(上）

GEMINIGHT	📋注册(Register) \| 📛登录(Login)
🎲

主站(Home) » 论坛(Forum) » 程序编写(Program)

GEMINIGHT

自称：发贴器2号

等级：发贴器
帖子数：5409
积分：9932
阅读权限：99

nVIDIA SDK白皮书－－Vertex Texture Fetch Water(上）

1楼

Tags: nVIDIA

Tags引力关联贴

• 绚丽的体验!GeForce 8800 技术 Demo×3下载
• NVIDIA发布Tegra4核心掌上安卓游戏机
• 最新 NVIDIA Scene Graph Software Development Kit (NVSG SDK)
• 不同NVIDIA的GPU支持的
• NVIDIA驱动泄漏《战争机器》PC版?
• 最新 NVIDIA Scene Graph Software Development Kit (NVSG SDK)
• Photoshop插件 NVIDIA Normal Map Filter
• 《Unreal Engine 4》教学视频
• Google搜索开放源代码
• 向军Linux视频教程

Vertex Texture Fetch Water
作者：Jeremy Zelsnack
翻译：clayman
Blog：http://blog.csdn.net/soilwork
clayman_joe@yahoo.com.cn

\N
\N

水面模拟
水面模拟的目标是在合理的计算量下，创造视觉上真是可信的水面。其中可能的方法之一是基于流体力学中的Navier-Stokes方程求解。这种方法可以创建极度真是的水面，不幸的是，计算量太过沉重。一种较为简单，同时资源消耗较少的方法是在一张均匀网格上解2D波方程。牺牲一点点真实性换取实现的简洁和速度。本文描述了2D波方程技术。

上面的就是2D波方程。这个方程表示点将在Y方向上上下起伏。C表示波传播的速度。直观的说，这个方程表示点上下起伏的加速度，和表面起伏改变的快慢是成正比的。
看到这里，你可能会问，“如何来求解这样一个方程呢？”GPU并不知道偏导数是什么；只知道空间位置而已。如果我们把方程左边对t进行两次积分，就得到了y值。如果继续把计算出的y值与点x和z的值组合到一起，就得到了3D坐标，这就是GPU所能理解的了。

接下来的难题就是如何对方程的右边进行积分。有许多种积分的技术可以使用，每种都有其优点和缺点。对我的程序来说，需要的是稳定性和速度。稳定性是相当重要的，因为公正的说，这个方程太过于呆板。方程右边的C2将使左边的值迅速增大。因此，不能使用类似欧拉的简单积分方法――它们不太稳定。Runge－Kutta方法也是不行的，因为它需要计算中间值，同时，还对储存速率有很高要求。这对于我们的程序来说太复杂，太耗费资源。Verlet积分计算量很轻，同时也很稳定，对储存速率也没有要求。不幸的是我忘记了Verlet方程（-_-# 汗~~），并且在30秒内都没有找到任何关于Verlet方程的参考资料（=。=）。因此，我重新发明了一种类似于Vertet的方法。
如果我们知道了点在t=0时刻的位置P（t0），以及t=1时刻的位置P(t1)，加速度a(t1)，那么使用方程3，只需要一些高中的物理知识，就可以求解t=2时刻的位置P(t2)。这里的推导假设采样步长是常数，因此，t1-t0 = t2 – t1 = t(n+1) – tn。当然，也可以步长值也可以为非常量，但这就需要更多的数学计算。

方程3和真正的Verlet积分（方程4）相当类似。唯一的不同，就是在加速度系数上有区别。

好了，方程3描述了一种计算积分的方法。但是有一个问题，它并不像看起来那么稳定，而是抖动的（jittery）。我们需要做一些额外的处理，来消耗由于不精确的积分而带来的额外能量。可以添加一个常量因子来减小通过推测而得来的速率。

好了，现在我们有了积分的技术，几乎可以对2D波方程的右边进行积分了。现在来看看如何计算方程右边的偏导数。方法之一，就是找一个和我们所要模拟的顶点相称的表面。有了这个表面，我们就能分析推测偏导数的计算公式。
那么什么样的表面才和要模拟的网格类似呢？我们需要一个快速，简单同时能在一定程度上保持精确的模型。3次样条曲线集合正好能满足我们的要求。可以对问题进行简化，变为对两个2D三次样条曲线的问题。这样就推导出了公式6。对一个三次方程来说，需要指定4个常数。其中，3个显而易见的常数就是当前以及邻近顶点的坐标。第四个常量则是当前顶点位置下的导数。图一描述了这种情况。假设切线和邻近的顶点是平行的，同时，网格也是均匀的，则可以得到一个2阶偏导数方程（公式7）。使用偏导数，右边的2D波公式就变为了方程8。

好了，现在我们简单分析了计算方程右边的算法，以及积分方法，可以实际计算网格中顶点的y值了。由于我们假设网格中的所有顶点之间的距离都为1个单位（在世界坐标中不一定合适），因此需要调整波的速度，让他看起来正常。
好了，现在可以使用简单的迭带来求解波形方程，我们让GPU来完成这个任务吧。我们把均匀网格的高度保存为一张纹理。同时，还需要追踪上一张高度图的值。这样就可以计算下一张高度图的值了。下面是使用HLSL求解波形方程的代码：

顶点纹理将保存为16bit的浮点纹理。使用8bit的整数是不可行的，16bit的整数虽然可以满足精度的要求，但无论如何浮点数都是最好以及最方便的选择。示例的程序中，我们把高度和法线混合起来，保存为一张D3DFMT_A16B16G16R16的纹理。这样做，可以减少vertex shader中纹理拾取的次数。
好了，现在有一张用来模拟水面的高度图了，如何来使用它呢？Shader Model 3.0 支持在vertex shader中进行纹理拾取（在VS 3.0中）。为了渲染水面，我们把包含了有效顶点位置的网格mesh传入到vertex shader中。顶点纹理拾取能有效的帮助我们把纹理转换为几何体。更多信息请参考（ftp://download.nvidia.com/developer/Papers/2004/Vertex_Textures/Vertex_Textures.pdf）
需要注意的是，GeForce 6系列的硬件在vertex shader中并不支持D3DFMT_A16B16G16R16的格式。这就需要把fp16的波形方程结果转换为fp32格式。你可能会问，问什么开始不直接把波形方程的结果保存为fp32格式呢？答案是fp2的纹理渲染起来很慢，此外，fp32的渲染目标不支持混合或者纹理过滤。由于fp32缺乏混合机制，将导致水面控制更加复杂。而缺乏过滤，则会降低渲染质量。

好了，有了模拟水面的方法，接下来看看如何控制它。幸运的是，使用Verlet积分对此进行控制。Verlet积分本身就表示了高度偏移的速率。在GeForce 6系列的硬件上，高度偏移值将直接渲染为fp16格式的高度纹理。这是最自然也是最高效的方法。但是在Geforce 6系列之前的硬件上，这却是不可行的，应为缺乏对fp16 alpha混合的支持。没有混合，就不得不把高度偏移值渲染为额外的非fp16渲染目标中，之后，再把这张偏移值纹理渲染到高度图之上。这是很麻烦的方法，同时精度也不高。
再进一步来看看这个方法的性能如何，水面模拟到底有多快。虽然看起来有很多操作。幸运的是，这对GPU来说并算不了什么。你基本上只是在一个简单的pixel shader中渲染了一张小渲染目标（比如128x128）。凭感觉来说，这对现代GPU算不了什么。作为一个稍微“科学”的基准来看，在GeForce 6800GT的显卡上，关闭了水面模拟之后，帧速率从263fps变为了268fps。这表示我们的模拟只需要0.07毫秒，这并不算长。与实际的模型相比，顶点纹理拾取的性能才是瓶颈。
～～～～～～～～～～～～～～～～～～～·未完待续·～～～～～～～～～～～～～～～～～～～～～～～～

SIGNATURE

🗓2006-5-25 00:14（约19年前） 👁778