荔园在线

荔园之美,在春之萌芽,在夏之绽放,在秋之收获,在冬之沉淀

[回到开始] [上一篇][下一篇]


发信人: MarchRain (为了爱,梦一生~追梦人), 信区: Hardware
标  题: Rambus显存技术的利弊分析报告
发信站: BBS 荔园晨风站 (Wed Sep  6 01:31:52 2000), 转信

    在过去的几年里,图形处理器也就是我们经常说的GPU 一直以输出最好的图形效果
为宗旨,经过了多次特定的高度优化设计,与此同时,他们还必须处理范围更广泛
的普通应用程序和图形计算。目前市场上的CPU的发展也非常迅速,频率更快,并
且增加了许多特定的多媒体指令。当然,这些设计也将图形卡应用程序考虑在内的
,标准的CPU仍然不能在频率和效率上与有特定功用的图形处理器相媲美。因此,
如果需要更好的图形性能的话,图形处理器必须承载更多的工作量,以减轻CPU的
负担。

  但是,更高的性能并不是我们唯一需要的东西,从CPU到图形处理器的过程中
我们可以发掘更多的东西。在大部分的图形应用程序中,与图形相关的运算都占用
了CPU大部分的工作量。如果去掉这些运算的话,CPU有更多的时间来进行其他方面
的运算。其中还包括了物理,人工智能,系统冲突监测等方面。同时,如果图形运
算在系统硬件中进行的话,他们只需要通过象Direct3D或者OpenGL一样的应用接口
在处理数据的时候就可以达到很高的水平。这不仅节约了开发商的时间,同时对于
读写和优化代码也有一定的作用,开发商就可以将更多的精力放在游戏的设计上。


  今天的技术革新包括在绘制任何的3D画面时进行的转换,剪辑和光亮运算。运
算的数目需要分三步进行,均匀的分布在画面多边形出现的区域。当今的图形处理
器不仅要在速度上比现存的CPU更快,同时还要在功能上得到增强。这样一来,在
3D画面中才能包含更多的多边形,出现的画面才能更加逼真。

  内存带宽的限制

  随着GPU的出现,现在的图形处理器已经集成了转换,剪辑和光亮运算等多种功能,
在速度上已经超过了现有的CPU,而CPU的工作量也被分担了不少,他们可以节约出
时间进行其他方面的运算。虽然GPU减轻了CPU在运算方面的负担,但是在原始需求
和内存带宽需求方面的运算还是饱和的,最终显卡本身仍将面临同样的带宽局限的
问题。

  内存带宽瓶颈主要出现在显卡驱动的填充率达到最大和保持最大的画面刷新率
时。存在的瓶颈在GPU内部是不会处理数据的,但是要从显卡内存将数据传到GPU处
,然后再返回显卡。这大大影响了显卡的整体性能。

  内存带宽与画面填充率是紧密联系的,目前是影响3D图形加速最重要的因素。
实际上大部分的GPU由于受内存带宽的限制都不能达到画面填充率的顶峰。填充率
的定义实际上就是画面效果的解决方案,发挥深度复杂和画面刷新率等方面的功能
。普通的深度复杂性表现的是画面上能访问到的象素,而不管绘制的象素的多少。


  寄希望更高的刷新率和更好的画面效果,就需要更高的填充率,色深仅仅影响
所需的带宽以达到更令人满意的画面效果。在高分辨率和画面刷新率下,系统的性
能会降低到难以接受的水平。将数据读写到Z缓冲时也会大量利用到内存带宽。在
绘制多边形的每个象素时,不管它是否隐藏在另一个多边形的背后,它的深度位置
都可以在同样的位置上被检测出来。检查的过程也将大量的利用运算强烈的内存,
每个象素都会被访问无数次。这将大量的消耗现有的内存带宽,每个多边形中的所
有象素都会被检测一遍。再一次,这会将显卡的性能降低到无法接受的程度。

  增加内存带宽

  显卡制造商们都发现了人们对内存带宽越来越大的需求,他们开发了三种著名
的人们普遍接受的方法来增加内存带宽。

[1] 加倍数据总线的宽度

  通过在同样的时间间隔内增加更多的数据来限制数据传输。不过这种运算只能
在点之间进行,甚至会导致更多的问题出现。将这些针印刷到电路板上会增加产品
的造价,加大尺寸,在增加复杂性的同时降低了产品的最后性能。

[2] 加倍时钟频率

  通过增加时钟频率可以在同样的时间间隔中传输更多的数据。但是它也只能通
过点来工作,在时钟频率增加了以后要想用标准的印刷电路板技术和标准的制造工
艺来保证可靠的传输速度就比较困难。同时,在增加时钟频率的时候也会增加产品
的成本,降低性能。

  在时钟升降的边缘写数据,这可以有效的增加内寸带宽,结果和加倍时钟频率
一样。但是,所有以上提高的局限性都在这里得到了应用,将它们综合在一起就可
以得到可靠的传输速度。于是目前市场上的显卡都会采用一种或者多种以上的方法
来满足内存带宽的需要。

  显卡集成的 SDRAM 通常指的是Single Date Rate, SDR,他们依靠执行命令在
时钟上升降的边缘传输数据。显卡安装了DDR SDRAM以后,可以在这两种情况下将
数据传到内存。DDR SDRAM大约出现在一年以前,减轻了内存带宽的负担。

  计算内存带宽

  目前出现的大部分高性能的显卡使用的都是16到64 MB的内存,运行在128位的
数据总线上。现在让我们来看看对于SDR和DDR而言,使用的是何种内存带宽。如果
我们只是理论上的将带宽相比而不将内存的延迟时间考虑在内的话,结果如下所示


  如果我们使用的显卡为32 MB的SDR SDRAM,操作的外频为166 MHz, 我们计算的
内存带宽如下:

128-bit (16 bytes) x 166 MHz = 16 x 166 = 2.67 GB/s

  同样的显卡,现在利用的是32 MB的DDR SDRAM, 操作的外频为166 MHz,计算的
内存带宽如下:

128-bit (16 bytes) x 333 MHz = 16 x 333 = 5.33 GB/s

  毫无疑问,DDR SRAM很容易就将内存带宽增加了一倍,如果加倍了时钟频率对
系统会产生同样的影响。从理论上讲,QDR SDRAM, Quad Data Rate,同样是可行的
,但是对于要运行承载很重的调速,信号和水准测量方面而言仍然是比较困难的。
QDR SDRAM的内存带宽应用到以上的例子中后,得到的内存带宽将是现有SDR的四倍
,DDR的两倍。

  在真正的基准测试中这些数字都会影响系统的性能。这些从理论上得到的数字
都没有考虑内存的延迟时间,因此实际情况是不同的。但是这些理想化的数字还是
可以说明显卡增强的功能。

  值得一提的是,我们通常假定显卡在达到最大的画面填充率的情况下进行测试
。但是不得不说,完整的内存带款在任何时候都是有效的。既然内存带宽已经用在
了画面缓冲,纹理缓冲和Z缓冲方面,显卡将不能支持这样的画面填充率。

--
           __....__
      .-~~/  \__/  \~~-.
     /_/``\__/  \__/``\_\.--.
    /  \__/  \__/  \__/  \   o`.
`==/\__/__\__/__\__/__\__/\`'--'
   ~/__/__/^^^^^^^^\__\__\~

※ 来源:·BBS 荔园晨风站 bbs.szu.edu.cn·[FROM: 192.168.28.99]


[回到开始] [上一篇][下一篇]

荔园在线首页 友情链接:深圳大学 深大招生 荔园晨风BBS S-Term软件 网络书店