(1)显存,全称显示内存,暂时储存显示芯片要处理的数据和处理完毕的数据。图形核心的性能愈强,需要的显存也就越多。显存类型从原来的容量不大的SDR,发展到DDR、SDRAM、DDR3、DDR4等。从Pascal架构开始,NVIDIA已经开始提供HBM2类型的显存,最新针对专业计算的TeslaA100采用HBM2,显存容量可达40GB,为游戏设计的RTX
8080 Ti采用DDR6,显存容量也可达12GB。显存主要由传统的内存制造商提供,比如三星、现代、Kingston等。
(2)显存位宽,指一个时钟周期内能传输数据的位数(bit)。显存位宽位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。显存位宽越高,性能越好价格也就越高,因此512位宽的显存更多应用于高端显卡。
(3)显存频率指显存在显卡上工作时的频率,以MHz(兆赫兹)为单位。显存频率一定程度上反应着该显存存取的速度。显存频率随着显存的类型、性能的不同而不同,DDR、SDRAM显存则能提供较高的显存频率,因此是采用最为广泛的显存类型。近年来,GPU显存频率已经从百级提升到万级,GTX1080Ti的显存频率已经高达10000MHz。
(4)显存带宽,指显示芯片与显存之间的数据传输速率,单位是字节/秒。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽=显存频率×显存位宽/8。显存带宽是决定显卡性能和速度最重要的因素之一。
(5)制作工艺,指的是晶体管与晶体管之间的距离,单位是纳米。制作工艺越小说明集成度越高,功耗越小,性能越好。目前NVIDIA最先进的Tesla采用7nm制程,GTX1080
Ti采用16nm制程。
(6)像素填充速率,指GPU一秒钟内能处理多少个像素,单位是GPixel/S(每秒十亿像素),或MPixel/S(每秒百万像素)。像素填充速率是较好衡量GPU图像显示功能的整体指标,说明了显卡能以多快的速度对图像进行光栅化处理。显卡的硬件指标对其速度具有直接影响。
(7)纹理填充率,指对多边形图像进行纹理贴图、实现3D效果的速度,和像素填充率类似,单位是GTexels/S或MTexels/S。游戏采用了多纹理贴图的方式,使画面具有更好的光影效果。像素填充率和纹理填充率反映的是GPU的性能,而显存带宽则体现了显存的性能。
(8)功率,集显依靠CPU的主板连接提供电源,但独显性能较强,需要单独接电源。如RTX 3080 Ti功率为750w。
(9)总线接口,显示卡要插在主板上才能与主板互相交换数据,现在主流接口为PCLe(PCI-Express)。接口提供数据流量带宽,目前主流采用PCLe4.0版本,16个通道。
(10)Directx支持,简称DX,是一种应用程序接口(API)。DX由微软编写,由很多的API组成,包括显示、声音、输入和网络。DirectX
11还支持高质量实时渲染和预渲染场景,目前DX已发展到Directx 12版本,提高了多线程效率,可以充分发挥多线程硬件的潜力。
(11)CUDA Core和Tensor Core,为GPU提供计算能力的硬件单元。CUDA core也叫Streaming
Processor(SP),是单精度,组成SM的重要部分。Tensor Core已发展到第三代,Tensor
Core大幅减少了深度学习需要的时间。Core的数量越多,并行运算的线程越大,计算的峰值越高。
参考资料:【研报】电子行业深度报告:GPU研究框架-210306(108页).pdf【精选】2021年电子行业GPU研究框架分析报告(107页).pdf
大规模分布式 GPU 图嵌入在腾讯的实践之路.pdf
景嘉微-军转民前“景”广阔GPU“芯”辰大海-210827(29页).pdf
脑研究之利器:基于 NVIDIA GPU 的全脑尺度直接可视化方法.pdf
铂科新材-双碳助力公司发展GPU等新应用构建二次成长曲线-21112(32页).pdf
科技行业先锋系列报告240:英伟达2022 CES发布4款GPU产品Omniverse提供免费版本-20220106(45页).pdf
计算机行业专题研究:GPU计算机图显核心计算场景应用崛起-211110(33页).pdf