rtx3080ti评测(RTX 3080 ti性能如何)

2021-11-19 14:03:25   编辑:国贝彪
导读大家好,小天来为大家解答以上问题。rtx3080ti评测,rtx3080ti性能怎么样很多人还不知道,现在让我们一起来看看吧!解答:1、Rtx3080ti是

大家好,小天来为大家解答以上问题。rtx3080ti评测,rtx3080ti性能怎么样很多人还不知道,现在让我们一起来看看吧!

解答:

1、Rtx3080ti是很多朋友关注的性能显卡。作为一款顶级性能显卡,rtx3080ti的配置属性也非常顶级,将为您带来rtx3080ti在各种运行环境下的实际性能评测。相信很多朋友都会对它感兴趣。让我们来看看。

2、GeForce RTX 3080的原价为5499元,目前已经被炒到了1.5万元左右,价格也翻了三倍。

3、不久前,NVIDIA在官方博客中再次宣布,未来即将推出的RTX 30系列显卡,除了RTX 3090之外,都将在芯片层面被限制开矿,包括之前已经推出的RTX 3060/3060 Ti/3070/3080以及未来即将推出的显卡。

4、GeForce RTX 3080 Ti

5、GeForce RTX 3080 Ti细节特写。

6、关于这次发布的GeForce RTX 3080 Ti显卡,我想大家主要关注的是这几点,首先是价格和性能,其次是供货数量,是否可以购买。由于显示卡都限制了哈希率,也就是在Ethereum挖矿,所以会减少矿工的涌入。在6月1日的台北电脑展新闻发布会上,宣布售价8999元,但目前国内还没有,只能期待一波非公版显卡。不同厂家会按照公版定价加价,但起步价肯定是比较低的,所以我们不妨抢一波。

7、01 GA102核心的第三张牌。

8、让我们来看看建筑的变化。官方白皮书中的对比对象是GeForce RTX 2080 Ti。与上一代NVIDIA Turing架构相比,NVIDIA Ampere架构下的GeForce RTX 3080 Ti每个时钟执行两次着色器操作,而Turing为一次。RTX 3080 Ti的着色器性能达到34 TFLOPS单精度性能,而图灵为14 TFLOPS。

9、图灵下的RTX 2080 Ti,第一代英伟达RTX架构。

10、安培下的RTX 3080 Ti,第二代NVIDIA RTX架构。

11、NVIDIA Ampere架构将光线和三角形的交叉吞吐量提高了一倍,RT Core达到67 RT TFLOPS,Turing达到43 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能的提升,对于游戏中有运动模糊的场景,光线追踪计算的加速也是如此。

12、第三代张量核心可以自动识别和消除不重要的DNN权重。处理稀疏网络的速度是图灵的两倍,计算能力高达273 Tensor TFLOPS,而图灵是114 Tensor TFLOPS。

13、GeForce RTX 3080 Ti依旧采用GA102内核,与GeForce RTX 3080/3090相同。我们来看看RTX 3080 Ti在GA102上做了哪些改变。

14、完成GA102核心。

15、一个完整的GA102 GPU由7个GPC(图形处理集群)、42个TPC(纹理处理集群)和84个SM(流处理器)组成,而RTX 3080 Ti的CUDA数为10240,因此可以推断RTX 3080 Ti屏蔽了两套TPC,因此只有80个SM单元,而一个完整的GA102内核的CUDA数应该是10752。

16、为了方便查询,笔者列出了这些显卡的核心参数,可以看到RTX 3080 Ti和RTX 3090的核心参数非常接近。两个SM单元,也就是一个TPC和256 CUDA的区别,在实际应用中其实并不是很大。最重要的是,RTX 3090比RTX 3080 Ti多了12GB的视频内存。与RTX 3080相比,有了很大的提升。

17、有些用户可能会问,既然和RTX 3090差距这么小,这张卡的定位是什么?个人觉得RTX 3080 Ti更适合游戏玩家。其实大部分游戏都不能用24GB显存,8K除外。

18、渲染8K素材占用17GB视频内存。

19、但是在专业的渲染软件中,渲染8K或者4K材质的视频内存占用率非常高,可以达到17GB甚至更高,对于只有12GB视频内存的RTX 3080 Ti来说是不够的。大家一定都知道视频内存爆棚的危害,会导致游戏或软件崩溃,从而失去进程。

20、02分析NVIDIA安培架构GA102。

21、GeForce RTX 3080 Ti采用GA102内核,拥有280亿(28000万)晶体管,面积628平方毫米。它基于三星8nm NVIDIA定制工艺和Micron提供的GDDR6X内存。

22、这次NVIDIA Ampere的SM在图灵的基础上,将FP32运算单元增加了一倍,使得每个SM的FP32运算单元数量增加了一倍,吞吐量增加了一倍。

23、一般我们在计算显卡的CUDA数的时候,不会统计SM中的所有单位,只会统计FP32的单位数。因此,SM中的[FP32 : INT32]从1:1变为233601。

24、GeForce RTX 3080 Ti总共有10240台CUDA,但实际上它有5120台INT32,但里面的FP32数量却翻了一番。

25、而这样粗暴的提升CUDA数量对于游戏其实有着非常大的帮助,通常在游戏中浮点运算相比整数计算要常用的多,图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令,而FP32的加速也有助于光线追踪降噪着色器。

26、在去年与GeForce RTX 30系显卡一同发布的还有一项新技术——RTX IO。目前很多游戏动辄几十G甚至百G的安装空间,对于存储空间的负担暂且不提,但存放在硬盘中的数据,如果显卡想要读取到,需要先由CPU从硬盘中读取压缩过的数据,经过解压缩再发送到显存中。

27、虽然随着NVMe SSD的推出,读取速度相较机械硬盘能够快20倍,但受制于传统I/O限制,NVMe高达7GB/秒的高速读写对于CPU是极大的负担。

28、传统的数据交换

29、在这个过程中,会占用多个CPU核心,压力急剧增大,占用较多的内存,而此时其实GPU是处于闲置状态的。RTX IO的作用就是越过CPU解压再传输数据这一步,直接从PCIE总线读取硬盘上经过压缩的数据,并且完成无损GPU解压,降低CPU占用,变向提升了性能。

30、RTX IO可以极大解放CPU负担

31、当然这项技术作为系统底层的运行方式改变,还需要借助微软发布的DirectStorage来实现,对于目前容量的游戏来说,RTX IO的改善效果有限,但假以时日等游戏容量上百G成为常态的时候,这项技术将会发挥巨大的功效。

32、同时搭配新增的HDMI 2.1接口,可以支持单线8K的视频输出,而上一代HDMI 2.0仅支持4K 98Hz的视频输出,如果想要连接8K电视,则需要更多的线缆支持。

33、03 GeForce RTX 3080 Ti外观

34、首先还是来看一下外观,在外包装上相比之前的公版没有变化,不过GeForce RTX 3080 Ti这款显卡本身相比GeForce RTX 3080在细节上还是有不少变化的。

35、GeForce RTX 3080 Ti

36、GeForce RTX 3080 Ti配件盒展示

37、外包装依旧是礼盒形式的,收藏感满满,在拿出显卡后下方是转接线和说明书的配件盒,因为此次公版仍采用单12pin的供电插槽,所以需要转换成双8pin的接口才能使用。

38、GeForce RTX 3080 Ti 正面

39、拿出显卡后我们先来看一下正面(由于公版轴流式设计,两侧均有风扇,我们以插入机箱后的方向来区分反正面),相比GeForce RTX 3080的设计整体基本无改动,不过边框部分的内角从哑光改为了镜面,这种略带跳跃的视觉效果相比之前的设计更好看。

40、GeForce RTX 3080 Ti 内角的金属光泽

41、GeForce RTX 3080 Ti上机后灯光效果

42、另外在这次GeForce RTX 3080 Ti中出了显卡侧面的GeForce RTX的logo灯,在正面还增加了一个“X”的灯光效果,不过由于是显卡自内而外发出的灯效,所以并不明显,需要在较暗的环境下才能看出。

43、GeForce RTX 3080 Ti背面

44、GeForce RTX 3080 Ti边框部位NVIDIA logo

45、显卡背面部分(虽然这看起来更像正面),基本没有改动,边框配色为淡淡的玫瑰金,包括极细微的NVIDIA logo。

46、GeForce RTX 3080 Ti 单12pin供电接口

47、在GeForce RTX 3080 Ti显卡的侧面,可以看到单12pin的供电接口,从整体来看它比较靠近中间部位,但我们都知道公版卡采用了高度紧凑的PCB板,长度也小于一般尺寸,所以其实供电接口已经位于板子的尾部,没有往右挪的空间了。根据NVIDIA官方说明,GeForce RTX 3080 Ti的单卡功耗为350W,下面我们也会详细测试。

48、GeForce RTX 3080 Ti视频接口

49、GeForce RTX 3080 Ti的挡板部位颜色也和GeForce RTX 3080不同,后者采用了与散热鳍片相同的黑色,而在新版的GeForce RTX 3080 Ti中也改为了正常的金属色,未作特殊处理。接口方面的配置依旧为DP 1.4*3+HDMI 2.1*1的4接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。

50、散热系统示意

51、另外如果是第一次了解公版显卡的朋友们,这里再给大家说一下挡板部位这个奇怪的“栅栏”的用处,由于公版卡采用了双轴流式设计,正面及背面均有散热风扇,正面风扇为主动吸入冷空气为GPU降温,挡板部位则是排出热空气的“出风口”,而背面的风扇则是向上排出显卡内热空气的作用。

52、04 3DMARK 理论性能测试

53、首先介绍一下测试平台,为了保证此次评测能够发挥GeForce RTX 3080 Ti显卡的最佳性能,主板和CPU采用了目前桌面旗舰级配置,具体如下。

54、在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。

55、GPU-Z参数

56、首先看一下GPU-Z的参数,GeForce RTX 3080 Ti采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10240个CUDA,1665MHz频率。采用12GB GDDR6X显存,位宽为384bit,显存带宽达到了912.4 GB/s,光栅单元和纹理单元为112和320。

57、下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:

58、3D MARK FS套装测试

59、在针对显卡DX11性能的3DMARK FS套装测试中,我们选择了上代和本代的4张显卡进行分值对比,以便能更好的反应GeForce RTX 3080 Ti的性能水平。

60、可以看到GeForce RTX 3080 Ti的性能基本与GeForce RTX 3090相同,差距微乎其微。另外对比GeForce RTX 3080则提高了不少,整体差距在11%左右。而对比上一代旗舰GeForce RTX 2080 Ti整体提升约为40%。

61、3D MARK TS套装测试

62、而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 3080 Ti的分数与GeForce RTX 3090的分数差距则要大一些,达到4%左右。而对比GeForce RTX 3080的分数要高出7%左右;对比上一代GeForce RTX 2080 Ti的分数要高出43%左右。

63、3D MARK 光追测试

64、PortRoyal是3DMARK中专门针对光追性能的测试项,在这组测试中GeForce RTX 3080 Ti的表现依旧紧咬GeForce RTX 3090,分数差距不超过1%;对比GeForce RTX 3080的分数提升约为11%;对比上一代GeForce RTX 2080 Ti的分数提升则非常大,约为60%。

65、05 游戏性能测试

66、在游戏性能测试中,我们选择了《德军总部新血脉》、《孤岛惊魂5》、《刺客信条:英灵殿》、《无主之地》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。

67、另外在游戏测试中,由于显卡驱动的版本更新和游戏更新非常影响游戏帧数,所有benchmark跑分成绩均以本次成绩为准。

68、《刺客信条:英灵殿》游戏测试

69、在游戏实测中我们更印证了前面的说法,GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分数相同,仅有1-2帧的差距。而GeForce RTX 3080的分数差距在1080P和2K分辨率下也并不大,主要是4K分辨率会有10%左右的差距。

70、《德军总部新血脉》游戏测试

71、《德军总部新血脉》并且由于自带两个benchmark,所以我们的数据取跑分均值,另外这款游戏几乎每更新一次驱动或者游戏版本升级都会导致分数的巨大差异,在本次重新测试中,GeForce RTX 3080 Ti与GeForce RTX 3090的差距依旧微乎其微,而相比GeForce RTX 3080的提升约为4%左右。

72、《孤岛惊魂5》游戏测试

73、《孤岛惊魂5》同样算是优化比较到位的3A大作,GeForce RTX 3080 Ti均能达到100帧以上的流畅运行标准,其中4K分辨率下的成绩要领先GeForce RTX 3080 15%左右。

74、《无主之地3》游戏测试

75、《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,在1080P分辨率下GeForce RTX 3080 Ti能够跑到147帧,而在4K分辨率下打了对折仅有70帧。

76、《光明记忆:无限》游戏测试

77、《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,目前还没有游戏提供试玩,不过benchmark的跑分软件官方已经提供,玩家可以在steam上自行下载。另外我们在测试的时候由于无法关闭光追选项,故所有测试成绩均为“RTX 最高/DLSS 质量”模式下进行。在这款游戏的benchmark中出现了惊人的分数一致情况,虽然多测试几遍肯定会有所不同,但在整体趋同的情况下意义不大。

78、《边境》游戏测试

79、在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。

80、06 功耗及温度测试

81、功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。

82、功耗测试(点击查看大图)

83、GeForce RTX 3080 Ti经过我们的实测在满载状态下单卡功耗为350W左右,作为目前整体性能与GeForce RTX 3090相仿的情况下,建议搭配750W电源。

84、温度方面,本次的GeForce RTX 3080 Ti经过10分钟左右的拷机,温度稳定为75℃左右,与GeForce RTX 3080基本相同,并且频率稳定无降频情况。

85、07 部分游戏光追及DLSS效果展示

86、上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。

87、《赛博朋克2077》RTX ON

88、《赛博朋克2077》RTX OFF

89、在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。

90、RTX ON

91、RTX OFF

92、在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。

93、《堡垒之夜》RTX ON

94、《堡垒之夜》RTX OFF

95、堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。

96、《魔兽世界9.0》RTX ON

97、《魔兽世界9.0》RTX OFF

98、《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。

99、《控制》RTX ON

100、《控制》RTX OFF

101、《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。

102、《赛博朋克2077》DLSS模式对比

103、DLSS的对比测试我们选择《赛博朋克2077》这款游戏,2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。

104、《逆水寒》DLSS模式对比

105、画质说明

106、在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。

107、首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。

108、08 软硬兼施 铸就Ampere

109、好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。

110、NVIDIA Reflex

111、以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?

112、NVIDIA Reflex

113、在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。

114、以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。

115、NVIDIA Broadcast

116、NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。

117、宠物派对直播

118、这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。

119、NVENC编码

120、同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。

121、NVIDIA Studio

122、对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。

123、NVIDIA Studio

124、NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。

125、以GPU渲染为14.98秒 而CPU渲染为11分钟

126、当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。

127、09 GeForce RTX 3090的替代品?

128、通篇看下来相信大家都会觉得,GeForce RTX 3080 Ti和GeForce RTX 3090太像了,简直是一个模子刻出来的,两者最大的差距则是12GB的显存,不禁让人猜测NVIDIA推出这张卡的目的到底是什么?难道是老黄失手,刀法不再精湛了?

129、GeForce RTX 3080 Ti

130、这里我们还是先来看一下外观,本次的GeForce RTX 3080 Ti公版整体与GeForce RTX 3080相同,但在细节之处有所改进,如正面“X”形的灯光、边框的材质和颜色,有了3080首发的经验,这张卡整体来看更加精致。

131、在性能参数上,RTX 3080 Ti的Boost频率为1665MHz,是RTX 30系显卡首发中最低的,要知道RTX 3090的Boost频率都达到了1695MHz,不知道这是否是NVIDIA官方有意为之,通过我们的测试来看,大部分成绩只要频率再提升一点,极有可能超越RTX 3090,我们在后续的非公版显卡测试中也会留意这一点。

132、GeForce RTX 3080 Ti

133、在游戏方面,玩家更是无需担心,比RTX 3080更强的堆砌必然在游戏体验上更好,另外增加的2GB显存,在4K分辨率线下得到了彻底的发挥。

134、最后就是关于这张卡的定位,笔者认为NVIDIA推出两张如此相似的卡,还是有其原因的。其实最早有过关于RTX 3080 20G版本的传闻,但这张RTX 3080 Ti的发布无疑击破了流言。而从跑分表现来看,RTX 3080 Ti直逼RTX 3090,这是在以往任何一代产品都不曾出现的。

135、GeForce RTX 3080 Ti

136、两者最大的差距就是12GB的显存,对于游戏用户来讲24GB确实有些浪费了,而对于生产力工具来说,在4K/8K素材渲染时,往往能占用12GB甚至更多,爆显存对于软件渲染来说是非常致命的,轻则报错无法渲染,重则软件崩溃进程丢失。所以这两款显卡在细分领域来说还是有所区别,RTX 3080 Ti更注重游戏。

本文到此结束,希望对大家有所帮助。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章