RTX 5090 D和RTX 5080是同期开售的,不外它们的解禁时候不那么一样。前段时候咱们还是评测了RTX 5090 D,今天咱们就来看一看次旗舰GeForce RTX 5080。特殊值得一提的是,此次RTX 5080是有Founders Edition的——NVIDIA自家的设想向来自成一片,本次RTX 50系更因其合适SFF-Ready(适用于SFF小尺寸)圭臬的超薄设想而惹人注目。讲真,我致使认为不少爱重者会平直因为Founders Edition的这个尺寸跳过性能展示部分平直下单了,不外这倒不是不写评测到街上放烟花的意义。因此,接下来就让咱们充满深嗜心,好好地看一下这张显卡内与外。

规格表





硬件架构知道
这里的架构知道主如果涵盖RTX 50系GPU的硬件方面,如果思要阅读包括神经汇注渲染、RTX Mega Geometry等工夫的详备架构知道,请阅读RTX 5090 D的评测:《iGame GeForce RTX 5090 D Advanced评测:散热稳压大中枢,DLSS 4旷古绝伦》
Blackwell GB203中枢:RTX 5080出场即满血
和上一代序列一样,轮到RTX 5080的即是GB203中枢了。无缺的GB203中枢共领有456亿晶体管。前边在RTX 5090 D评测还是说过,在Blackwell这一代上,照旧GPC-TPC-SM层级设想。GB203共领有7 GPC,42 TPC,84 SM,10752个CUDA中枢——我思这里你能看出一丝别离:何如TPC是42个?是的,天然现时咱们还莫得无缺的中枢架构图,但是用简便的乘除法就知说念,GB203上每组GPC照旧和前代一样包含6组TPC。不外有一个好音尘是,此次RTX 5080出场即满血,这点跟它的前辈不一样。
在GPC段,可见它包含的TPC从Ada Lovelace的6组扩张到了8组。不外布局上照旧一样的,一个孤苦的光栅引擎,两个ROP分区(每个包含8个ROP单位),而每组TPC包含两组SM。

到达SM段,这里的变化是比较大的。领先,现时悉数的32个CUDA中枢都能施行FP32/INT32运算了,因此INT32的算力可以说是加多了一倍。不外在一个时钟周期里面,中枢只可二选一运算,要不FP32,要不INT32。NVIDIA暗示这种设想是为神经汇注着色器优化的。Tensor Core和RT Core天然也有升级,不外让咱们先说完新的显存。

GDDR7显存:带宽高能耗低
RTX 40系上的GDDR6X是NVIDIA和好意思光妥协打造的,因此你就只可在NVIDIA的居品上看到GDDR6X,而且部件号无一例外全是D8BZC,别无二家了属于是。在RTX 50系列这一代上,NVIDIA是和圭臬制定者JEDEC固态工夫协会妥协,推出了全新的GDDR7显存。

NVIDIA暗示,GDDR7显存弃取了PAM3调制,这能让它在信噪譬如面有所进步,通说念的密度也加多了。性能方面,GDDR7能带来更高的带宽,同期比GDDR6X/GDDR6要节能得多。
第5代Tensor Core:新增FP4救济
第5代Tensor Core接纳了上一代架构的特点,并新增了FP4、FP6的救济,还把FP8 Transformer Engine更新到了第二代。
FP4救济明显是环球比较热心的。NVIDIA对此的诠释注解是,跟着生成式AI模子智力的进步,老例的FP16模子对硬件特殊是显存的条目日积月累,在单张显卡上开动这些模子会变得特殊繁重。而FP4模子需要的显存更小,在TensorRT模子优化器(Model Optimizer)的救济下还能作念到险些莫得质地亏欠,对于通盘RTX 50系列来说是很友好的,毕竟不是每张卡都有RTX 5090 D那么大显存。

为什么要强调单张卡也可以开动呢?这其实跟游戏也关联系,在咱们之前的报说念里说过,NVIDIA一直在捣饱读NVIDIA ACE这个AI NPC工夫,再加上别的基于AI的游戏工夫也要用到Tensor Core,因此提高模子的开动成果很有必要。
第4代RT Core:为RTX Mega Geometry准备
在第4代RT Core上头咱们仍然能见到一些练习的组件,比如Box Intersection Engine和Opacity Micromap Engine这两个加快引擎,它们差异针对BVH树遍历和透明物体进行加快。而新增的组件包括Triangle Cluster Intersection Engine和Triangle Cluster Compression Engine,以及Linear Swept Spheres。

AI-Management Processor和着色器施行重排序2.0
AI-Management Process(AMP)在架构图上和GigaThread Engine并排,可见它亦然个调遣器。AMP的骨子是一个位于管线前端的RISC-V处理器,它救济Windows硬件加快GPU考虑,能够更解放地料理GPU。
AMP一样跟AI游戏关联。这里举个例子,土产货开动LLM的话,它们初度反映的时候一般是比较慢的,这放在常识库聊天机器东说念主里还好,环球可能都习尚了,但是对于游戏来说,这即是另一种情景了:试思一下你大开游戏加载归档,刚思找npc接个任务,限定npc憋了半天才冒出一句“你好”,这照实很破碎游戏体验。

而在AMP的救济下,CUDA、RT Core和Tensor Core三大部分可以妥协职责。如图所示,AMP提高了LLM的优先级,令其更早启动,作念到在游戏中实时反映,并同期让游戏引擎、DLSS 4保合手雄厚的帧率输出。

在Ada Lovelace上的着色器施行重排序(SER)主如果针对晴朗跟踪而设想的。通过对晴朗跟踪任务的动态重排序,该功能可充分提高硬件使用率。而Blackwell上的SER 2.0还可以将神经汇注的负载平直发送至Tensor Core处理,加快神经汇注渲染。NVIDIA暗示,Blackwell上的SER重排序逻辑成果达到了前代的2倍,逼迫支拨之余还能提高精确度。

DLSS 4:多帧生成还有模子升级
咱们终于说到DLSS 4了!说真话DLSS 3引入的帧生胜利能还是挺让我闲逸的了,而DLSS 4则是更进一步,带来了多帧生胜利能。这个我思应该无须过多诠释注解,即是渲染1帧最高生成3帧。另外,我在最近的Editor's Day上问过NVIDIA对于多帧生成极限的问题,他们暗示这AI模子是可以生成更多帧的,但是3帧是一个比较合理的值,因为DLSS 4是多个AI模子沿途职责的,是以工程师在设想时不只单要磋议帧生成的问题,再说了,生成3帧带来的进步还是实足强力了。

接下来咱们就一一拆分DLSS 4的各项组件,望望它们有什么更新,又是怎样协同职责。
领先是环球都关注的帧生成,NVIDIA Blackwell的帧生成模子比上一代快了40%,同期显存占用逼迫30%。同期,用于提供光流场信息的不再是RTX 40系列上的光流加快器,而是一个更高效的AI模子。

不外如斯一来新的问题就产生了:在Ada Lovelace上,DLSS 3是渲染一帧生成新的一帧,即是帧1,1.1,2,2.1...这种,把控每帧的输出限定照旧比较容易的,因为生成的帧1.1总在渲染的帧1后头,如果来不足输出帧1.1,那就把它丢掉,平直输出帧2就好。而RTX 40系上的DLSS 4是1,1.1,1.2,1.3,2,2.1,2.2,2.3,3...,中间整整隔了生成的3帧,何如不让输出限定乱套即是新的问题。为此,Blackwell引入了硬件级Flip Metering(这个名词照实很难姿首,直译是翻转测量),这个组件将帧平滑逻辑从CPU飘浮到GPU的泄露引擎上,让GPU更精确地掌控泄露每一帧的节律,逼迫帧与帧之间的时候波动。开启后NVIDIA暗示,Blackwell的泄露引擎赢得了两倍像素处明智力,这样就可以救济高分辨率、高刷新率下的Flip Metering。

由于DLSS 4多帧生成需要用到第5代Tensor Core的刚烈算力去盘算推算光流场和生成多帧,因此这个功能现时是Blackwell独占的。
然后比较让东说念主惊喜的是,超分辨率、晴朗重建、DLAA也赢得了更新,它们的模子从CNN换成了Transformer,一个弃取自耀目力机制的神经汇注,适用于从RTX 20-50的全线RTX GPU。不外我思在这里诠释CNN和Transformer两个神经汇注有什么区别完全会喧宾夺主,光是编码器妥协码器就够喝一壶的了。因此只需要知说念新的模子能够提高画面的雄厚性,进步光照细节,赐与动态物体更多细节即可。大伙可以鄙人面的DLSS 4测试中特殊直不雅地看到这两个模子的画面别离。

NVENC和NVDEC新增Y′CbCr 4:2:2救济
现时好多录像机都救济录制4:2:2体式的视频,这是有原因的:4:2:2比拟起4:4:4更精真金不怕火储存空间,但是比起4:2:0能保存更多的时势,这样一来就给后期调色留住了充足的空间。Blackwell此次新增了4:2:2的编解码救济,可提高创作家的成果,比如说导出时候减少,更畅通的多路回放等。NVIDIA暗示,第6代NVDEC可同步解码和播放多达8个4K60 4:2:2视频流。

而第9代NVENC则进步了HEVC和AV1的编码质地,为4:2:2 H.264和HVEC编码提供了救济。另外,还有一个全新的AV1 Ultra High Quality(UHQ)模式,它可以用更多的时候去赢得非常5%的质地进步。NVIDIA还暗示,这个模式在RTX 40系列上也可用,不外Blackwell的质地是更好的。
外不雅设想和里面
GeForce RTX 5080 Founders Edition弃取了新的包装设想,与上一代的Founders Edition有所不同,从材质、结构和配色来看都特殊绿色环保。让我思起了一些手机的包装盒。不得不说拆箱的时候挺有庆典感的,先拔掉高下两块固定板,就能把上盖拿起来,RTX 5080 FE就静静地躺在其中。









RTX 5080 FE保合手了公版显卡一向优秀的外不雅设想,一看这标记性的无尽标记外框就知说念是NVIDIA本族的手笔。金属材质不但好意思瞻念,而且触感特殊棒。全新的散热处分步调让新一代FE显卡的体态变得苗条,正面两侧是定制的大直径电扇,背面两侧布满了大面积的格栅,以团结地点垂直胪列。此次NVIDIA经受了从GTX 10系列到RTX 40系列历代公版显卡在散热设想上的训戒,在RTX 5080 FE显卡上引入了名为“Double Flow Through”的新款散热器设想,带来了更为高效的散热成果。









RTX 5080 FE显卡保合手了双槽厚度,长度和高度差异为304mm和137mm,完全称心SFF-Ready圭臬的条目。如果与RTX 4080这些环球伙放在沿途对比,那么体积上的差距就很彰着了,特殊在厚度上,RTX 5080 FE薄了许多。另外还能看到,RTX 5080 FE的12V-2x6供电接口弃取了新的歪斜设想,视频接口也180°调转了,对于插线来说更为友好。同期因为散热设想的转换,I/O挡板莫得了启齿,尾部一体感很强。







和前几代一样,RTX 5080 FE的灯光除了在侧边的GeForce RTX接口外,还藏在了框架中间的X形处,启动时就会亮起白光,配合着整王人的格栅和平滑的外壳,可以说是是科幻又好意思妙。由于全新的散热设想,举座瘦身的RTX 5080 FE不需要显卡支架,也没在尾部留住螺丝孔,装在机箱里面很干净,莫得别的东西来侵略它。









至于拆解的话,从性能影响的角度开赴,就算我个东说念主特殊但愿能够一窥其里面分外小巧的三片PCB设想,也不太好把它逐件阐明——毕竟难点在于后头的恢收复状,光有外不雅可不成,性能也得到位。不外还好,NVIDIA有意出了一期聊Founders Edition散热设想的视频,从里面咱们能知说念这种如鱼得水的结构是何如出身的(底下的截图援用自该视频【结合】)。而咱们后头向NVIDIA阐发了,因为总功耗更低,是以RTX 5080 Founders Edition弃取的是老例均热板设想,导热材料是硅脂。不外热管数目倒莫得削减,亦然双方各5根。


测试平台

本次的测试平台和RTX 5090 D一样,以AMD 锐龙7 9800X3D和X870E主板为中枢,可确保显卡性能的全力走漏。说真话也莫得换平台的必要。至于对比显卡的话,此次就丰富多彩好多了,不仅有RTX 4080,还有AMD Radeon RX 7900 XTX,致使还有RTX 4090 D——它刚刚才在RTX 5090 D的测试里面亮相了,现时还要连续上班,就跟我一样。
而测试驱动则是Beta版的Game Ready驱动,不外因为测试的先后限定问题,RTX 5080用的是572.02,其他的RTX显卡用的是571.86。系统则是最新版的Windows 11 24H2。在游戏纪录数据这块,如果游戏自带Benchmark的话,咱们会优先弃取Benchmark提供的成绩;如果游戏需要手动测试,咱们会用NVIDIA Frameview去纪录成绩。由于这张显卡的高端定位,游戏的建筑都是预设的最高了,晴朗跟踪亦然,唯有游戏救济咱们都会平直开全景晴朗跟踪/旅途跟踪。
基准测试

来望望3DMark的数据先吧。RTX 5080在各方面都比RTX 4080好好多,算下来增幅有20%,磋议到AD103和GB203在限制上的相似性,你可以苟简搭伙成这即是Blackwell的代际进步幅度。RTX 5080在4K分辨率的测试里面跟RTX 4090 D有着约10%的差距。和RX 7900 XTX对比的话,RTX 5080和它在传统光栅化性能上苟简是合手平的,不外光追性能即是另一趟事了,绿色小队在晴朗跟踪这块一直是BIG BOSS。
其实可以看到中枢限制和基准测试的数据是很好对应的,RTX 5080的限制差未几是RTX 5090 D的50%,那么在传统和光追测试里面的分数也这样,RTX 5080的分数条比RTX 5090 D的一半多一丝。天然,咱们也就在3DMark这里展示一下GB202和GB203的差距,游戏数据就不放了,毕竟这两张卡在竖立和售价上完全不是一个级别的。
游戏测试
DLSS 4性能测试
在前些天的RTX 5090 D评测(还有上头的架构知道)里面,咱们还是先容了DLSS 4的特点,因此在这里咱们就尽量失当复读机了。提及来,《赛博一又克2077》前几天妥当推送了DLSS 4更新,如果你还是在用RTX显卡的话,现时是可以躬行体验DLSS 4里面的全新Transformer模子的——涵盖超分辨率和晴朗重建。天然,多帧生成仍然是RTX 50系显卡的专属功能。
此次咱们一共测试了三款游戏,包括游戏内集成DLSS 4的《赛博一又克2077》和《星球大战》,以及通过NVIDIA App优设功能完了DLSS 4的《漫威争锋》。天然咱们现时测试的DLSS 4游戏数目是有限的,但当你们收到RTX 50系显卡的时候,应该就会有好多游戏赢得原生DLSS 4或通过NVIDIA App的DLSS优设救济了,NVIDIA暗示首日救济的游戏和诈欺数目会多达75款。



可以看到在全景晴朗跟踪开启且DLSS 4全开的情况下,《赛博一又克2077》和《星球大战:不逞之徒》从不可玩情状平直冲到了三位数帧率。特殊是《星球大战:不逞之徒》,在DLSS 3里面平均帧率只达到90fps,在多帧生成的救济下,就能冲上120乃至160fps的岑岭!而延长的话就更无须系念了,确切不成的话你也可以开3x多帧生成,归正此时帧率还是很够了。
至于Transformer和CNN新旧模子的对比上头,咱们就平直援用RTX 5090 D测试时的截图了——因为新模子是从RTX 20-50系都能用的,是以你就算拿一张RTX 3080,用和咱们一样的建筑也能赢得这种对比颇为昭着的画面(天然,帧率细目没那么高)。底下悉数的对比截图均是在超分辨跋扈能挡获取的,屏幕分辨率为4K,图形建筑为晴朗跟踪超速。可以看到Transformer大幅度地改善了复杂场景里面的细节弘扬,比如门板夹层的金属部件、水面倒影和调料瓶瓶盖。


CNN模子CNN模子Transformer模子Transformer模子


CNN模子CNN模子Transformer模子Transformer模子


CNN模子CNN模子Transformer模子Transformer模子
4K分辨率
在老例游戏测试这里,咱们保管了和RTX 5090 D一样的游戏气势。一共有7款光栅化游戏和6款光追游戏参加4K分辨率的测试,至于参加2K分辨率测试的游戏就少点,是光栅化游戏和光追游戏各4款。毕竟RTX 5080是一款定位4K分辨率的显卡,前者才是重心。


在原生4K分辨率游戏这块,RTX 5080在数个技俩中都理所天然地超越了RTX 4080。在一些技俩中,RTX 5080致使能靠拢上一代旗舰RTX 4090 D,比如说在《极限竞速:地平线5》和《赛博一又克2077》这两款游戏中,这两张卡基本莫得区别。和RX 7900 XTX对比的话,RTX 5080也在大部分游戏里面超越了这张RX 7000系列最佳的显卡。
4K光追游戏这块,虽说咱们是有测试RX 7900 XTX的,但是它的成绩都太低了,一些全景光追游戏对它来说根底吃不用。因此咱们就只可鄙人面的2K分辨率里See you again了,现时来专心看几张RTX显卡的对比。成绩于第四代RT Core,以及更多的RT Core数目,RTX 5080比起RTX 4080有着卓越15%的进步!天然,RTX 4090 D的限制比RTX 5080大好多,是以它是力大砖飞,光追成绩比RTX 5080好也可以搭伙。不外别忘了,RTX 5080有多帧生成这一个玄妙兵器,可以让光追游戏的帧率成倍高潮。
2K分辨率


因为分辨率的逼迫,是以可以看见几张显卡的差距都有所减弱。不外比例照旧如4K分辨率那般,RTX 5080的光栅化游戏性能在RTX 4090 D和RX 7900 XTX之间,卓越RTX 4080不少。光追的话亦然如斯,RTX 5080在三张RTX显卡里面名轮番二。
AI与坐蓐力测试
当地时间周日晚上,休斯顿火箭队以 119-115 战胜了洛杉矶湖人队,但这场胜利也并非没有紧张的时刻。
AI生图与大言语模子


成绩于Blackwell添加了对FP4的救济,在UL Procyon FLUX.1 AI生图测试里面,RTX 5080在FP4模式下仅用了10秒不到就生成了一张图,所用时候连RTX 4080的1/3都不到。在FP8模式中,RTX 5080也比RTX 4080快,不外差距小一丝。


天然,老例的UL Procyon Stable Diffusion FP16咱们也会测试。可见在这里RTX 5080仍然是要比RTX 4080快,在条目更高的Stable Diffusion XL中,RTX 5080生图时候彰着比RTX 4080镌汰。磋议到咱们是用ONNX DirectML开动时测试的,如果Tensor RT日后妥当更新了对RTX 50系列的救济,约略这生成时候还要短好多。


在LLM测试里面,RTX 5080在和输出Token速率这些关节办法上都比上一代快10-15%。
坐蓐力创意软件


V-Ray和Blender都是跟3D创作关联的软件,在这里你可以看到RTX 5080是怎样为创作提速的。在V-Ray 6 Benchmark中,RTX 5080要比RTX 4080快20%。
温度测试
本分说这一代Founders Edition的尺寸照实是一件颇为令东说念主畏俱的事,因此咱们对它的温度弘扬天然很感兴味。咱们是在通达平台测试RTX 5080的散热。测试分为待机和满载两个场景。待机场景是插足系统后待机5分钟,而满载场景则是3DMark Speed Way开动10分钟。咱们用GPU-Z的Log to file功能纪录数据,环境温度是24.4摄氏度。过程测试,RTX 5080 FE的满载温度雄厚在了68摄氏度高下。待机温度方面,则是由31.4冉冉高潮到34.4摄氏度,和其他带智能启停的显卡一样。磋议到这只是是一个2槽位显卡,这成绩挺可以的。

功耗测试
咱们通过手中的PCAT套件,差异精确地测量显卡PCIe、外接电源接口的功耗,显卡满载功耗在3DMark Speed Way压力测试中赢得,待机功耗则是在插足系统跋文录1分钟取平均值。测下来显卡的平均满载功耗达到了328W,峰值功耗的话,图里面是358W,不外纪录数据里面最高有366W的纪录,只是图里面刚好莫得笼罩资料。而待机功耗绝大部分时候是在15W以下。总的来看是比RTX 4080/4080 SUPER这一代高了极少。电源保举方面,其实NVIDIA官方建议的850W是够用的。

杂音测试
在GPU-Z的Log to File中咱们同期纪录下了显卡转速情况。烤机时,RTX 5080电扇转速最高的时候在1550RPM高下。接着咱们把显卡放进了环境杂音小于10 dB(A)的消音实验室,把其电扇还原一样转速,然后在30CM的距离上测试其杂音水平,测得的数据是42.5BA。由于显卡在待机时电扇是停转的,是以就无须测试了。



回来
可能是由于早些时候的RTX 5090 D带来的冲击,加上数日来不分日夜的合手续测试,说真话RTX 5080给我带来的震荡其实莫得RTX 5090 D那么利害。关联词必须要精明到的是,比拟起限制暴涨的GB202,RTX 5080的GB203在组件的数目上和AD103更相似,在探讨架构代际进步这个话题上,RTX 5080是更有代表价值的。从游戏测试里可以看到,RTX 5080在光栅化和光追游戏性能上都是稳步进步,DLSS 4更是让其如虎添翼。个东说念主认为,如果你还在停留在RTX 30乃至20系旗舰的话,RTX 5080照实可以让你一步进步,直抵4K。而对于刚买了RTX 4080和RTX 4080 SUPER的玩家而言,他们约略可以松语气,天然DLSS 4的确作念到了四倍增幅,但DLSS 3的双倍果然也不赖了。

不外,我深信有这样一群玩家是最思要GeForce RTX 5080 Founders Edition的:他们同期追求体积的极限压缩和性能的旷古绝伦,如同《核舟记》的奇巧东说念主一般,要在小空间里刻画大宇宙——对于这群ITX玩家而言,这一代Founders Edition完全是最佳的礼物。特殊磋议到这几代以来,高端显卡只大不小的趋势,NVIDIA能提倡SFF-Ready圭臬何况身膂力行,作念出这样一张双槽猛兽,照实称得上是历史移动。
显卡迷你天梯榜 (无缺显卡天梯榜)

终末,照旧说一说售价,GeForce RTX 5080 Founders Edition的价钱为8299元,相较RTX 40系发布时RTX 4090和RTX 4080时过于邻近的订价,RTX 50系此次旗舰的陡立搭配照旧比较合理的。如果你只是拿来玩游戏,那RTX 5080照实是很可以的一张高端显卡。