
就在上周,摩尔线程举行了2022秋季发布会,推出了首款支持Windows环境和DirectX图形接口的国产显卡产品MTTS80、全新多功能GPU芯片“春晓”、面向服务器应用的MTTS3000,以及元计......
就在上周,摩尔线程举行了2022秋季发布会,推出了首款支持Windows环境和DirectX图形接口的国产显卡产品MTTS80、全新多功能GPU芯片“春晓”、面向服务器应用的MTTS3000,以及元计算一体机MCCX。

笔者一开始以为,这次会是一场“PPT发布会”。因为这次摩尔线程的步子实在迈的太大。但没想到就在一周后,这张MTTS80实实在在的摆在了IT之家的桌面上,而且是装上主机就可以在Windows下使用,并不需要复杂的调试。

在本文中,我们就来看看这张MTTS80,为国产显卡的发展迈出了怎样的一步吧。测试配置如下:

摩尔线程MTTS80的包装设计很是独特,上面国画风的线条图案彰显着它国产显卡的卖点。说来这也是IT之家第一次测试国产显卡,颇有纪念价值。

包装内除了显卡本体外,有一本非常简单的说明书,以及一根双PCIe8Pin转CPU8Pin线。之所以说明书如此简单,是因为它的安装方法与正常显卡无异,装上去,打开Windows,安装驱动,完事。

MTTS80显卡本体的设计水平相当高。整体设计方正,金属风满满。外壳采用了一体式设计,并使用铝合金压铸+CNC工艺,极大的提升了显卡的整体结构强度,不用显卡支架也不用担心变形。散热部分采用3风扇设计,2个8cm风扇加上中间的7cm风扇构成了中心对称的整体布局。


背板有一整块金属保护,中间有一个摩尔线程LOGO,右侧通风孔在通电后还会点亮,观感非常酷炫。


最炫酷的莫过于中间的橙色光环了,点亮后犹如喷薄的火山口,带来无穷的能量。

从显卡侧面可以看到S80密集的散热鳍片,同时使用了4根6mm热管贯穿散热片整体,帮助热量从GPU芯片和显存上尽快传递到散热鳍片上。

最棒的设计莫过于侧面的8Pin电源接口了,虽然这会导致需要更大的机箱才能兼容,但也使得机箱正面观感变得更简洁美观。


最后需要注意的是,MTTS80是首批使用接口的显卡,也是一款支持*16接口的显卡,这意味着最好搭配比较新的主板才能实现最好的接口性能。所以摩尔线程京东旗舰店会选择以2999搭一个华硕B660M主板的方式进行售卖。


核心参数方面,MTTS80基于台积电7nm工艺打造,拥有4096个MUSA核心,主频1.8GHz、16GBGDDR6显存,显存位宽256bit,核心内集成了220亿个晶体管,内置MUSA架构通用计算核心以及张量计算核心,可以支持FP32、FP16和INT8等计算精度。

我们也对MTTS80进行了拆解,整张卡的拆解非常简单,拧开所有可见的螺丝就可以取下背板和挡板。内部做工是相当规整的,显存为8颗三星GDDR6闪存,每颗2GB,组成了16GB的大显存。

核心代号为SD102AA-500,基于摩尔线程的GPU芯片“春晓”打造。

MTTS80最特别的地方在于,它是国内率先支持Windows环境和DirectX图形接口的GPU。发布会上摩尔线程表示,目前MTTS80的Windows驱动已经内置了MUSADirectXDriver模块,并已完成对《暗黑破坏神3》、《英雄联盟》和《穿越火线》等十多款游戏完成适配,还有更多游戏可以运行,但还在适配过程中。不过至于是否真的如它所说,我们接下来就实测一下。

首先我们进行一下理论性能测试。但在测试前,我们发现:MTTS80的确是支持Windows和DirectX环境,在硬件层面能够支持DirectX11,但目前驱动还未完成全部功能模块的开发,因此目前只支持DirectX9,目前大部分的跑分软件都是基于DirectX11/12的。所以常规的测试我们就不能进行了,只能另寻办法。

在Windows环境下有一款可以测试DX9性能的软件——,在这款软件中,MTTS80获得了2302分的成绩。

我们在Unigine官网查询排行榜,可以看出在这个项目中MTTS80能达到GTX10606G的水平。

像素填充率和纹理填充率也是评价显卡性能的重要指标。像素填充率指的是GPU在一秒内可以渲染到屏幕并写入显示存储器的像素数量,我们用使用FillrateTester实测MTTS80的像素填充率FFP-Singletexture成绩为188GPixel/s。作为对比,RTX3060的像素填充率为85.30GPixel/s,RTX3080Ti的像素填充率为186.5GPixel/s。

纹理填充率指的是GPU可以在一秒内映射到像素的纹理贴图元素的数量。我们可以用3DMark06来进行测试。最终Multi-Texturing最高为170GPixel/s,作为对比,RTX3060的纹理填充率为199.0GTexel/s。RTX3050的纹理填充率为142.2GTexel/s。之所以不同项目间差距悬殊,是因为目前驱动还未对CPU多线程进行优化,因此图形负载越重,MTTS80表现就越好。一旦未来驱动优化完成,MTTS80的性能表现会有进一步提升。

除了上面两款测试外,Windows平台就没有太多跑分软件了。所以我们转战Linux平台,在Ubuntu下看看还能不能测出一些数据。我们试试看使用clpeak,测试它的显存带宽以及单精度浮点(FP32)性能。最终测出来的数据如下:显存带宽最大为365Gbps、单精度浮点最大为13.9TFLOPS。

这大概是一个什么水平呢?以下是桌面端RTX306012G的理论性能,MTTS80的显存带宽和浮点性能都比RTX3060略高一点点。

前面我们有提到,MTTS80是首款支持的国产显卡,因此我们也测试了一下它的PCIe带宽,我们在Ubuntu下使用OCLBandwidthTest进行接口上下行测试,实测上传最大带宽为28G/s,下载最大带宽为32G/s,这个速度是目前大部分主流显卡的一倍。可以说MTTS80是一张“战未来”的显卡了。

从上面我们的测试来看,MTTS80在不考虑环境兼容性的情况下,纯理论性能可以做到RTX3060-RTX3060Ti的水平。而在Windows环境下,由于驱动对DirectX和OpenGL环境还在努力适配,因此不同软件中的性能差距很大。可以说摩尔线程MTTS80这次的硬件水平是相当在线的,驱动适配虽然暂时跟不上主流水平,但也为国产显卡开了一个好头。
游戏体验前面我们有说过,MTTS80是首款支持Windows和DirectX环境的国产显卡,那么它的实际游戏体验怎么样?前面我们有提到,MTTS80暂时只支持DirectX9环境,所以我们只能选择一些比较老,但是受众广泛的游戏来测试。以下游戏我们均开到1080P低画质运行。首先是《英雄联盟》,达到了140-150帧,可以满足电竞级显示器畅玩。

如果开到1080P高画质,帧数则会来到平均136帧左右,同样也能流畅游玩。

最后我们尝试一下2K高画质,平均帧数还能维持在120帧以上,表现很不错了。

《QQ飞车》会锁30帧,自然是可以畅玩。

《穿越火线》的平均帧数高达180帧,完全可以流畅游玩。

《暗黑破坏神3》是摩尔线程在发布会上演示的游戏,我们实测下来也确实可以满足90-100帧左右流畅游玩。

《我的世界》也得到了适配。但笔者发现网易版是打不开的,微软版可以直接打开,但帧数在平均40-50帧左右,不算很流畅,但已经可以玩了。

最后我们测试一下《CS:GO》,这款游戏玩起来还是很流畅的。我们运行Benchmark可以达到213帧左右的平均帧数。

从上述游戏的适配情况可以看出,摩尔线程目前的思路是优先适配那些受众广泛的国民级游戏,来提高国产显卡的接受程度,然后再回头去适配那些精品的小众游戏,这样的发展思路无疑是正确的。





得益于全功能MUSA架构,MTTS80还可以应用在AI训练方面,比如开发者可以通过MUSA软件栈将现有AI模型简单、快捷的迁移到MTTS80上;兼容性方面,MTTS80兼容PyTorch、TensorFlow等多种主流深度学习框架,并实现了对Transformer、CNN、RNN等数十类AI模型的优化。
前面我们的测试中,MTTS80的单精度浮点性能很强,因此在很吃单精度浮点性能的AI高精度推理上能展现强大的性能,满足对数据计算精度要求极高的场景,如医疗、金融等应用领域。比如MTTS80特别适配了医疗领域AI开源框架MONAI,实现多种任务的高精度推理。
最大的黑科技还是“CUDAonMUSA”。为了降低用户的迁移成本,摩尔线程专为使用CUDA语言的用户开发了一套CUDAONMUSA的兼容方案。基于摩尔线程提供的porting工具,通过编译与运行两步就可以让CUDA源码运行在摩尔线程MUSA架构GPU上。

从笔者今天的评测中能看出,MTTS80的硬件性能已经达到了主流甜品级的水平,这无疑是整个国产显卡行业的一大步。但最大的难点还是在于后续如何开发驱动程序,由于计算机图形的专业性非常强,全球能够懂得开发Windows驱动的人本来就少,其中大部分都集中于西方国家,在中国的专业人士屈指可数。处于初创阶段的国内GPU企业需要快速推出市场化的GPU产品,但面临的难题在于背景是芯片设计、底层驱动开发等关键领域人才匮乏、团队缺少磨砺。所以开发通用GPU绝非易事。

即便是做了十几年核显,市场占有率第一的intel,在进军独立显卡市场时也遇到了驱动开发的挫折,更何况是对于一个初创2年的新玩家呢?国产GPU想要做到对旧有软件生态的兼容,无疑是一个漫长而艰难的过程。我们不得不承认,自主创新是一条非常艰难的路,但也是一条不得不走的路。最近美国一纸禁令,英伟达就不得不对中国断供指定型号的GPU芯片,未来会发生什么样的摩擦我们更是难以想象,所以我们必须做好充足的准备。
