NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

2016-4-15不详佚名

【大中小】

2016上半年过得差不多了，显卡市场上这一年来基本上没什么新品，不论是AMD还是NVIDIA主推的还是上一代架构的显卡，恍恍惚惚之间28nm工艺的显卡竟然支撑了4年时间，这在以往的GPU升级历史上可不多见。之所以沉寂这么久是双方都在憋大招，AMD新一代显卡架构为14nm工艺的Polaris（北极星），NVIDIA准备的则是16nm工艺的Pascal（帕斯卡），后者在GTC 2016大会上首次揭开了面纱，NVIDIA发布的Tesla P100专业卡使用了旗舰GP100核心。

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

也许是久未见新工艺新架构显卡，现在看到GP100这样的庞然大物都觉得兴奋了，这几天我们已经被各种Pascal显卡爆料刷屏了。从Kepler到Maxwell架构，NVIDIA钱两次都是选择首发面向主流游戏市场的核心GK104、GM204（Maxwell首发的其实是GM107这样的低端核心），GK110、GM200大核心产品通常要晚半年时间，但这次的Pascal显卡就跟当年的GF100费米架构一样选择了大核心首发，历史终于轮回了。

作为16nm工艺的新一代旗舰，NVIDIA的GP100核心到底有多强？或者说它与目前的架构有什么质的不同？今天的课堂上我们就来分析下GP100核心的特色，回顾下它与Kepler、Maxwell架构有什么不同。

Pascal与Kepler、Maxwell规格对比

切入正题之前我们先来了解下GP100核心与Kepler、Maxwell架构的规格，此前NVIDIA官方也公布了GP100核心与GK110、GM200核心的一些对比，这里我们做了一份更详细的规格表，并加入了GM204及GK104这两款游戏显卡核心。

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

▲GP100核心与GK110、GM200、GM204、GK104核心规格对比

这份规格表内容非常多，初看之下会觉得手足无措，不过小编把需要重点关注的地方标红了，简单来说就是GP100核心晶体管密度再次攀升、CUDA核心大幅增加、双精度性能逆天增长、缓存/寄存器容量翻倍、HBM 2显存及NVLink总线，这几点基本上能概括GP100核心的特色。

Pascal架构看点之一：计算性能是关键，双精度性能逆市回归

GP100的性能一经公布，给小编的感觉就是NVIDIA这次回归了GK110大核心时代注重双精度运算的设计，而且比之前更加变态——GK110架构中FP64双精度与FP32单精度的比例不过1：3，每组SMX单元中有192个FP32单元，64个FP64单元，但GP100核心中每组SM单元中有64个FP32单元，但有32个FP64单元，FP64与FP32比例是1：2。

要知道，Maxwell架构中单双精度比砍到了1/32，GK104核心中单双精度比是1/24，这都远远低于Pascal核心，唯一能与之媲美的就是当年Fermi核心的Tesla加速卡了。

因此在双精度性能上，GP100核心可以说突破天际了，FP64浮点性能可达5.3TFLOPS，而GK110核心不过1.68TFLOPS，GM200核心更是只有可怜的0.21TFLOPS，GP100双精度性能达到了GK110核心的3倍多，是GM200核心的20多倍。

HPC很多应用需要双精度性能，不过深度计算（deep learning）这样的计算并不需要高精度运算，因为它天生自带纠错能力，而GP100的FP32 CUDA核心可以同时执行2个FP16半精度运算，因此FP16浮点性能高达21.6TFLOPS。NVIDIA在Tesla P100之外还推出了基于GP100核心的DGX-1深度学习超级计算机，由8颗GP100核心及2颗16核Xeon E5处理器组成，深度计算性能达到了170TFLOPS，号称比250台X86服务器还要强大。

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

▲GK110核心架构示意图

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

▲GM200核心架构示意图

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

▲GP100核心架构示意图

GP100为了提升计算性能，增强的不仅仅是双精度单元，其L2缓存、寄存器文件也大幅提升，总计拥有4MB L2缓存、14MB寄存器文件。

总之，NVIDIA的GP100核心为了计算性能可谓煞费苦心，双精度性能简直逆天，不过NVIDIA针对高性能运算所做的设计固然讨好HPC市场，但对游戏市场来说双精度是没多少用处的，反而浪费了晶体管单元，提高了成本及功耗。

Pascal架构看点之二：升级16nm工艺，密度、能效提升

从AMD的HD 7970显卡率先使用28nm工艺开始算起，TSMC的28nm工艺已经陪伴我们四年时间了，期间AMD、NVIDIA数次升级的新核心都没有工艺升级，依然坚持28nm工艺，双方都跳过了20nm工艺、直接进入了性能更好的FinFET工艺节点，只不过AMD选择了三星/GF的14nm FinFET LPP工艺，NVIDIA坚持了老朋友TSMC的16nm FinFET Plus工艺。

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

1
2
3
下一页

本文来源：不详作者：佚名

上一个文章： 5.9元包邮，苹果/安卓/WP手机数据线白菜价

下一个文章：更轻薄更高端：亚马逊Kindle Oasis上手体验

错失智能手机，NVIDIA股价近年却暴涨   IBM、NVIDIA将合造世界最强超算Summit  戴尔Win10笔记本XPS15 9560曝光：或搭载Nvidia GTX 1050
NVIDIA发布PC游戏升级套装：显卡/硬盘/电源打包带走   次旗舰即将登场：Nvidia GTX 1080Ti官方确认   NVIDIA发布376.33显卡驱动下载：为最新游戏提供优化
Nvidia增强核弹级GPU？新Shield TV游戏盒子将在CES 2017登场   NVIDIA自动驾驶汽车路测照曝光：车内有人协作   NVIDIA GeForce 376.19显卡驱动更新：为Oculus Touch手柄优化
CES 2017：Intel、NVIDIA新品将瞄准游戏市场

聚合推荐

网吧管理系统

Win11

网吧网管呼叫系统

网吧语音系统

网吧母盘系统

声明

声明：本站所发表的文章、评论及图片仅代表作者本人观点，与本站立场无关。若文章侵犯了您的相关权益，请及时与我们联系，我们会及时处理，感谢您对本站的支持！联系Email：support@txwb.com，系统开号，技术支持，服务联系QQ：1175525021本站所有有注明来源为天下网吧或天下网吧论坛的原创作品，各位转载时请注明来源链接！

天下网吧·网吧天下

NVIDIA Pascal显卡特色解析：旗舰核心GP100强在哪？

推荐文章

最新文章