国产超算芯片揭秘:自主研发 不依赖Intel和NV

武汉资讯 浏览(988)

超级计算机是所有计算机中速度最快、功能最强的,在科学研究和军事领域占据着举足轻重的地位。它们是综合国力的体现,可以说是国家最重要的工具。 也许这些高端庞然大物远离普通人的生活,所以我们甚至无法感知它们的存在。 然而,最近的一些事件和消息刺痛了许多中国人的神经:五年过去了,美国新发布的“峰会”超级计算机终于从中国的“神奇力量太湖之光”手中夺回了“世界第一超级计算机”的宝座

什么?我们如何能在如此高的复杂水平上领导美国五年?一些小伙伴看到这个消息时可能会惊叹不已。 是的,答案是肯定的 出于好奇,作者在这个陌生的领域里发现了许多有趣的数据和故事以及这条新闻线索,不敢整理出来与大家分享。

以Summit为恶意角色,让我们先做一些科普知识,超级计算机怎么会有惊人的计算能力?

高峰超级计算机在小发猫的领导下完成。整个超级计算机由4608个计算节点组成,每个节点包含2个2 2核的小发猫Power9处理器(负责协调)和6个NVIDIA特斯拉V100图形处理单元加速器(负责计算),能够提供高达每秒20亿次的浮点运算速度峰值!

那么,你如何理解每秒20亿次浮点运算呢?如果我们以普通笔记本电脑为参照,Summit超级计算机的计算能力相当于100万台笔记本电脑。如果一个人每秒能做一次手术,他需要活到63亿岁或更久,才能达到每秒钟首脑会议的手术量。

Summit也是一个拥有惊人计算能力的大家伙。4608个节点中的每一个都有冰箱那么大,总重量为340吨。它被放在一个近900平方米的超大房间里。据说连接这些节点的电缆长度接近300公里。

由于计算力惊人自然,发热量自然巨大,采用水冷散热。 Summit每运行一分钟就需要升冷却剂,它消耗的电力足以点亮8000多户美国家庭。

既然我们知道美国峰会的超级计算能力不错,那么中国的超级计算水平是多少?

全球超级计算排名在中国并不差。

对于全球超级计算机的排名,世界有一个相对公认的“500强”(TOP500)排名,该排名由国外权威超级计算机专家联合编制,在世界上具有很高的可信度。

在2018年“500强超计算”排行榜中,美国国际商用机器公司发布的最新峰会和塞拉分别排名第一和第三,而中国的“神威太湖之光”和“天河二号”多年来一直位居榜首,现已跌至第二和第四位。

然而,如果你仔细看看这个列表,你会发现他们的排名是按Rmax(测量峰值)和Rpeak(理论峰值)排序的 对于任何计算机来说,Rpeak的理论性能都更有参考价值,Rmax的测量性能更为关键,即使对于超级计算机也是如此。 接下来,我们将把范围缩小到前五名,看看这些世界顶级超级计算机的实力下降了多少。

国产超算芯片揭秘:自主研发 不依赖Intel和NV

世界排名第五的强国

此前的排名被中国神话太湖之光主导了几年。五年后,美国发布了峰会,以重新获得其第一个位置。

根据数据,峰顶实测峰值比神威太湖高出约31% 因为我们使用测量的峰值数据进行比较,并考虑到创建时间的差异,两者之间的实际差异并不像一些媒体声称的那样接近倍数

国产超算芯片揭秘:自主研发 不依赖Intel和NV

中国的超级计算实力仍然是世界上最强的。

以下数据会更有趣。早期媒体将所有超级计算机按国家分类,并发现中国有206台超级计算机,占41%

124台美国超级计算机,占25%。中国和美国,两个超级大国,控制着世界上65%以上的超级计算机。尽管个人被美国超越,但中国仍然是世界上最大的超级计算机。

接下来的问题是:中国如何才能再次超越美国峰会,在超级计算性能上重新获得世界第一的位置?一些朋友说积累更多的处理器会很好,但是实际情况并不那么简单!

中国的“核心”力量在技术封锁下崛起

建立一整套世界顶级超级计算系统并不像堆叠处理器那么简单。首先,有必要拥有足够强大的独立计算芯片、先进的计算管理技术、操作系统支持和足够的财务支持来构建它。 当然,在这一切背后,最核心的因素是国家一级的政策支持和足够的尖端科技人才储备。 因此,可以说超越是一个国家综合实力的体现。

中国的超级计算起步较晚,但进展迅速,这与中国的高速发展需要和国家政策支持密切相关。 中国天河二号超级计算机六次获得世界超级计算机500强冠军,确立了中国在全球超级计算机中的绝对地位。

然而,由于英特尔至强芯片解决方案在天河二号的早期使用,一些质疑和批评被提出。 中国超级计算机的迅速崛起也导致美国政府在2015年发布了耸人听闻的“销售限制”:美国政府禁止英特尔和其他公司向中国的四个超级计算中心出口高性能计算芯片。

国产超算芯片揭秘:自主研发 不依赖Intel和NV

家用矩阵-2000加速器取代英特尔至强处理器

2015年,当“销售限制”事件在美国爆发时,中国决定用国内芯片取代它。 直到2017年9月,广州超级计算中心宣布年底前升级天河二号超级计算系统,用国产加速器矩阵-2000取代原有的英特尔至强融核加速器。 用国产芯片升级的天河2A超级计算机在计算能力上实现了惊人的翻番。

国产超算芯片揭秘:自主研发 不依赖Intel和NV

国产矩阵-2000给天河2A带来双重业绩

国产矩阵-2000打破了美国的“技术封锁”。升级后的天河2A超级计算机浮点性能从54.9PFLOPS提高到94.97PFLOPS,互连和输入输出性能指标也取得了巨大的技术进步。

网络带宽从10千兆位升级到14千兆位,延时从1.57微秒降低到1微秒,内存容量从1.4兆位升级到3.4兆位,存储容量从12.4兆位升级到19兆位,带宽翻倍到1TB/秒,功耗从17.8兆位降低到16.9兆位,大大提高了能效

略微神秘的Matrix-2000芯片由国防科技大学自主开发设计,在线传输由天津麦创公司生产。 在中国超自我制造的内部担忧和美国的外国入侵“禁止销售”的背景下,中国超自我开发的Matrix-2000实现了“反绝地杀戮”,这无疑可以载入史册。

只有坚定和完全独立的研发才是出路。

自中国863计划实施以来,超级计算系统的研发一直受到国家的高度重视,但由于基础薄弱、起步较晚,一直被国际舞台上的其他人所控制。

美国商务部于2015年实施高端芯片“禁售”,进一步加强了高端芯片在中国的自主研发路线,并将其提升到国家战略层面。 正是在这种背景下,中国最强大的超级计算机神威太湖之光诞生了。

神威太湖轻型超级计算机配有中国自主开发的4096“神威”多核处理器。多核处理器采用64位自主神威指令系统,峰值性能为每秒12.5亿次,持续性能为每秒9.3亿次。

2016年,国际500强组织公布的名单显示,“神威太湖之光”超级计算机系统高居榜首,不仅速度是第二个“天河二号”的近两倍,而且效率也是第二个“天河二号”的三倍。

神威多核处理器采用64位自主神威指令系统,峰值性能为每秒3.168万亿次,核心工作频率为1.5千兆赫 “神威太湖之光”安装了4096个这样的处理器 利用中国自己的芯片制造的“太湖之光的魔力”取代“天河二号”荣登榜首,中国有史以来第一次超过美国,荣登榜首。

神威多核处理器已经基本取代了英特尔至强融核加速器卡。 尽管单个芯片的性能仍然落后于英特尔至强处理器,但由于体积和功耗的优势,256个计算节点可以放置在一个小机箱中,同样体积的计算性能可以杀死英特尔至强融核。

与国内其他芯片相比,神威更低调、更神秘,因为神威处理器自诞生之日起就肩负着军事防御和国家信息安全的使命。其研发单位第56总参谋部研究所(无锡江南计算技术研究所),于2003年开始设计中国自己的高性能芯片。 在国家“核高科技”重大项目的支持下,神威加工采用独立指令集开发,拥有完全自主的知识产权。

虽然我国的两台重量级超级计算机“神威太湖之光”和“天河2A”已经被美国的“顶峰”和“塞拉”超越,但两大巨头之间的输赢是合理的。

据最新消息,中国天河三号目前正在积极研发公众,预计将于2020年夺回第一宝座,并取得超过“神威太湖之光”八倍的成绩。 更值得期待的是,天河三号预计将采用完全独立的创新设计、独立的腾飞中央处理器、独立的天河高速互联通信和独立的麒麟操作系统。

然而,我们必须清楚地认识到,我们在芯片领域面临的竞争对手是如此强大,以至于任何芯片公司,无论是小发猫、英特尔还是英伟达,都有足够的实力。

与此同时,应该注意到美国政府早在5年前就停止资助超级计算机项目。 相反,他们开始在量子计算机的研发上投入巨资。 这也是美国超级计算机之前停止运行并最终一举被中国超越的一个重要原因。

国内芯片面临的挑战和任务同样重要。在当前的国际形势下,唯一的出路是识别并走自主研发之路,彻底摆脱他人的控制。

无论是将于2020年投入使用的天河三号,还是神威太湖之光的后续升级,国产芯片在关系到国家经济命脉和信息安全的超级计算机领域都会越来越强大。让我们拭目以待吧!神威在《国产超算芯片揭秘:自主研发 不依赖Intel和NV》专题片中的报道

9月9日盘前重要市场新闻