相比龙芯,申威的“芯”路历程为什么平坦很多?

来源自:捷世智通    点击数:10843   发布时间:2017-06-13

本文节选自雷锋网,原文《相比龙芯,申威的“芯”路历程为什么平坦很多?》,作者:铁流 ,文章转载已获授权。
http://mp.weixin.qq.com/s?__biz=MTM2ODM0ODYyMQ==&mid=211482465&idx=1&sn=3d9080765e58315ce91a7595b08ecac2&mpshare=1&scene=23&srcid=0612oyF27f6osLhaW8LqlQFn#rd


      相对于从诞生之初就处于舆论风口浪尖的龙芯,国内另一款走全自主道路的芯片——申威,相比之下就低调得多。
无论是传统纸媒还是网络媒体,申威的曝光率比起龙芯、海思、展讯等国产芯片都要低得多,而且相比于嘲讽天赋技能被点满的龙芯,申威极少成为网媒和充满虐气的网民的攻击对象。申威的军方背景更是给它带一缕神秘的色彩。下面,让我们一起走进申威,解密申威的“芯”路历程。

      

1、申威的诞生
      上世纪60-70年代末,中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北京大学、北京有线电厂等单位联合研制150计算机。清华大学、北京无线电三厂研制生产了130、131、132、135、140、152、153系列计算机近千台。国防科大成功研制出151计算机,华东计算技术研究所成功研制1001中型集成电路计算机和HDS-9计算机,其中HDS-9计算机每秒运算达500万次,更为难能可贵的是,这些计算机的软件和硬件是中国人自己编译和制造的。

      但在80年代因迷信“造不如买、买不如租”、“市场换技术”等理论,放弃了自主芯片的研发转而大量外购国外芯片。从80年代的银河1超算开始,到90年代的银河2、银河3,曙光系列超级计算机都没有中国“芯”,在技术上始终受制于人。即使是在几年前的天河2号上,也只有4096片飞腾1500作为计算节点前端处理器,而飞腾1500是在SUN的UltraSPARC T2基础上做的改进版本。


      

2、申威的发展方向
      申威由无锡江南计算技术研究所设计。主要研究方向有计算机系统结构、并行/分布处理与智能计算机系统、计算机软件、人工智能与智能控制、计算机与通信、计算机信息处理与应用。八十年代以来,在计算机、通信及机电一体化等领域共荣获国家、军队科学技术成果奖300多项,其中国家科学技术进步特等奖3项,军队科学技术进步一等奖35项。

      

3、申威的指令集和技术渊源

      申威属于Alpha阵营,指令集也是基于Alpha进行扩展。
      申威的技术来源是于DEC的Alpha 21164。DEC的技术实力很强,Alpha性能更是惊艳,AMD就曾经购买了Alpha 21264的技术资料,挖走了部分DEC的技术人员后,开发出自己的K7微结构。

      DEC是技术实力比人强,但商业模式不如人而失败的典型例子,Alpha也被几经转手,先被康柏收购,后被惠普雪藏。目前Alpha已经被束之高阁,指令集和微结构都已经不再更新,技术专利大多已过期或快过期了。申威是目前Alpha阵营中仅存的硕果,拥有自主扩展指令和发展路线的自主权。

      至于购买国外指令集,并以此为基础扩展指令,发展出自己的指令集是否是自主可控等问题,请参见本人撰写的另一篇文章《15年了,龙芯拿什么与国外芯片巨头对抗》。

      
4、自主可控体系构建
      申威和龙芯作为国内硕果仅存的两个走自主可控路线的IC设计单位,和龙芯一样在积极构建自己的软硬件体系以保障从软件和硬件两个方面实现安全可控。

      申威开发了自己的神威睿智编译器,研发了基于Linux的神威睿思操作系统......申威构建自主技术体系的道路可谓一片坦途——于2012年9月投入使用的神威蓝光超算使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。


5、申威历程

      江南所以Alpha指令集为基础,扩展出自己的指令集,并在2006年设计出具有自主微结构的申威1,申威1是一款130nm制程工艺的单核心CPU,主频900MHz,集成5700万晶体管。2008年完成的申威2,是一款130nm制程工艺的双核CPU,主频1.4GHz。

      如果说申威1和申威2更像是江南所磨砺技艺的作品,是对Alpha21164技术的消化吸收,那么2010年研发的申威1600则是江南将国外技术融会贯通后,推陈出新的产品。申威1600是一款65nm制程工艺的16核CPU,主频1.1G,双精浮点140G。申威1600被用于神威蓝光超算。

     也许是因Alpha当年强悍的性能,本人对源自Alpha的申威抱有很高的期望。但根据国家高性能集成电路设计中心公布的论文显示,申威1600的SPEC2000测试分数只能说是差强人意,唯有性能功耗比和 LINPACK测试聊以自慰。

      平心而论,虽然申威1600处理器的单核性能有限,但16核的可扩展性很好,实现了比较理想的多核性能加速比。

申威1600性能参数如下图所示:
      

     2012年,无锡江南计算技术研究所研制出申威1610和申威410,申威1610为40nm制程的16核CPU,集成10亿晶体管,主频1.6G,最大功耗50W,双精浮点运算00G。
申威410为40nm制程的4核CPU,集成2.7亿晶体管,主频1.6G。前者用于服务器,后者用于PC,支持中标麒麟操作系统......

      2014年底,申威5成功流片。根据一篇由坐落于无锡的数字工程与先进技术国家重点实验室和坐落于北京的国家并行计算机工程技术研究中心联合发布的论文,申威5很有可能是一款集成了4个管理核心和256个运算核心的高性能众核CPU,双精浮点运算超过1T,核内 linpack效率93%,并有很高的性能功耗比。

      

6、神威蓝光超算

     


      神威蓝光超算总投资6亿元,于2012年9月投入使用。神威蓝光超级计算机使用了8704片申威1600,搭载神威睿思操作系统,实现了软件和硬件全部国产化。神威蓝光超算峰值计算性能1PFlops(一千万亿次每秒),持续性能为0.796PFlops,性能功耗比超过741MFlops/W(百万次浮点运算/秒•瓦),LINPACK效率为74%。

神威蓝光超算有以下特点:
      一是全部使用申威1600芯片,搭载神威睿思操作系统,实现软件和硬件全部国产化;
      二是稳定性较好,测试Linpack 全过程9个多小时无故障;
      三是液冷系统高效可靠,冷却剂在冷板内部的封闭水循环带走主板热量,环保且无噪音;
      四是高密度封装,一个机仓可装入1024个CPU;
      五是整机功耗低,性能功耗比高。神威蓝光超算性能功耗比超过741MFlops/W,整机功耗1W;天河1号超算性能功耗比431.7 MFlops/ W,整机功耗4W。

      六是整机效率高。神威蓝光超算LINPACK在不同规模下的效率:单处理器核80.28%,单CPU 75.20%,单机舱75.07%,整机74.37%。神威蓝光超算整机效率与曾经是美国最快的计算机美洲虎超级计算机效率相当。


      

      据统计,“国家超级计算济南中心”有注册用户超过100个,移植优化60多道重点应用课题,其中能够达到上万核并行规模的应用课题达16个,有应用成果的课题超过15个,系统利用率已超过60%。目前主要面向气象气候、海洋环境、生物医药、信息安全、航 空航天、材料物理、金融分析、工业设计、石油物探等应用领域。

新一代神威超算
      无锡市人民政府于2013年就成立了以市长为组长,副市长为副组长的国家超级计算无锡中心建设领导小组,积极筹备新一代神威超算建设。

      2015年4月,官方成立了无锡恒鼎超级计算中心有限公司作为国家超级计算(无锡)中心的建设和运营主体,无锡江南计算技术研究所成立了项目指挥组及总师组负责解决超算建设过程中的技术问题。

      目前,新一代神威超算主机系统软件正在调试中,整机系统设计计划于2015年年底公布。新超算总投资18亿元,计划在 2017-2018年建成,运算能力将达到100PFlops,计算性能有望冲击世界第一。

神威MPP机
      神威MPP机是国家并行计算机工程技术研究中心研制的面向千万亿级以上规模的高性能计算机,能通过虚拟化技术、网格计算技术和云存储技术在服务层虚拟出多种计算和存储服务形态。

     神威MPP机硬件系统由高速运算系统、互连网络系统、海量存储系统、维护监控系统、电源系统、冷却系统和结构组装设计等部分组成。软件系统主要包括“神威睿思”操作系统、“神威睿智”编译器、基础库等。


      

      系统投入使用以来,已经成功移植了包括气候气象、海洋科学、新药研制、生物信息、航空航天、工业设计、金融分析等重点应用领域的近二十道万核以上并行规模的实际应用课题,取得若干重大应用成果。

   6神威Cluster是在汇集神威MPP机的技术优点基础上,专门为科学和工程计算领域设计开发的高性能计算平台。在气候气象、海洋环境、数值、风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、芯片设计、动漫设计、工业设计等方面用途广泛。


神威Cluster系统的通用结构如下图:

      

7、安全可信PC
      神威安全可信PC是搭载申威410,针对有较高安全需求的党政军单位,元器件实现100%国产化。内嵌的国产外围套片,集成了符合国家标准的可信密码模块,实现系统内嵌式可信引导和软件系统的可信度量,保证系统的安全可信。

    ......

安全架构如图所示:

      


8、神威云

      神威云是国家并行计算机工程技术研究中心研发的云产品,能够提供丰富的云产品套件、开放的API接口、全面的资源管理平台和运维监视平台,具有强大的虚拟资源池管理能力。神威云平台采用商用服务器、高速网络、高性能存储设备,结合神威云平台系列软件搭建。具有功能强大、性能稳定、安全可靠、简单好用的特点。


      

9、小结

      虽然申威和龙芯一样是走独立自主路线,但申威的道路要比龙芯平坦得多:
      首先,国家对龙芯的投入非常有限,而且龙芯自2010年市场化运营后完全自主经营,自负盈亏。申威是军方项目,不仅不用面对IC设计公司最头痛的技术人才流失问题,还能在人力物力财力可以得到军方充足保障。

      其次,申威有自己的指令集、微结构、CPU、编译器、操作系统就足以在超算领域立足......

      最后,申威是军方项目,而神威超算更是国家级工程,申威的软件和硬件产品完全可以在体制内完成内部循环......

      申威自2003年诞生以来,基于Alpha自主扩展了指令集,共设计了申威1、申威2、申威1600、申威1610、申威5五款芯片,自主研发了神威睿智编译器和神威睿思操作系统,推出了搭载申威芯片的PC、服务器、高性能计算机、超算、防火墙、机架式存储服务器、大规模集群存储系统、瘦客户端、QDR HCA卡、神威云等产品,为国家信息安全和超算建设竭尽所能,圆满完成了国家交付的任务。

(雷锋网特约稿件,未经授权禁止转载。详情见转载须知。)