网上有关“申威1600处理器”话题很是火热,小编也是针对申威1600处理器寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
中国不是没有CPU,国产CPU不光有龙芯,还有众志、申威、飞腾等等,当然大多是基于RISC架构并应用于嵌入式系统中——从这个方面来说,其实美国也有很多产品在用中国的芯片。
目前来说个人认为最好的是申威(SW1600),是Alpha架构上做的改进,国产神威蓝光超级计算机就全部用的SW1600,在超级计算机TOP500中可以排到前20名。
至于金属流片制程方面,中国落后美国约3代的样子,美国现在最新的有22nm制程,中国差不多是80nm制程(大约相当于美国07年的水平)。
至于要说X86架构的处理器,其实不光是中国,除美国以外,日本、欧洲、俄罗斯也没有出X86架构的CPU。反倒是台湾以前还出过X86架构的桌面CPU。
不过个人不看好中国去弄X86。因为桌面X86本身并非战略必需品。中国不是弄不出,而是弄出来,也没有市场竞争的优势。毕竟芯片成本跟良率与产能挂钩,本身市场份额小,意味着成本高,还要给美国交专利费,成本更高。一方面要去跟Intel拼价格,一方面成本又比Intel高,还怎么竞争?日、韩、欧洲不弄X86估计也是同样的原因。
中国能自己制造电脑CPU吗?
2011年10月,国家超级计算济南中心在济南正式揭牌。这是中国首台全部采用国产CPU和系统软件构建的千万亿次计算机系统,标志着中国成为继美国、日本之后能够采用自主CPU构建千万亿次计算机的国家。
据了解,国家超级计算济南中心由山东省科学院建设、运营和维护,今年3月开始建设,近期建成并投入运行。济南中心装配的神威蓝光计算机系统,由国家并行计算机工程技术研究中心研制,系统采用万万亿次架构,全机装配8704片由国家高性能集成电路(上海)设计中心自主研发的“申威1600”处理器,峰位性能达到1.0706千万亿次浮点运算/秒,持续性能为0.796千万亿次浮点运算/秒,运行(LINPACK)效率达到74.4%,性能功耗比超过741百万次浮点运算/秒·瓦,组装密度和性能功耗比居世界先进水平,系统综合水平处于当今世界先进行列。济南中心全部采用国产CPU和系统软件,实现了国家大型关键信息基础设施核心技术的自主可控。
中国《国家中长期科学和技术发展规划纲要》将千万亿次高效能计算机研制列入优先主题,科技部明确提出要掌握千万亿次高效能计算机研制的关键技术,并将“高效能计算机及网格服务环境”列为“十一五”863重大项目。目前,中国已经建成天津、深圳、长沙、济南三个千万亿次超级计算中心。
(注)国际超级计算天津中心、长沙中心、济南中心3家由科技部牵头;深圳中心则由中科院牵头。
近年来,异构超算已经是大势所趋,什么是异构超算
现在中国已经能生产制造电脑的CPU了,龙芯CPU就是中国独立研发制造的。龙芯是中国科学院计算所自主研发的通用CPU,采用简单指令集,类似于MIPS指令集。龙芯1号的频率为266MHz,最早在2002年开始使用。龙芯2号的频率最高为1GHz。龙芯3A是首款国产商用4核处理器,其工作频率为900MHz~1GHz。龙芯3A的峰值计算能力达到16GFLOPS。龙芯3B是首款国产商用8核处理器,主频达到1GHz,支持向量运算加速,峰值计算能力达到128GFLOPS,具有很高的性能功耗比。
2015年3月31日中国发射首枚使用“龙芯”北斗卫星。下面是制造时间和型号:
1.2002年龙芯1号诞生,频率为266MHz。
2.2003年龙芯2号诞生,的频率最高为1GHz。
3.2004年龙芯2C研发成功。
4.2006年,龙芯2号增强型处理器CZ70研发成功。
5.2006年,龙芯2F型处理器研发成功。
6.2009年,我国首款四核CPU龙芯3A研发成功。
6.20011年,龙芯3B和龙芯2H研发成功。
7.2012年,龙芯3B 1500研发成功,实测核心频率1.3GHz - 1.5GHz。
8.2014年,龙芯1C和1D研发成功。
1.先谈谈同构计算和异构计算。同构计算是使用相同类型指令集和体系架构的计算单元组成系统的计算方式。同构超算只单纯使用一种处理器,日本超算“京”只采用的处理器是富士通制造的SPARC64 VIIIfx,神威蓝光只采用了8704片申威1600,Mira和Sequoia(Sequoia采用了约160万个A2处理核心),就只采用了PowerPC A2处理器,这些都没有采用GPU或众核芯片等加速器。日本的京,IBM 的Mira和Sequoia和中国的神威蓝光都是同构超算的代表。
异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU等协处理器、DSP、ASIC、FPGA等。异构计算是一种并行和分布式计算,它或是用能同时支持simd方式和mimd方式的单个独立计算机,或是用由高速网络互连的一组独立计算机来完成计算任务。具体来说,异构计算是在运算中既使用处理器,又使用GPU或众核芯片等加速器。以美国泰坦和中国天河2号为例,泰坦有18688个运算节点,每个运算节点由1个16核心AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成,共计299008个运算核心;
天河2号有16000个计算节点,每个节点由2片Intel的E5 2692和3片Xeon PHI组成,共使用了32000片Intel的E5 2692和48000片Xeon PHI;天河1A使用了14336片Intel Xeon X5670处理器和7168片NVIDIA Tesla M2050高性能计算卡。除了泰坦和天河2号和天河1A之外,曙光6000也是采用了异构计算架构。
(曙光6000)
2.超算的用途
要说异构计算的优势,那就要从超算的用途说起了。
PC在日常使用中,除玩游戏、3D渲染等之外,大多是程序都倚重整数运算性能。
但超算则不同,超算大多应用于科研和军事领域。例如弹道计算、核物理研究、气候气象、海洋环境、数值风洞、碰撞仿真、蛋白质折叠、基因研究、新药研发、分子动力学模拟、量子化学计算、材料科学、动漫设计、工业设计等方面,在运算中更加倚重双精浮点性能,对整数运算性能要求相对较低。这就产生了用加速器提升浮点运算性能的需求。
3.同构超算的高效率
同构超算虽然理论双精浮点性能不如异构超算,但可以获得较高的运行效率。异构超算虽然理论双精浮点性能非常强悍,但运行效率不如同构超算。
(Sequoia,采用PowerPC A2处理器)
举例来说,IBM Mira和Sequoia使用PowerPC A2处理器,效率达85.3%和85.6%。日本的京效率更是高达92.9%。
而异构超算效率普遍不高,采用E5和XeonPHI的天河2号和Stampede效率为61.7%、60.7%。采用AMD Opteron 6274和NVIDIA Tesla K20的Titan效率为64.9%。
天河2号和Stampede效率不高的一个重要因素就是Xeon PHI的浮点运算效率较低。在谈这个问题前,先释下linpack测试。
(Stampede)
衡量芯片性能的一个重要指标就是计算峰值,例如浮点计算峰值,它是指计算机每秒钟能完成的浮点计算最大次数。包括理论浮点峰值和实测浮点峰值:
理论浮点峰值是该计算机理论上能达到的每秒钟能完成浮点计算最大次数。
理论浮点峰值=CPU主频×CPU每个时钟周期执行浮点运算的次数×系统中CPU核心数目。
实测浮点峰值是指Linpack测试值,也就是说在这台机器上运行Linpack测试程序,通过各种调优方法得到的最优的测试结果。
在实际程序运行过程中,几乎不可能长时间维持在实测浮点峰值,理论浮点峰值更是仅仅存在于纸面上的数据。理论浮点峰值和实测浮点峰值只是作为衡量机器性能的一个指标,用来表明机器处理能力的一个标尺和潜能的度量。
回归正题,Xeon PHI在运行linpack测试时,实际性能仅仅相当于理论最大运算性能的百分之六十几,相比之下,申威1600的linpack测试效率远高于Xeon PHI。
但因Xeon PHI的理论浮点性能较高达1T Flop,大大超过申威1600的双精浮点运算的理论峰值,因此即使仅仅只有百分之六十几的效率,实测双精浮点运算性能还是大幅超越申威1600。因而使Xeon PHI得到了国防科大等单位或公司的青睐。
因此,同构超算的效率相对高于异构超算,而天河2号效率偏低的原因更多的是Xeon PHI本身效率较低,不是国防科大的技术问题。
4.同构超算编程更方便
cpu适合做串行,逻辑复杂度高的任务,gpu适合做简单,并行度高的任务,cpu和gpu的编程模型是不一致的;所以异构超算在编程方面就不太容易,比如使用amd的apu和nvidia的cpu+gpgpu在编程上就不如同构超算方便。另外,gpgpu作为加速卡和cpu是不共享内存的,需要程序员显式拷贝而导致性能损失。
另外,因软件方面的原因,异构超算的通用性相对于同构超算有所不如,举例来说,GPGPU只能跑OPEN CL、OPEN ACC代码,不能跑OPENMP代码。
5.异构计算的优势
以天河2号的一个计算节点为例:
Xeon E5的满载功耗达145W,双精浮点为0.21T Flops,而Xeon PHI功耗300W,双精浮点达1T Flops。
天河2号一个计算节点由2片Xeon E5和3片Xeon PHI,理论双精浮点性能为3.2T Flops,功耗为1190W,理论双精浮点性能与功耗的比值为2.87GFlops/W。相同功耗下使用8片Xeon E5只能获得1696Gflops的理论双精浮点性能,理论双精浮点性能与功耗的比值为1.42GFlops/W。从数据可以看出,在同等功耗下,在使用Xeon PHI加速后,理论双精浮点性能与是只使用Xeon E5的2倍。
因此,相同功耗的情况下,异构超算能获得非常高的理论双精浮点性能。
综上所述,同构超算的编程方便,效率高,通用性强。异构超算编程麻烦,效率不如同构超算,通用性差,性能功耗比高。异构超算虽然在通用性和效率方面相比同构超算处于劣势,但更加好的性能功耗比使其成为更受偏爱的原因。
关于“申威1600处理器”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[访客]投稿,不代表汇盛号立场,如若转载,请注明出处:https://www.hs59.cn/hs/428.html
评论列表(3条)
我是汇盛号的签约作者“访客”
本文概览:网上有关“申威1600处理器”话题很是火热,小编也是针对申威1600处理器寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。中国不是没有C...
文章不错《申威1600处理器》内容很有帮助