- · 《计算技术与自动化》栏[08/03]
- · 《计算技术与自动化》刊[08/03]
- · 《计算技术与自动化》征[08/03]
- · 《计算技术与自动化》投[08/03]
- · 《计算技术与自动化》数[08/03]
发展高性能计算需要思考的几个战略性问题(2)
作者:网站采编关键词:
摘要:美国政府2015年发布的“国家战略性计算计划”(NSCI)就是一个较全面的顶层规划,而2016年启动的E级计算机研制计划(ECP)只是美国能源部对NSCI计划的响
美国政府2015年发布的“国家战略性计算计划”(NSCI)就是一个较全面的顶层规划,而2016年启动的E级计算机研制计划(ECP)只是美国能源部对NSCI计划的响应。我国国家重点研发计划中有“E级计算机关键技术验证系统”重点专项,但没有包括其他高端计算级的顶层规划。在我国高通量计算机至今没有重大项目支持,几大网络服务商需要的云计算和数据中心设备基本上是自行设计,并委托其他公司组装。如果长期缺乏全国科技力量的支持,我国网络服务企业将难以形成全球竞争优势。
我国应重点发展什么类型的高性能计算机?
高性能计算机有两种基本类型:一是能力(capability)型,强调解决单一复杂问题的最高计算速度,尽量缩短求解一个最大最难问题的时间;二是容量(capacity)型,强调同时处理多个大任务,每一个任务只用到计算机的一部分能力。全球TOP500超级计算机大多数属于容量型。科学研究对计算能力的需求是无止境的,E级(1018)计算机做出来后,还会提出Z级(1021)计算的需求。研制能力型超级计算机必须突破现有计算机的技术瓶颈,以引领计算机技术的发展,因此。美国的ECP计划的目标是研制能力型计算机。
世界上最高水平的超级计算机,主要用于科学研究,而科学计算在高性能计算机应用中占的比例已不到10%。近几年大数据分析和机器学习等人工智能应用已成为高性能计算机的主要负载,2017年智能应用在中国高性能计算机应用中的占比已提升到56%,估计这个比例今后还将继续扩大。美国、日本等国纷纷将正在研制的超级计算机称为智能计算机。
长期以来,评测超级计算机的性能都采用Lmpack测试程序,这是一个求解线性方程组的程序。这个程序的优点是可扩展性特别好,现在还没找到比它扩展性更好的测试程序。而且Lmpack是CPU密集应用的程序,可以测出几乎满负荷、满功耗下的计算机浮点计算性能。从这个意义上讲,Linpack是测试超级计算机可靠性和稳定性的理想程序。但是,求解线性方程组终究只是一种应用,全面衡量超级计算机的性能需要更合适的基准(benchmark)测试程序,可惜现在还没有。由于功耗的限制,发展通用超级计算机已遇到极大的困难,近年来领域专用超级计算机成为热门研究方向,Linpack显然不适合作为领域专用计算机的测试标准。
我国应重点发展什么类型的高性能计算机,这不是一个学术问题,而是一个科技需求问题,只有通过对我国国防、经济、科研和民生的潜在需求的认真调研才能回答。但有一点可以肯定,容量性超级计算机、智能计算机、领域专用超级计算机与能力型超级计算机一样重要,在做科技决策时应统筹兼顾。把研制E级高性能计算机的全部人力物力都投在争取Lmpack指标世界第一可能是不明智的决策。
中国到底有没有对高性能计算的迫切需求,现在的应用水平怎么样?
从理论上讲,我国对超级计算机肯定有强烈需求。但从实际上讲,这一需求还与一个国家的科研水平、经济水平有关。2018年,中国气象局安装了派—曙光超级计算机,峰值计算性能是8Pflops,计算能力已跃居气象领域世界第3位。众所周知,气象领域是使用超算的大户,目前能正常发挥作用的超级计算机离E级计算还有两个数量级的差距。气象部门要把E级超级计算机用起来,必须在基础研究、算法、软件和人才培养上做出巨大的努力。有人说,先有E级机,才会有E级计算的需求。这是对的,我们需要在E级计算机上培养E级用户。但一台超级计算机的平均有效寿命只有5年,5年内哪些应用领域的用户可以培养出来也需要通过调研做出判断。
我国现有的超算中心究竟应用效益高不高是一个颇有争议的问题。有些超算中心宣称效益非常好,支持了上千项国家重大科技项目,产生了近百亿元经济效益。而媒体上也有文章说超算中心核心应用拓展不够,没有产生预期功效。造成这种局面的原因是缺乏第三方的公正评估。国家应组织有公信力的评测机构或学会对全国的超算中心做一次评估,了解清楚超算中心究竟完成了多少事关国家重大战略需求的计算任务?借助超算做出了哪些重大科学发现?对经济发展做出了哪些不可替代的贡献?P级(1015)以上的计算任务究竟占多大比例?只有按照习近平总书记讲的搞清楚“实事”,掌握了实情,才能对我国超算的实际应用水平做出正确判断。
发展高性能计算要强调应用牵引还是技术驱动?
文章来源:《计算技术与自动化》 网址: http://www.jsjsyzdhzz.cn/qikandaodu/2020/0811/377.html
上一篇:云计算环境下网络安全技术探析
下一篇:基于检修的物料管理系统研究及实现