『银河』『天河』:让五星红旗插上世界超算之巅

图片 14

图片 1

图片 2

1978年,邓小平把研制我国第一台巨型计算机的任务郑重交给国防科技大学。40年来,国防科大的科研人员不辱使命、勇攀高峰,从“银河”实现我国巨型机零的突破,到“天河”在世界超算速度称雄,从“跟跑”到“领跑”书写下中国科技发展的一个又一个辉煌。
:从”银河”到”天河”–中国高性能计算机问鼎之路

资料图:2018年5月17日在天津梅江会展中心展出的“天河三号”原型机。(新华社记者
李然 摄)(拖拽图片可查看大图)

从“银河”实现我国巨型机“零”的突破,到“天河”超级计算机多次排名世界超算榜首,40多年来,国防科大科研人员充分发扬“银河精神”,在中国科技发展之路上书写了一个又一个辉煌——

图片 3

(中国青年报7月8日)“‘天河’新一代百亿亿次(E级)超级计算机将于2021年前后研制完成。”这是7月6日在天津举行的“纪念中国超算四十年暨国家超算天津中心成立十周年”大会上对外公布的消息。

『银河』『天河』:让五星红旗插上世界超算之巅

见证人:国防科技大学计算机科研团队

在世界上最快超级计算机的争夺战中,E级超级计算机是各国新一代超算角逐的焦点。即将问世的“天河”新一代E级计算机将向世界冠军宝座发起冲击。中国超算已走过四十年,人工智能、大数据时代接踵而来,中国超算发展将何去何从?此次大会吸引了超级计算、人工智能等前沿信息技术领域的著名专家学者,以及政府、资本、科研等多领域的代表共聚一堂,为中国超算发展与高性能计算应用出谋划策。

天河二号超级计算机机房。(资料图片) 何书远 摄

图片 4

■中国建成6个国家级超算中心 13次拿下世界第一

8月盛夏,位于湘江之滨的国家超级计算长沙中心,由国防科技大学研发的“天河”系列超级计算机运算正酣。2000万亿次每秒的峰值计算能力,相当于5万台个人计算机同时计算,为科学研究、信息服务、装备制造等领域发展提供强大支撑,产生了重要的应用效益。

92岁高龄的胡守仁教授

超级计算机体现着一国在全球信息技术竞争中的强国地位,是支撑综合国力提升的国之重器。时至今日,中国超级计算机的研制、创新、应用发展,经历了从无到有、从跟跑到领先的四十年“超常速”发展。

超级计算机是一个国家科技水平和战略能力的重要标志。从“银河”实现我国巨型机“零”的突破,到“天河”超级计算机多次问鼎世界超算之巅,41年来,国防科大的科研人员胸怀祖国,不畏艰难,自主创新,勇攀高峰,在中国科技发展之路上书写了一个又一个的辉煌。

今年92岁高龄的国防科技大学教授胡守仁,头发花白,面容慈祥,是我国“银河”亿次巨型机研制者之一。老人回忆,改革开放之前,由于我国没有巨型计算机,勘探石油和矿藏数据不得不用飞机送到国外去计算处理,不仅费用昂贵,而且数据首先要被外国专家掌握。受制于人的窘境至今让胡老感慨不已。
胡守仁:“我们国家的计算机搞得比西方国家晚好多年,国际上是1946年第一台计算机就研制出来了,我们是1958年开始研制计算机,差距是比较大的,而计算机很重要,不管是搞经济、军事、文化各个方面,都需要计算机。”

1978年,中国启动首台巨型机“银河-I”研制;2010年,“天河一号”首次摘下全球超级计算机500强榜单第一名。近十年来,天津、深圳、济南、长沙、广州和无锡6家国家级超算中心相继落成。“天河一号”、“神威蓝光”、曙光“星云”、“天河二号”、“太湖之光”等超级计算机先后登上世界顶级超算阵容。如今,中国已成为世界上超级计算机数量最多的国家。

“银河”诞生:中国巨型机研制实现“零”的突破

图片 5

国家超算天津中心主任刘光明说:“中国累计拿了13次世界第一,超算已经成了除高铁、航天之外,中国向世界展示的第三张名片。”

今天的辉煌,源于昨天的屈辱。

1946年2月14日,世界第一台计算机问世

纪念大会现场,很多亲历了中国超算事业发展历程的专家学者,回首四十年筚路蓝缕,感慨万千。上世纪70年代,自超级计算机问世以来,国际上对超级计算机的需求激增,中长期天气预报、航空航天、核爆模拟、石油地震勘探等重大创新和产业领域利用超级计算机不断取得突破。而当时,国际上对我国也开始技术封锁。

上世纪70年代,高性能计算成为推动科技创新和经济社会发展的战略高技术。然而,由于没有自己的巨型计算机,中国在经济社会发展当中常常受制于人。勘探出来的矿藏、石油数据资料,得送到国外去处理,不但花费昂贵,而且数据首先要被外国专家掌握。

为加速关键领域科研进展,我国曾花巨额外汇从某国购进一台巨型计算机,然而对方提出苛刻条件,要给计算机建造一个“安全区”,中国人无权靠近这个用人民血汗钱换来的核心设备。
胡守仁:“有一个条件,要在你的机房里搞一个‘小房子’。我们的人不能进去,我们使用的情况他们却都掌握了,这些人的费用还是我们出的。你看气不气人啊!”
1978年年底,伴随着改革开放脚步,科学的春天到来了。在中央召开的一次重要会议上,邓小平同志提出:“中国要搞四个现代化,不能没有巨型机!”年过半百的慈云桂教授代表国防科技大学计算机科研团队,拍着胸脯接过任务,并立下军令状。
国防科技大学张民选教授:“当时,邓小平同志就跟张爱萍讲,巨型机就由你们做算了,但是要签个字,也就是要签个军令状,然后张爱萍一个电话就把慈云桂叫过去了,连夜就赶到北京,他表个态,就这样给国防科技大学了。”

1978年,我国启动巨型计算机研制工程,由于当时技术基础、生产工艺等都与先进国家存在巨大差距,要把计算速度提升到每秒一亿次,困难重重。时任国防科大计算机研究所所长的慈云桂当时已满60岁,他立下军令状:“就是豁出我这条老命,也一定要把我们自己的巨型机搞出来!”五年后,研发团队突破关键技术、完成整体设计,把整机系统的250万个焊点一个个焊起来,“银河-Ⅰ”巨型计算机最终研制成功,中国成为世界上少数几个能研制亿次巨型机的国家。

“中国要搞四个现代化,不能没有巨型机!”1978年,在中央召开的一次重要会议上,邓小平同志的话掷地有声。就是在这次会议上,我国决定自主研制巨型机,以解决现代化建设中的大型科学计算问题。邓小平同志郑重地将这一重任交给了国防科大。

图片 6

  • 上一页
  • 1
  • 2
  • 3
  • 下一页
  • 阅读全文

当时,国防科大虽是国内最早研制计算机的单位,但此前研制的“151”计算机,运算速度只有每秒100万次,如今要研制每秒运算1亿次的机器,意味着运算速度要提高100倍,技术难度可想而知。

张民选教授今年64岁,“银河-Ⅰ”巨型计算机项目启动时,刚刚走出大学校门,意气风发。根据组织安排,他参与了主机设计工作。
当时,我国工业基础薄弱,加工设备简陋,元器件落后。在这样的条件下,整个科研团队设计巨型机的艰难程度可见一斑。
张民选:“那个时候,搞硬件的人靠画图,电路是一个一个画出来的,现在写一句话就行了,那个时候画图画半个月。从小规模集成电路开始设计,先画图,三极管、二极管,把集成电路做出来,再用这几种电路做计算机。”

“为中华民族争光!”面对前所未有的困难,科研人员们憋足了一股劲:豁出命也要搞出巨型机来,不让外国人卡我们的脖子。

图片 7

“那真是一段耐着性子却激情燃烧的岁月。”回忆当时的情景,今年78岁的国防科大计算机学院教授李思昆感慨道。研制工作展开之后,各种复杂技术问题随之冒了出来。走什么样的技术路线?采取什么样的体系结构?如何实现每秒一亿次的运算速度……问题像一个个“拦路虎”。科研人员们迎难而上,把实验室当战场,夜以继日地进行着这场没有硝烟的战斗。

“银河-Ⅰ”巨型计算机

改革开放之初,我国工业基础薄弱,加工设备简陋,元器件落后,在这样的条件下,设计巨型机的艰难程度可见一斑。

改革开放后,部分元器件可以进口。这让整天趴在桌子上面画图搞设计的张民选看到了新机遇。
张民选:“以前的存储器是磁芯的,做起来很难,弄起来也很慢,国际上已经有半导体的东西了,做到集成电路里面一块,一块里面就很大的容量。我们采取引进的思路,用了半导体存储器。这是利用了改革开放的优势。”

李思昆回忆说,比如做计算机硬件的电路设计,当时纯靠一个一个在纸上画出来,画错了又得重新再来。一个小规模的集成电路设计,光画图就得半个月。

图片 8

为了赶进度,大家吃在工厂,睡在机房,晚上至少工作到12点。当时,加班费一个晚上两毛钱,却没一个人愿意领。大家心里想的是省下每一分钱,尽快造出中国的巨型机。

6年研制时间,一天不能拖延;运算速度每秒1亿次,一次也不能少……面对严格的时间表和硬指标,张民选和战友们在挫折中寻找突破。
张民选:“设计的时间长,技术工作量也大,天天上班,晚上一般到10点半,最后争取了两毛八还是三毛二的补贴,没发钱,为了使大家身体好一些,做一碗水饺,就在食堂里面搞个夜宵。”
张民选教授和“银河-Ⅰ”攻关团队的同事们闯过了理论、技术和工艺方面的一个个难关,最终提前一年完成研制任务。
张民选:“鉴定的时候非常严格,要运行很长时间,连续运行还不能出错,每次都是人工关机的,可靠性非常高,再就是软件开发,跟用户紧密结合。”
1983年12月26日,我国第一台亿次巨型计算机通过国家技术鉴定,并命名为“银河-I”。这标志着:中国成为继美国、日本之后第3个能独立设计和制造巨型计算机的国家。

天道酬勤!5年没日没夜的顽强拼搏,以慈云桂教授为代表的科研人员,闯过了一个个理论、技术和工艺难关,创造性地提出了“双向量阵列”结构,大大提高机器的运算速度,提前1年完成了研制任务,且经费只用了原计划的五分之一。

图片 9

1983年11月26日,我国首台每秒运算1亿次的巨型计算机顺利通过了国家技术鉴定,标志着中国在巨型机研制领域实现了“零”的突破,成为当时继美、日之后,能独立设计和制造巨型机的国家。

1984国庆35周年阅兵现场

时任国防科委主任的张爱萍将军为巨型机挥笔命名为“银河”,并赋诗一首:“亿万星辰汇银河,世人难知有几多。神机妙算巧安排,笑向繁星任高歌。”

1984年10月1日,在新中国成立35周年国庆大典上,我国首台“银河”巨型计算机模型受阅通过天安门广场,向全世界展示中国科研的最新成果。
从“银河-Ⅰ”研发团队中的年轻一代,到全程参与、见证国防科技大学“天河”事业,张民选也由普通设计师成长为主管设计师、副总设计师、副总设计师兼总质量师。他说,是改革开放的好时代给了自己机会和平台。
张民选:“研制‘银河-Ⅰ’的时候,我相当于辅助设计师。研制‘银河-Ⅱ’的时候,我相当于是浮点部件的主管设计师。在‘银河-Ⅲ’的时候,体系结构要变,人员相当于换代了,我是副总设计师,能够给国家干一个重点项目,很光荣。”
此后,“银河-Ⅱ”十亿次、“银河-Ⅲ”百亿次巨型计算机相继问世并投入应用,有力推动了我国石油和地质勘探、中长期天气数值预报、卫星图像处理以及国防等领域的现代化建设。

此后,他们又依靠自主创新,相继研制出“银河-Ⅱ”“银河-III”等一系列巨型机,一步步将我国高性能计算机研制技术推向国际前沿,经济社会发展中一系列迫在眉睫的问题也逐渐解决。

图片 10

1997年6月,当运算速度为每秒130亿次的“银河-III”研制成功后,国家气象局以此来做中长期数值预报系统,对于天气的预报由以前提前两三天推进到提前7天左右。

1983年12月22日,我国第一台每秒钟运算达1亿次以上的计算机——“银河”在长沙研制成功。

“天河”问世:中国超算研制水平跻身世界前列

面对成绩和荣誉,张民选经常想起那些倒下的战友:43岁的蹇贤福倒在了工作岗位上,年仅35岁的俞午龙牺牲在出差路途中,还有40岁的张树生、41岁的王育民、49岁的钟士熙……为银河事业献出了宝贵的生命。
张民选:“在‘银河-Ⅱ’研制期间,大家把‘银河精神’提炼成了16个字,就是‘胸怀祖国、团结协作、志在高峰、奋勇拼搏’,激励大家要为祖国增光,无私奉献出自己的聪明才智。”
作为吸吮着“银河精神”乳汁成长起来的新生代,计算机研究所副所长杨灿群1995年从国防科技大学一毕业,就加入了“银河-Ⅲ”研发团队。2006年,他接过老一辈“银河人”手中的接力棒,开始带队伍,挑起了“天河一号”关键创新技术的研发重担。
杨灿群:“当时总师组给了我一个任务,想把GPU用起来做科学计算,我就带着这个小团队钻得很深,进一步地把相关的软件硬件的基础全部给补起来。”

进入新世纪后,我国各项事业进入高速发展时期,对高性能计算机的运算速度和容量都有了更迫切的需求。但与发达国家相比,我国不仅在计算能力上相差一个量级,装机数量也相去甚远。

图片 11

国防科大再次受命担负重任,吹响了攀登世界科技高峰的冲锋号——早日研制出我国的千万亿次超级计算机系统。

“天河一号”超级计算机满负荷运行

世界超级计算机的发展表明,计算能力每提高一个量级,都需要体系结构的创新和一系列关键技术的新突破。彼时,国防科大虽然具有较为雄厚的技术积累和丰富的工程实践经验,但要实现从百万亿次到千万亿次的技术跨越,同样困难重重。

“天河一号”超级计算机最大的创新就是在国际上首创“微处理器”+“加速器”相结合的“异构融合”计算体系结构。为了优化加速器性能,杨灿群带领团队夜以继日泡在机房,满脑子都想着密密麻麻的代码。
杨灿群:“性能有没有办法提高,晚上闭上眼睛也在想,躺在床上这个数据好像也在脑子里滚动,觉得CPU那个值是不对的,就想起来证实一下。当时查出来CPU还有一个核没用好,再把CPU这个值由20多调到30,这样整个效率就高了。”
历时4年,数万次实验,杨灿群和战友们把我国首台千万亿次超级计算机系统“天河一号”推上世界超算舞台中央,以每秒钟1206万亿次的峰值运算速度夺得世界第一。
杨灿群:“最后是10月底提交的数据,后面就是等着排名,后来得到这个消息了,确实世界第一了,至少觉得自己没有白费力气,这个世界第一还是我们干出来的,确实是挺自豪的,大家那段时间过的苦日子也觉得很值,对外面也可以拍着胸脯说,这个系统是我们做的!”

面对多方面的技术难题与严峻挑战,科研人员群策群力,自主创新,努力攻克核心关键技术,推动我国高性能计算事业向前发展。

图片 12

“天河”超级计算机之所以拥有全球最快的运算性能,其奥秘就在于它独创的CPU+GPU异构体系结构。然而,这一全新的异构体系在创建过程中,遇到了一系列重大技术瓶颈。

然而,“天河一号”世界冠军的光环只保留8个月,排名就滑落到第8名。久经考验的杨灿群坚信,中国超算速度绝不是昙花一现。经过改进,两年之后,“天河二号”的超算速度重返世界之巅,并且连续6次蝉联冠军。
面对成功,杨灿群内心平静,因为世界超算领域竞争激烈,稍稍松口气就会被一些大国赶超。他和战友早已把目光瞄准了“天河二号”升级任务。
可是,时间不长,坏消息突然传来。一批国外进口的商用元器件遭遇禁运。
杨灿群:“不能说是禁运,我们就干不成了,当时我们大家也觉得,这是一件好事,倒逼着我们必须有志气,逼着我们进步。我们当时规划需要两年时间,要自己研制加速器,最复杂的还有,上面配套的软件要做完。”
这套软件最大的开发难度在于,没有加速器实体平台可依托。作为负责人,杨灿群提出,首先构建模拟环境,再编写代码。
杨灿群:“我们的加速器也在研制中。我要做软件必须要有一个模拟平台,编代码不行。我要试我的设计方案对不对,能不能运行。这里面存在代码复杂、代码层次多、代码规模大等很多困难。我们过去对‘异构’技术有些积累,再想一些办法构建模拟环境,到2017年用自主加速器就把这个系统给构建完成了。”
顺利升级后的“天河二号”超级计算机,运算速度超过10亿亿次。这标志着我国掌握了自主研制超级计算机的关键核心技术。

“天河”超级计算机副总设计师杨灿群教授回忆说,GPU的特点是进行图形和视频处理,要将它和擅长运算的CPU组合在一起进行计算,不仅编程很难,计算效率也很低,国际上公认的计算效率最高只有20%。

图片 13

创新的关键,就在于怎样把“不可能”变为“可能”,在没有路的地方走出一条路。

从参与“银河-Ⅱ”研究,到成为“天河二号”项目总设计师,国防科技大学计算机学院院长廖湘科院士也见证了中国高性能计算机的问鼎之路。他说,比运算速度更重要的是应用。如今,以“天河”超级计算机为业务主机的国家天津、广州、长沙三大超算中心已经构建起六大应用服务平台,为国内外1000多家用户提供高性能计算和云计算服务,支撑2000多项重点课题研究。
廖湘科:“包括现在一些药物的研制,进度之所以比较快,也是用的高性能计算;现在我们城市的管理,比如说智能调度、摄像头、天眼的很多管理,它也用的高性能计算。所以我们现在城市管理水平的提升,也是跟这个有很大的关系。目前实际上来讲,超算的应用领域和我们老百姓的生活已经是息息相关。”

“早上一起床就开始干,一干就是一整天,晚上睡觉一闭上眼睛,屏幕上的数据还在脑海里滚动。”杨灿群和课题组成员开始了长达4个月的攻关,在经过了8万多次实验与性能优化后,终于找到突破口,使GPU的计算效率达到了70%,创造了一个世界奇迹。

图片 14

超级计算机系统要实现每秒运算千万亿次,还必须有一个快捷通畅的网络系统,让各种信息“跑得快”。他们为此设计了一种新型交换机的方案,但美国的芯片制造商不肯支持,要求按照美国人的方案设计。可如此一来,成功虽有把握,却没有了创新和优势。

40年来,伴随着改革开放的脚步,我国高性能计算技术实现了从“跟跑”到“领跑”的历史跨越,像“80后”科研骨干王睿伯一样的新一代也快速成长起来,扛起“银河精神”战旗,朝着科技领域的一个又一个高峰发起冲锋。
“我们有信心推进下一代E级超级计算机的研制。既然选择了做高性能计算机,那就要把全链条做好,一方面是向前冲,就是瞄准前沿技术,在关键技术上实现突破,做国际领先,因为我们已经是国际一流水平,至少是继续保持国际一流水平。”

国防科大的研究团队不信邪。他们坚持走自己的设计路线,从头探索,努力攻关。仅用10个月时间,一款新型交换机研制完成,实测技术指标大大超过同类系统,而成本仅是同类同规模产品的80%。

随着一系列关键技术的突破与工程实现,2009年10月29日,我国首台千万亿次超级计算机“天河一号”研制成功,实现了我国自主研制超级计算机能力从百万亿次到千万亿次的跨越,成为继美国之后世界上第二个能够研制千万亿次超级计算机系统的国家。

面对超算领域的激烈竞争,国防科大的科研人员并没有陶醉在成功的喜悦之中,而是迅速组织开展技术升级与综合优化,着手扩建二期系统。

2010年11月17日,“天河一号A”超级计算机,以峰值速度4700万亿次、持续2566万亿次浮点运算每秒的优异性能,荣登第36届世界超级计算机500强排行榜榜首。

中国人首次将五星红旗插上了超级计算的世界之巅,标志着中国自主研制超级计算机综合技术水平进入世界领先行列。

2013年6月17日,他们研制的“天河二号”又以每秒5.49亿亿次的峰值计算速度和每秒3.39亿亿次实测计算速度,再次登上全球超算500强榜首。此后,“天河二号”连续6次位居世界超算榜首。

去年7月下旬,国防科大再传喜讯,由该校牵头研制的“E级原型机系统”完成研制部署并通过验收,标志着我国向新一代百亿亿次(E级)超级计算机发起了冲锋。

“银河精神”:铸就中国科技辉煌的“根”和“魂”

“胸怀祖国、团结协作、志在高峰、奋勇拼搏”,在国防科大计算机学院院史馆醒目位置的16个大字,浓缩了国防科大一代代“银河人”的艰苦探索,揭示了从“银河”到“天河”的成功真谛。在他们心中,“银河精神”,是他们坚守的精神高地,更是他们的“根”和“魂”。

几十年来,国防科大的科研团队牺牲了假日的悠闲,舍弃了家庭的温馨,推迟了婚期,耽误了治病,放弃了出国深造,许多人把青春甚至生命无怨无悔地献给了祖国的超算研制事业。

“天河一号”有一位副总设计师,患有糖尿病等多种疾病。在“天河一号”二期系统安装调试期间,他在机房里整整坚守了半年时间。生活、饮食不规律导致他的病情不断加重,但他坚持不离开岗位。直至从美国传来“天河一号”首次登上世界超算排名榜首的消息,他才走出机房,住进医院。

为设计出高水平的计算机运算控制系统,青年讲师俞午龙连续5天5夜没合眼。第六天深夜,从梦中醒来的妻子发现他还在着魔似的伏案工作,一把抢过书桌上的图纸说:“你再这样拼下去,我就把这些图纸剪碎了!”第二天一早,俞午龙又出差去了黄山。谁也没想到,他病倒在黄山脚下,再也没能回来。

还有43岁的蹇贤福、40岁的张树生、41岁的王育民……在国防科大,仅为“银河”系列巨型机事业而献出年轻生命的科研人员就有20多人。他们以事业丈量生命,化作一块块基石,托举起中国科技腾飞的梦想。

艰难困苦,玉汝于成!

通信光纤铺设,是“天河一号”二期系统进驻国家超算天津中心的首期工程,时间紧迫、任务艰巨。时值盛夏,由于沟槽温度高达40多摄氏度,水泥表层太粗糙,刚铺下的光纤的绝缘胶皮被磨出了道道裂痕,个别地方还露出线芯。这个问题不解决,轻则信号中断、通信短路,重则导致系统紊乱。

面对这种境况,指挥员把衣裤一脱,跳进闷热的沟槽,俯卧在粗糙的水泥地上。大家纷纷效仿,很快铺就了一条“人肉地毯”,一根根光纤顺着官兵的身躯通畅地向前延伸。

几十个人在沟槽里赤身裸背趴了数十天,被坚硬的水泥地和光纤刮擦得遍体鳞伤,使15000根光纤毫发无损。系统试机那天,打开机器的一瞬,全部通信线路畅通无阻……

“正是这种在披荆斩棘、攻坚克难中形成的‘银河’精神,书写出了中国特色自主创新之路的辉煌。”年逾六旬的国防科大计算机研究所胡庆丰教授欣慰地对记者说。

链接

目前,天河超级计算机系统在国家超级计算天津中心、国家超级计算广州中心和国家超级计算长沙中心使用。

其中,长沙中心是我国中西部地区唯一的国家级超级计算中心,拥有“天河一号”超级计算机,以及“天河·天马”人工智能计算集群,“天河三号”也将于2020年落户该中心。依托天河超级计算机系统,目前中心已形成集“科技研发、技术创新、公共服务、人才培养”于一体的产学研用的融合创新应用服务平台:支撑国家和湖南科技创新,共为1205家用户提供高性能计算、大数据、云计算及人工智能等服务,支撑国家级科研项目142项,其他省部级科研项目及企业合作项目430余项;创新服务模式,成立了多个超算分中心、行业联合实验室、产业园区超算服务站等;构建了企业大数据、金融风控、中小企业超算社区、仿真模拟服务、视频文创等各类创新平台,服务全行业发展;紧盯国际、国家科技前沿,建设科普基地、“超算之星”众创空间,助力湖南及中西部地区的科技创新和人才培养。

亲历者说

超前布局 自主创新

口述者:“银河”/“天河”新一代高性能计算机互连系统副主任设计师 董德尊

我从2010年博士毕业留校开始,一直在国防科大计算机学院计算机研究所604研究室工作。

604研究室是一个有着悠久辉煌历史和光荣传统的研究集体,一直是“银河”“天河”高性能计算机系统研制的关键技术团队。我有幸伴随集体,经历了“天河二号”研制周期的全过程。

“银河”“天河”团队在高性能计算系统研发上一直是紧跟国际前沿,超前谋划,利用技术进步推动应用的发展。实际上,2010年底“天河一号”首次获得世界超算排名第一之际,“天河”总师组就已经开始谋划“天河二号”的工作。

在“天河二号”项目初期,我就参与了项目论证工作,同时作为高速互连系统的参研人员,经历了数不清的互连分系统的项目讨论、集中封闭开发、全系统调试等工作。特别是2013年上半年,我们为了赶进度,24小时倒班进行全系统调试,大家晚上经常在机房和调试间打地铺睡觉。当时是五六月份,长沙已经开始热起来,国防科大的供电系统由于重点保障“天河”调机,全校的办公室空调都停掉了,但我们所在的调试机房却极其凉快,这也算是调机带来的一个“福利”吧。

在参与“天河”互连系统论证和研制过程中,我体会到“天河”团队对基础研究的重视,以及勇于自主创新的精神。高性能计算机系统的研制,特别强调硬件、软件协同设计方法学,而协同设计方法学的有效性,依赖于对硬件—软件—应用的改变具有持续的性能评估能力。在“天河一号”项目后期,我们互连团队就开始布局开发针对“天河”系统自主的协同设计工具。

到目前为止,经过8年多的持续自主开发,我们已经突破了应用驱动的大规模高性能互连网络性能评测等关键技术,研制出支持真实应用负载、网络功能模型精确、可扩展性好的大规模高性能互连网络模拟仿真软件,填补了“天河”团队乃至我国在该领域的长期空白,为“天河”高性能互连通信网络持续保持国际领先,提供了有力的自主设计工具。

(文/施泉江 刘文韬 韩雪)

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注