• 中國(guó)臺(tái)灣網(wǎng)移動(dòng)版

    中國(guó)臺(tái)灣網(wǎng)移動(dòng)版

造芯、筑魂、創(chuàng)“天河” 他們書寫超算中國(guó)速度

2021-03-15 08:41:00
來(lái)源:科技日?qǐng)?bào)
字號(hào)

  黑色機(jī)柜被整齊排成數(shù)行,高速運(yùn)轉(zhuǎn)的機(jī)器持續(xù)發(fā)出低沉的嗡鳴聲,星星點(diǎn)點(diǎn)的負(fù)載指示燈不斷閃爍……這里是“天河二號(hào)”的機(jī)房,碩大的超級(jí)計(jì)算機(jī)正在飛速運(yùn)行。

  過(guò)去的一年,新冠肺炎疫情席卷全球,來(lái)勢(shì)洶洶。憑借超強(qiáng)算力,“天河二號(hào)”助力藥物虛擬篩選,只用了3天時(shí)間便迅速定位了30余種潛在有效藥物。在“天河二號(hào)”上搭建的新冠肺炎CT影像智能診斷平臺(tái),15秒即可完成一次CT圖像診斷,為抗擊疫情作出了重大貢獻(xiàn)。

  作為幕后功臣,國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院“天河”高性能計(jì)算團(tuán)隊(duì)(以下簡(jiǎn)稱“天河”團(tuán)隊(duì))功不可沒。在剛剛過(guò)去的春節(jié)假期,團(tuán)隊(duì)上下60余人堅(jiān)守崗位,以這樣特殊的方式為祖國(guó)守歲。

  肖立權(quán):用光互聯(lián)替代電互聯(lián)

  肖立權(quán),“天河二號(hào)”副總設(shè)計(jì)師、“天河”團(tuán)隊(duì)互聯(lián)通信方向負(fù)責(zé)人。

  我國(guó)高性能計(jì)算起步較晚,要想趕上西方國(guó)家,唯有奮起直追。為了讓我國(guó)高性能計(jì)算早日趕超西方國(guó)家,肖立權(quán)一拼就是30年。

  “走別人沒有走過(guò)的路很難,但我喜歡挑戰(zhàn)!”這是肖立權(quán)常說(shuō)的一句話。20世紀(jì)末,大規(guī)模計(jì)算機(jī)系統(tǒng)中通常采用電互聯(lián)技術(shù),信息傳輸速率慢且易受干擾,影響系統(tǒng)穩(wěn)定性。這是我國(guó)研制千萬(wàn)億次級(jí)超級(jí)計(jì)算機(jī)路上的一塊“絆腳石”。

  搬開這塊“絆腳石”的最優(yōu)解決方案,就是用光互聯(lián)替代電互聯(lián),上級(jí)將這一重任交給了肖立權(quán)。

  這條別人沒有走過(guò)的路,注定充滿坎坷。接下任務(wù)后,肖立權(quán)立即著手解決這項(xiàng)技術(shù)難題。然而,按照他的思路做出來(lái)的系統(tǒng)根本“跑不起來(lái)”。

  “是哪里出了問題?”肖立權(quán)滿腦子都是問號(hào),午休時(shí)閉上眼睛,他腦海中全是屏幕上滾動(dòng)的數(shù)據(jù)。

  “沒法睡!去實(shí)驗(yàn)室!”架起示波器、邏輯分析儀,肖立權(quán)全神貫注地看著屏幕,生怕錯(cuò)過(guò)關(guān)鍵數(shù)據(jù)。

  解決方案被一次次提出,但又被一次次推翻。有一天,肖立權(quán)突然冒出一個(gè)想法:是不是數(shù)據(jù)傳輸有問題?這次靈光突現(xiàn),讓他一下找到了解決問題的“鑰匙”。由此,我國(guó)光互聯(lián)技術(shù)在大規(guī)模計(jì)算機(jī)系統(tǒng)中得到有效驗(yàn)證,這為后續(xù)該技術(shù)在超級(jí)計(jì)算機(jī)系統(tǒng)中的應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。

  2013年,是“天河”團(tuán)隊(duì)發(fā)展歷程中濃墨重彩的一年。當(dāng)年6月,“天河二號(hào)”研制成功,登上了世界超級(jí)計(jì)算機(jī)排行榜的榜首。

  同年11月,為升級(jí)“天河二號(hào)”系統(tǒng),肖立權(quán)和團(tuán)隊(duì)成員展開了為期10個(gè)月的封閉式攻關(guān),力爭(zhēng)完成核心器件國(guó)產(chǎn)化替代。經(jīng)過(guò)這一輪攻關(guān),肖立權(quán)帶領(lǐng)“天河”團(tuán)隊(duì)大幅提升了“天河二號(hào)”高速互聯(lián)通信系統(tǒng)的性能,使其運(yùn)行速度達(dá)到當(dāng)時(shí)國(guó)際商用互聯(lián)系統(tǒng)的2倍,為下一代超級(jí)計(jì)算機(jī)研制奠定了基礎(chǔ)。

  郭揚(yáng):讓國(guó)之重器澎湃“中國(guó)芯”

  “天河二號(hào)”的“成長(zhǎng)環(huán)境”并不十分“友好”,長(zhǎng)久以來(lái),西方國(guó)家在這一領(lǐng)域?qū)ξ覈?guó)實(shí)現(xiàn)嚴(yán)格的技術(shù)封鎖。

  曾有很長(zhǎng)一段時(shí)間,我國(guó)信息系統(tǒng)軟、硬件受制于人的問題難以得到解決。為攻克這一難題,“天河”團(tuán)隊(duì)再次奔赴戰(zhàn)場(chǎng)。

  “天河”團(tuán)隊(duì)微電子方向負(fù)責(zé)人、國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院研究員郭揚(yáng)就是核心芯片這個(gè)戰(zhàn)位上的先鋒。

  芯片制造技術(shù)是制造業(yè)的核心技術(shù),超級(jí)計(jì)算機(jī)所需的芯片更被譽(yù)為“皇冠上的明珠”。為了摘取這顆“明珠”,郭揚(yáng)堅(jiān)守了20余年。今年春節(jié),他依舊堅(jiān)守崗位,在機(jī)柜間不停穿梭。在僅有幾十米寬的機(jī)房里,他每天可以走出數(shù)萬(wàn)步。

  運(yùn)算速度(俗稱算力)和功耗是超級(jí)計(jì)算機(jī)芯片的核心指標(biāo)。通常來(lái)說(shuō),要想實(shí)現(xiàn)更高算力,就需要在芯片中集成更多的晶體管,但這就會(huì)增加芯片面積和功耗。研制超級(jí)計(jì)算機(jī)芯片的難點(diǎn)在于,要在保證高算力的前提下,盡可能減少芯片的功耗。為了早日攻克這一難題,曾有一段時(shí)間,郭揚(yáng)四處奔波,到軍隊(duì)內(nèi)外各地調(diào)研考察,出國(guó)參加學(xué)術(shù)交流活動(dòng),研究業(yè)內(nèi)發(fā)展趨勢(shì),幾經(jīng)周折最終確定了走“基于自主指令集的異構(gòu)融合架構(gòu)”的技術(shù)路線。

  這是一條崎嶇難走的路。研制自主指令集的處理器芯片,意味著研發(fā)團(tuán)隊(duì)不僅要研制芯片,還必須同步研制出配套的編譯器、算法庫(kù)等全套軟件系統(tǒng)。若采用現(xiàn)成的指令集芯片,工作量將減少數(shù)倍。

  “這條路必須走!跟在別人后面、走現(xiàn)成的路,已無(wú)法實(shí)現(xiàn)技術(shù)領(lǐng)先。這條路,我們就算披荊斬棘也要走!”郭揚(yáng)說(shuō)。

  此外,他還帶領(lǐng)團(tuán)隊(duì)攻克了芯片研制中的其他大量技術(shù)難題,在他們的不懈努力下,最終使新一代超算芯片性能比前一代芯片提升了10倍以上。

  20余年,從反向設(shè)計(jì)起步,到正向設(shè)計(jì)前行,再到向自主創(chuàng)新跨越;從架構(gòu)設(shè)計(jì),到前端驗(yàn)證,再到后端實(shí)現(xiàn),郭揚(yáng)和大家一路過(guò)關(guān)斬將,最終孕育出了芯片領(lǐng)域響當(dāng)當(dāng)?shù)摹帮w騰”品牌。

  2017年,“天河二號(hào)”系統(tǒng)升級(jí)完成,當(dāng)時(shí)國(guó)內(nèi)性能最優(yōu)的4000余顆“飛騰”芯片被裝在“天河二號(hào)”的“心臟”部位;在慶祝新中國(guó)成立70周年閱兵式上,嵌有“飛騰”芯片的多款戰(zhàn)機(jī)、導(dǎo)彈在天安門廣場(chǎng)亮相;2020年,北斗三號(hào)組網(wǎng)、嫦娥五號(hào)奔月、“天問一號(hào)”飛赴火星,這些裝備上都鑲嵌著“飛騰”的“中國(guó)芯”。

  “未來(lái),我和團(tuán)隊(duì)還要繼續(xù)努力,讓更多國(guó)之重器澎湃‘中國(guó)芯’!惫鶕P(yáng)說(shuō)。

  譚郁松:實(shí)現(xiàn)國(guó)產(chǎn)系統(tǒng)零的突破

  “飛騰”芯片不是孤軍奮戰(zhàn),“麒麟”操作系統(tǒng)是它的最佳搭檔,它也是“天河二號(hào)”的“靈魂”。它們一硬一軟,為“天河二號(hào)”搭臺(tái)唱戲。今年春節(jié)期間,負(fù)責(zé)系統(tǒng)調(diào)試的人員聚精會(huì)神地盯著屏幕,手指不停地敲擊著鍵盤。

  忙碌之余,“天河”團(tuán)隊(duì)國(guó)產(chǎn)基礎(chǔ)軟件方向負(fù)責(zé)人、國(guó)防科技大學(xué)計(jì)算機(jī)學(xué)院研究員譚郁松說(shuō):“麒麟是中國(guó)的傳統(tǒng)瑞獸,寓意吉祥和長(zhǎng)壽。以它的名字命名,是希望系統(tǒng)能更好地為國(guó)家和人民服務(wù),最終能實(shí)現(xiàn)國(guó)產(chǎn)系統(tǒng)的自主創(chuàng)新和可持續(xù)發(fā)展!

  “麒麟”是為超級(jí)計(jì)算機(jī)研制的服務(wù)器操作系統(tǒng)。其誕生之初,該團(tuán)隊(duì)將這一操作系統(tǒng)和國(guó)際主流操作系統(tǒng)進(jìn)行了比較,而后發(fā)現(xiàn)了不少問題。一時(shí)間,網(wǎng)絡(luò)上的質(zhì)疑聲此起彼伏。

  怎么辦?

  譚郁松覺得,光在實(shí)驗(yàn)室里埋頭搞研究不行,必須要走出實(shí)驗(yàn)室,在實(shí)踐中摸索前進(jìn)。

  當(dāng)時(shí),“麒麟”深陷質(zhì)疑聲中,推廣應(yīng)用十分困難!皠e人不用,我們自己先用。”從2011年開始,譚郁松帶領(lǐng)團(tuán)隊(duì)成員,挨個(gè)給國(guó)防科技大學(xué)學(xué)員做工作,逐一幫助他們?cè)陔娔X上安裝系統(tǒng)。一圈兒下來(lái),超過(guò)3萬(wàn)名學(xué)員的電腦上安裝了“麒麟”系統(tǒng)。系統(tǒng)適配了超過(guò)300多款筆記本終端及外接設(shè)備,為后續(xù)大規(guī)模推廣積累了豐富的經(jīng)驗(yàn)。

  經(jīng)過(guò)反復(fù)推廣、試用、驗(yàn)證、升級(jí),“麒麟”的用戶數(shù)量不斷攀升,連續(xù)多年成為活躍用戶量最多的國(guó)產(chǎn)操作系統(tǒng)。

  成為國(guó)內(nèi)第一,只是第一步,要想趕超,必須爭(zhēng)分奪秒。多年來(lái),對(duì)于譚郁松及其團(tuán)隊(duì)成員來(lái)說(shuō),“5+2”“白+黑”已是常態(tài)。

  在他們的努力下,如今“麒麟”操作系統(tǒng)已經(jīng)成為我國(guó)安全等級(jí)最高、應(yīng)用最廣的國(guó)產(chǎn)操作系統(tǒng),被成功應(yīng)用于各類國(guó)防裝備、重點(diǎn)信息系統(tǒng)上。

  近年來(lái),基于“飛騰”芯片、“麒麟”操作系統(tǒng)的服務(wù)器、臺(tái)式機(jī)、一體機(jī)、筆記本等系列產(chǎn)品,已在一些領(lǐng)域得到規(guī);瘧(yīng)用,為實(shí)現(xiàn)我軍信息系統(tǒng)自主可控、構(gòu)建安全可控的信息技術(shù)體系發(fā)揮了不可替代的重要作用。

  ◎劉于藍(lán) 本報(bào)記者 張 強(qiáng)

[責(zé)任編輯:楊永青]