CFFF(ComputingfortheFutureatFudan),中國高校規(guī)模最大的云上科研智能計(jì)算平臺(tái),于6月27日正式上線。位于內(nèi)蒙古烏蘭察布的“切問”一號和坐落于復(fù)旦大學(xué)江灣校區(qū)的“近思”一號,遠(yuǎn)隔千里,同頻共振。
AI(人工智能)滲透萬物的當(dāng)下,數(shù)學(xué)、物理學(xué)、化學(xué)、生物學(xué)等各傳統(tǒng)科研領(lǐng)域正被快速且深刻地影響?;贑FFF這臺(tái)科研“超級計(jì)算機(jī)”,復(fù)旦人將可以探索過去無法計(jì)算的科研課題,創(chuàng)造全新的科研方法,志之所趨,無遠(yuǎn)弗屆。
如何推動(dòng)基礎(chǔ)研究高質(zhì)量發(fā)展,提升創(chuàng)新策源能級,更好服務(wù)“國之大者”?面對科學(xué)智能(AIforScience)的“時(shí)代之問”,復(fù)旦人對“心有所信,方能行遠(yuǎn)”,有了新的詮釋。
01賦能
轟鳴低沉,燈光跳動(dòng)。
如今,在恒溫恒濕的復(fù)旦大學(xué)高端計(jì)算中心機(jī)房,數(shù)排一人多高的深黑色大鐵箱晝夜不停運(yùn)轉(zhuǎn)。各種數(shù)據(jù)正通過網(wǎng)絡(luò),以超乎想像的速度,奔向復(fù)旦的各個(gè)角落。
在CFFF內(nèi)部測試期,復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院(以下簡稱“AI3院”)漆遠(yuǎn)教授團(tuán)隊(duì)聯(lián)合大氣與海洋科學(xué)系張峰教授團(tuán)隊(duì),共同訓(xùn)練出擁有45億參數(shù)的伏羲氣象大模型。
兩周前,喜訊傳來。該模型實(shí)現(xiàn)未來15天的全球天氣預(yù)報(bào),預(yù)測效果在公開數(shù)據(jù)集上首次達(dá)到業(yè)界領(lǐng)先的ECMWF(歐洲中期天氣預(yù)報(bào)中心)集合平均的水平,并且將預(yù)測速度由數(shù)值模式的小時(shí)級縮短到了3秒內(nèi)。這也是CFFF上誕生的第一個(gè)科研成果。
“基于CFFF平臺(tái)的千卡并行智能計(jì)算,這樣規(guī)模的大模型只用一天就完成了訓(xùn)練,這是傳統(tǒng)計(jì)算平臺(tái)很難做到的?!盇I3院研究員李昊直言。在張峰看來,氣象數(shù)據(jù)作為長時(shí)間序列、多觀測要素的大數(shù)據(jù),是人工智能最好的試驗(yàn)場,CFFF能夠?yàn)闅庀髷?shù)據(jù)在存儲(chǔ)、管理等方面提供支持,促進(jìn)AI技術(shù)在大氣科學(xué)領(lǐng)域的研究及應(yīng)用。
同樣對AI賦能基礎(chǔ)研究充滿期待的,還有中科院院士、計(jì)算凝聚態(tài)物理學(xué)家龔新高教授?!癈FFF剛剛上線,我們一定會(huì)把它用好,讓AI在幫助基礎(chǔ)科學(xué)解決問題的層面上充分發(fā)揮作用?!彼f。
早在2007年,龔新高的老師、計(jì)算物理學(xué)家MicheleParrinello率先將AI技術(shù)應(yīng)用到凝聚態(tài)物理學(xué)研究當(dāng)中。如今,物理學(xué)以及其他很多領(lǐng)域都在嘗試運(yùn)用AI的新方法。
“我們既然是用計(jì)算的方式研究物理,就要用最先進(jìn)的機(jī)器來做計(jì)算。”前不久,龔新高團(tuán)隊(duì)開始借助CFFF重構(gòu)計(jì)算物質(zhì)科學(xué)框架,開展材料量子性質(zhì)預(yù)測,旨在進(jìn)一步揭秘物質(zhì)世界、認(rèn)知物質(zhì)科學(xué)。
對AI在物質(zhì)科學(xué)研究上展現(xiàn)出的巨大潛能,龔新高舉例說:“物質(zhì)世界都是由原子構(gòu)成的,怎樣的排列方式是最優(yōu)解?這是個(gè)非常復(fù)雜的問題。人們過去做了很多努力,但還是只能解決幾十個(gè)原子排列問題,而現(xiàn)在使用AI的辦法,就可以在效率上提高多個(gè)量級?!?br>
他進(jìn)一步發(fā)現(xiàn),AI不僅僅能夠幫助提升效率,更可以完成一些“以前不可能完成的工作”。
02變革
AIforScience,到底意味著什么?
從通過實(shí)驗(yàn)描述自然現(xiàn)象的經(jīng)驗(yàn)范式,到通過模型或歸納進(jìn)行研究的理論范式,到應(yīng)用計(jì)算機(jī)仿真模擬解決學(xué)科問題的計(jì)算范式,再到通過大數(shù)據(jù)分析研究事物內(nèi)在關(guān)系的數(shù)據(jù)范式——傳統(tǒng)科研范式,已經(jīng)歷了四個(gè)階段的演化發(fā)展歷程。
作為科研的第五范式,“AIforScience”將人工智能與各個(gè)科學(xué)領(lǐng)域緊密結(jié)合,創(chuàng)造新的科學(xué)知識和技術(shù)創(chuàng)新,近年在多個(gè)領(lǐng)域取得前所未有的突破。最典型的如AlphaFold2能以驚人速度“解鎖”幾乎所有人類蛋白質(zhì)結(jié)構(gòu)——而在此前,這一問題已困擾人類50多年之久。
“今天的AI好比新時(shí)代的望遠(yuǎn)鏡和顯微鏡,讓我們看到更遠(yuǎn)的地方,也能讓我們看到更小的細(xì)微之處?!逼徇h(yuǎn)打比方道,“在AI賦能科學(xué)研究上,技術(shù)和科學(xué)可謂是我們前進(jìn)的DNA螺旋上雙鏈中的兩個(gè)單鏈,它們互相支撐,共同前進(jìn)?!?br>
工欲善其事,必先利其器。作為基礎(chǔ)研究見長的高等學(xué)府,復(fù)旦大學(xué)搶抓時(shí)機(jī)、持續(xù)投入,聚焦AIforScience范式和“開放科學(xué)”轉(zhuǎn)型,推進(jìn)算力基礎(chǔ)性設(shè)施建設(shè),聯(lián)合阿里云、中國電信建設(shè)CFFF。
談及布局初衷,中科院院士、復(fù)旦大學(xué)校長金力闡釋:“‘單打獨(dú)斗’已不適應(yīng)大科學(xué)時(shí)代的科技創(chuàng)新,我們現(xiàn)在常提‘有組織科研’,其最大優(yōu)勢就在于通過布局建設(shè)大平臺(tái),在重大科學(xué)問題、工程技術(shù)難題和產(chǎn)業(yè)技術(shù)問題領(lǐng)域凝聚資源,形成科研集群力量長時(shí)間持續(xù)攻關(guān)?!?br>
和以往的大科學(xué)裝置或其它典型的科研基礎(chǔ)設(shè)施相比,CFFF不僅是為了解決復(fù)雜的科學(xué)問題而建造,需要高度的專業(yè)知識和技術(shù)、跨領(lǐng)域研究能力,以及大量的資金投入、專業(yè)技術(shù)支持、專門運(yùn)營維護(hù)團(tuán)隊(duì)等,還具有大規(guī)模、高能級的特點(diǎn)。
一方面,CFFF是中國高校規(guī)模最大的云上智算平臺(tái),同時(shí)也是算力第一的異構(gòu)智算集群,可實(shí)現(xiàn)超1000卡并行智能計(jì)算,支持超1000億參數(shù)的大模型訓(xùn)練,在國內(nèi)高校中尚屬首例,將為復(fù)旦的基礎(chǔ)科學(xué)研究提供更強(qiáng)大更穩(wěn)定、更靈活高效低成本的算力支持。
另一方面,CFFF還可提供更大范圍的學(xué)科支撐?!扒袉枴币惶朅IforScience計(jì)算機(jī)群面向全校提供高性能科學(xué)與工程計(jì)算服務(wù),為重點(diǎn)領(lǐng)域提供大規(guī)模計(jì)算和存儲(chǔ)資源;“近思”一號專用高性能計(jì)算機(jī)群可滿足學(xué)校多學(xué)科對于高性能計(jì)算的需求,提升各學(xué)科領(lǐng)域?qū)τ诖笠?guī)模數(shù)據(jù)處理的能力。兩者共同為全校AIforScience的高性能計(jì)算提供強(qiáng)大的計(jì)算資源,支持AI賦能科學(xué)研究的新范式發(fā)展,促進(jìn)基礎(chǔ)學(xué)科及交叉學(xué)科建設(shè)。
對于CFFF的上線,復(fù)旦科研工作者們充滿期待,提出一系列科研目標(biāo)——生命科學(xué)領(lǐng)域,使用AI進(jìn)行表型組學(xué)分析;生物制藥領(lǐng)域,以AI賦能制藥全流程;材料科學(xué)領(lǐng)域,用AI加速第一性原理的計(jì)算,并進(jìn)行材料合成路徑的預(yù)測……
可以想見,這個(gè)強(qiáng)大的科研“加速器”,將在復(fù)旦這片創(chuàng)新沃土催生更多科學(xué)大模型,孕育更多具有影響力的科研成果。
03普惠
AI終究是人類的延伸,將先進(jìn)算力轉(zhuǎn)化為科創(chuàng)能力的關(guān)鍵,仍是我們自己。
目前,復(fù)旦四校區(qū)的所有實(shí)驗(yàn)設(shè)備都能高速接入CFFF平臺(tái)。如何才能讓CFFF更普及、更友好地被使用?
該平臺(tái)將由AI3院負(fù)責(zé)保障和管理。其中,技術(shù)運(yùn)營組負(fù)責(zé)平臺(tái)培訓(xùn)、計(jì)算資源管理和安全運(yùn)營,另有專門團(tuán)隊(duì)負(fù)責(zé)算力優(yōu)化以及和基礎(chǔ)研究團(tuán)隊(duì)對接。除做好技術(shù)支撐外,AI3院還會(huì)為不熟悉AI算法的研究團(tuán)隊(duì)提供架構(gòu)和代碼優(yōu)化服務(wù),協(xié)同提升科研效率。
復(fù)旦大學(xué)化學(xué)系教授劉智攀剛剛開通了平臺(tái)賬號,正與學(xué)生們興致勃勃地研究如何用好這個(gè)新的科研工具。
2005年以來,劉智攀課題組在理論計(jì)算領(lǐng)域發(fā)展了一系列新方法,并開發(fā)了全局神經(jīng)網(wǎng)絡(luò)勢函數(shù)大規(guī)模原子模擬軟件LASP,結(jié)合AI技術(shù)解決復(fù)雜催化問題?!耙郧?,我的研究領(lǐng)域叫理論化學(xué),現(xiàn)在是叫理論計(jì)算化學(xué)。經(jīng)過了幾十年發(fā)展,我們對計(jì)算的需求越來越大?!?br>
為此,課題組已購置許多計(jì)算機(jī),也外購其他平臺(tái)的計(jì)算資源?!艾F(xiàn)在,復(fù)旦搭建了CFFF這個(gè)優(yōu)質(zhì)平臺(tái),提供好的計(jì)算資源,將對我們的研究有極大的促進(jìn)作用?!眲⒅桥势诖磥淼幕瘜W(xué)研究,不用再重復(fù)做實(shí)驗(yàn),枯燥的體力活被AI取代,點(diǎn)點(diǎn)鼠標(biāo)就能得出結(jié)果。
AI時(shí)代,是否只有自然科學(xué)才需要算力?答案是否定的。
近年來,“因果推斷”逐漸興起并被廣泛應(yīng)用于社會(huì)科學(xué)研究領(lǐng)域,越來越多學(xué)者從定性轉(zhuǎn)向定量研究,引入數(shù)據(jù)科學(xué)相關(guān)工具。大數(shù)據(jù)研究院青年副研究員周陽認(rèn)為,在數(shù)據(jù)爆炸的時(shí)代,用更高維的方式解讀復(fù)雜社會(huì)的系統(tǒng)、模式和行為變成了可能。
“如果我們能對每個(gè)人的個(gè)體觀點(diǎn)、消費(fèi)行為等進(jìn)行刻畫,那么就可以對整個(gè)社會(huì)進(jìn)行推演。”他說。
和出身于理工科的研究者不同,周陽的同行們在AI的專業(yè)技術(shù)方面相對陌生。他希望CFFF可以降低社會(huì)科學(xué)研究者使用AI的門檻,挖掘數(shù)據(jù)潛力、跨越學(xué)科邊界,將靈感變?yōu)楝F(xiàn)實(shí)。
“我們要讓原來不會(huì)用AI工具的人去用最好的AI工具,要讓原來不懂AI的人去懂AI?!苯鹆χ赋?,CFFF不應(yīng)僅僅作為一個(gè)創(chuàng)新工具存在,還要改變創(chuàng)新文化。在AI時(shí)代為科學(xué)理念的普及、科學(xué)應(yīng)用的拓展、科學(xué)倫理的探討發(fā)揮引領(lǐng)和導(dǎo)向作用,使更多群體、更多領(lǐng)域共享AI時(shí)代紅利,也是高校的職責(zé)所在。
下一步,CFFF平臺(tái)還將繼續(xù)擴(kuò)大算力規(guī)模,并有計(jì)劃地逐步開放算力給上海市的科研力量,共同推動(dòng)上海市的AIforScience建設(shè)。
科學(xué)智能,智算未來。未來已來,遠(yuǎn)方不遠(yuǎn)。
大學(xué)院校在線查
高考熱門一鍵查
有疑問就來發(fā)現(xiàn)